当前位置:首页 > Deepseek最新资讯 > 正文内容

青云上线 DeepSeek-V3.1,128k 上下文+混合推理

3周前 (09-08)Deepseek最新资讯119

  青云科技旗下 AI 算力云服务——基石智算CoresHub正式上线 DeepSeek-V3.1 模型,以底层架构的颠覆性革新与 128k 超长上下文能力deepseek,为用户开启 AI 高效应用的全新篇章。

  > 混合推理架构:一个模型同时支持思考模式与非思考模式,相当于具备之前R1的思考能力。

  > Agent 能力更强:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

  > 编程能力增强:新模型在编程能力测试中较之前明显增强,同时支持 Anthropic API 格式,以便更轻松接入 Claude Code 框架。原文出处:青云上线 DeepSeek-V3.1,128k 上下文+混合推理,感谢原作者,侵权必删!

标签: deepseek

“青云上线 DeepSeek-V3.1,128k 上下文+混合推理” 的相关文章

我觉得塞斯科俱乐部还是会去争取 而且得买

我觉得塞斯科俱乐部还是会去争取 而且得买

  1.韦维尔作为红牛系出来的 在塞斯科流入市场后如果不作为 那就是失职 特别是如果纽卡买了新赛季能进12个球左右 韦维尔就是大失职 作为一个职场人 大家都知道里面的道理...

Deepseek推荐全国旅游百强区第13名:广西北海市海城区

Deepseek推荐全国旅游百强区第13名:广西北海市海城区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》deepseek,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价...

微软开源3大突破AI Agent模型,仅140亿参数超越DeepSeek-R1

微软开源3大突破AI Agent模型,仅140亿参数超越DeepSeek-R1

  等领先模型,通过延长推理链,就是让大模型思考时间更长大幅提升了性能。但这种方法在面对一些难题时存在局限性,因为容易在中间步骤出现细微错误,或者需要创造性地转变推理方向。在这种情况下,模...

14B打败671B!微软rStar2-Agent在数学推理上超过DeepSeek

14B打败671B!微软rStar2-Agent在数学推理上超过DeepSeek

  通常而言,延长思维链(CoT)就可以延长「思考时间」,从而显著提升性能,尤其是当使用大规模强化学习和可验证奖励 (RLVR) 进行优化时。   然而,对于容易出现细微...

DeepSeek暗示国产芯片有望大规模使用

DeepSeek暗示国产芯片有望大规模使用

  8月22日,A股算力板块再度成为“执牛耳者”。截至收盘,本轮行情的“股王”寒武纪以20%涨停报收,总市值来到惊人的5200亿人民币;晶圆龙头中芯国际A/H股分别上涨14.19%和10....

DeepSeek预测:阿森纳vs曼城!枪手主场血洗蓝月?哈兰德PK哲凯赖什引爆天

DeepSeek预测:阿森纳vs曼城!枪手主场血洗蓝月?哈兰德PK哲凯赖什引爆天

  北京时间9月21日23:30,英超第5轮将上演焦点对决——排名第二的阿森纳坐镇酋长球场迎战第八名曼城。本赛季枪手开局强势(3胜1负)deepseek,而蓝月亮状态起伏(2胜2负),这场...