当前位置:首页 > Deepseek最新资讯 > 正文内容

刚刚,DeepSeek发布更新

  DeepSeek更新日志显示,deepseek-chat和deepseek-reasoner都已经升级为DeepSeek-V3.1-Terminus。此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,主要包括以下方面:一是语言一致性,缓解了中英文混杂deepseek、偶发异常字符等情况;二是Agent能力,进一步优化了Code Agent与Search Agent的表现。

  今年年初,开源大模型DeepSeek曾掀起“开源潮”,引爆AI行业。作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能能够与国际头部模型比肩。

  9月17日,DeepSeek-R1推理模型研究论文登上最新一期的Nature封面,引起广泛关注。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者。该文章揭示了开源人工智能模型DeepSeek-R1所采用的大规模推理模型训练方法。开发团队称,该模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。

  在模型迭代方面,8月21日,DeepSeek宣布发布DeepSeek-V3.1。据介绍,DeepSeek-V3.1的升级包含以下主要变化。一是实现混合推理架构,一个模型同时支持思考模式与非思考模式;二是更高的思考效率;三是更强的Agent能力,新模型在工具使用与智能体任务中的表现有较大提升。

  其中,智能体支持能力方面,DeepSeek聚焦热门发展方向对编程智能体、搜索智能体展开测评,测试结果显示,DeepSeek-V3.1相较此前模型均有提升。在编程智能体方面,在代码修复测评SWE-bench(最具代表性的代码修复评测基准之一)等复杂任务测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。在搜索智能体方面,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试与多学科专家级难题测试上,DeepSeek-V3.1性能已大幅领先DeepSeek-R1-0528。

  同时,DeepSeek宣布,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。其中,UE8M0 FP8是针对即将发布的下一代国产芯片设计。当日,DeepSeek概念板块火热。不少国产芯片产业链企业股价大涨。

  华安证券研报称,DeepSeek V3.1发布后即带动国产算力产业链标的大幅上涨。未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。DeepSeek V3.1在AI Agent能力端显著提升,未来将继续推动AI Agent商业化场景应用。原文出处:刚刚,DeepSeek发布更新,感谢原作者,侵权必删!

标签: deepseek

“刚刚,DeepSeek发布更新” 的相关文章

国内外AI大厂重押,初创梭哈,谁能凭记忆成为下一个DeepSeek?

国内外AI大厂重押,初创梭哈,谁能凭记忆成为下一个DeepSeek?

  如果时间往前推半年或四五个月,业界对于这一问题可能都是疑惑、不解:彼时 DeepSeek 将大模型推理能力推至高潮引起的余波仍在蔓延,Manus 在全球范围内开启通用 AI Agent...

曾被DeepSeek冠名最不宜居的城市?

曾被DeepSeek冠名最不宜居的城市?

  谁知道西安中轴线在这一刻的含金量,纵穿南线古今同框更具象化了#西安 #摄影 #中轴线 #摄影 #城市风光 #世界一原文出处:曾被DeepSeek冠名最不宜居的城市?,感谢原作者,侵权必...

DeepSeek App重磅更新:首次支持对话内容生成分享图功能

DeepSeek App重磅更新:首次支持对话内容生成分享图功能

  8月14日,根据手机应用商店显示,DeepSeek App发布了1.3.0版本更新,支持对话内容生成分享图功能。   值得注意的是,近期有不少传闻称,新一代DeepS...

DeepSeek据悉计划年底前发布拥有更先进代理功能的人工智能模型

DeepSeek据悉计划年底前发布拥有更先进代理功能的人工智能模型

  据知情人士透露,DeepSeek正在开发具有更先进代理功能的人工智能AI模型,以与诸如OpenAI等美国同行在这个技术领域的一个新前沿展开竞争。   知情人士表示,这...

百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5

百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5

  百度王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架。   一方面通过混合强化学习,同时提...

盘后大利好!A股再创新高,Deepseek重磅发布,明天国产算力起飞

盘后大利好!A股再创新高,Deepseek重磅发布,明天国产算力起飞

  周二提示风险后,周三A股开盘大跳水,盘中深v沪指创新高,但我昨天也说过这不代表风险消除了,要继续多观察两天,看市场的抛售力量和承接力量。如果今天来一个放量阳线,那说明昨天低吸的没有那么...