当前位置:首页 > DeepSeek技术交流 > 正文内容

新版DeepSeek-V3官方报告出炉:超越GPT-4.5,仅靠改进后训练

4个月前 (03-26)DeepSeek技术交流295

明敏 发自 凹非寺

量子位 | 公众号 QbitAI

刚刚,DeepSeek官方发布DeepSeek-V3模型更新技术报告。

V3新版本在数学、代码类相关评测集成绩超过GPT-4.5!

而且这只是通过改进后训练方法实现。

DeepSeek-V3-0324和之前的DeepSeek-V3使用同样的base模型。

打破了之前传言该版本base模型是R2的传言。

新版本参数量约为660B,与此前网传的685B有所出入。

开源版本上下文长度为128K(网页端、App和API提供 64K 上下文)。

私有化部署时只需要更新checkpoint和tokenizer_config.json(tool calls相关变动)。

目前,想要体验这一版本模型,只需用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。

官方建议,此后非复杂推理任务使用V3新版本更好。

此外,官方还进一步展示了新版本在各个维度的能力。

前端开发

生成代码可用性更高,视觉效果也更好。

中文写作

相较于R1版有进一步优化,特别提升了中长篇的内容质量。

比如写一篇关于苏轼生平的散文:

中文搜索

联网情况下,V3新版本的搜索输出内容也更详实准确、排版更清晰美观。

现在写一份3000字的市场报告也是so easy(上下滑动查看完整内容):

此外,V3新版本在工具调用、角色扮演、问答闲聊等方面也进一步提升。

今天白天不少网友也上手实测了诸多能力,比如做个小游戏:

该版本模型采用宽松的MIT开源协议。

且可直接部署在M3 Ultra的Mac Studio上。

这意味着大模型开发应用的门槛更进一步降低。

话不多说,趁着深夜,还没睡的赶紧去体验最新版吧~


原标题:《新版DeepSeek-V3官方报告出炉:超越GPT-4.5,仅靠改进后训练》


“新版DeepSeek-V3官方报告出炉:超越GPT-4.5,仅靠改进后训练” 的相关文章

重庆钢铁召开DeepSeek应用启动会——以AI赋能智能化转型,开启高质量发展新篇章

重庆钢铁召开DeepSeek应用启动会——以AI赋能智能化转型,开启高质量发展新篇章

 贯彻落实宝武集团“2526”工程,推动“AI+钢铁”深度融合和突破应用。5月8日,重庆钢铁召开DeepSeek应用启动会,全面部署DeepSeek在钢铁生产与管理中的深度应用。该公司党委书记、董事长...

时光基AI×DeepSeek赋能!AI钉铛智造生产ERP破局中小工业管理痛点

时光基AI×DeepSeek赋能!AI钉铛智造生产ERP破局中小工业管理痛点

2025 年人工智能重构全球产业格局的关键节点,中国工业智能化进程迎来里程碑突破。1 月 2 日,红壹科技正式发布自主研发的 **「时光基 AI」工业大模型 **,该系统深度兼容 DeepSeek 基...

中国高校纷纷开设DeepSeek课程 迎接AI浪潮

中国高校纷纷开设DeepSeek课程 迎接AI浪潮

今年2月,中国多所高校纷纷开设基于本土AI初创企业DeepSeek的人工智能课程。DeepSeek在人工智能领域的突破性进展被誉为中国的“斯普特尼克时刻”,引发了广泛关注,同时也顺应了中国政府推动高校...

赵满意:DeepSeek浪潮下AI大模型赋能产业发展

赵满意:DeepSeek浪潮下AI大模型赋能产业发展

5月10日,由中国企业改革与发展研究会主办,中企研数字经济与数据资产工作委员会、企业观察报社承办的央企AI+大模型应用论坛在北京举办。论坛上,华为技术有限公司北京昇腾创新中心负责人赵满意以《DeepS...

鼎诚人寿AI消保课堂:DeepSeek带您防范非法中介活动

鼎诚人寿AI消保课堂:DeepSeek带您防范非法中介活动

近期DeepSeek掀起了全社会广泛的关注热潮,成为广大市民手中的“掌中宝”。正值“3·15”金融消费者权益保护教育宣传活动之际,为帮助消费者提升风险防范意识,DeepSeek准确捕捉了非法中介活动的...

武汉经开区上线DeepSeek版智算中心

武汉经开区上线DeepSeek版智算中心

湖北日报客户端讯( 通讯员郑奇悦、鲁仲月)国产开源大模型DeepSeek火速“出圈”,成为科技焦点。2月14日,记者从中国电子云武汉可信智算中心获悉,该中心已“牵手”DeepSeek,在武汉经开区算力...