当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek-V3模型悄然更新,编程数学能力更强了

6个月前 (03-25)DeepSeek技术交流430

交汇点讯 3月24日晚间,deepseek 悄然发布一款新的大语言模型——deepseek-v3-0324。这款 641gb 大小的模型在开源平台hugging face上亮相,几乎未作任何宣传。



本次更新为deepseek v3模型的版本小幅更新,并非市场此前一直期待的deepseek-v4或r2。deepseek 在其官方交流群宣布称,“deepseek-v3 模型已完成小版本升级,欢迎前往官方网页、app、小程序试用体验(关闭深度思考),api 接口和使用方式保持不变。”

deepseek-v3和deepseek-r1都是幻方量化旗下ai公司深度求索(deepseek)推出的两款高性能大语言模型,分别在2024年12月26日和2025年1月20日发布。尽管两款模型均基于混合专家(moe)架构,但在设计目标、训练方法、应用场景和性能表现上存在差异。

其中,deepseek-v3为通用型模型,专注于自然语言处理、知识问答、内容创作等通用任务,目标是实现高性能与低成本的平衡,适用于智能客服、个性化推荐系统等场景。deepseek-r1为推理专用模型,专为数学、代码生成和复杂逻辑推理任务设计,通过大规模强化学习提升推理能力,对标open ai o1系列。

此次发布值得关注的是,该模型采用mit许可(允许模型蒸馏、商用),并且有报道称它可以直接在消费者级“硬件”上运行,尤其是配备m3 ultra芯片的苹果mac studio。

有海外测试者称,相比于前一版本,deepseek-v3-0324在各项指标上有了显著提升。人工智能xeophon在社交媒体上发帖宣称:“我在内部基准测试平台上测试了新版deepseek v3,在所有测试中,它在各项指标上都有巨大的跃升。它现在是最好的非推理模型,把claude sonnet 3.5拉下王座。”

claude sonnet 3.5由anthropic公司发布,是业内公认顶尖的商业人工智能系统之一。而且与需要订阅的sonnet模型不同,deepseek-v3-0324的权重文件供任何人免费下载使用。

还有国内博主测试发现,新版deepseek-v3在网站开发能力、ui设计方面展现出巨大的进步。测试者在输入“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”的提示词之后,新版deepseek-v3在2分钟的时间内交付了一个总计400多行代码、设计精良的网站。

据其介绍,网站采用了粒子背景动画、赛博朋克ui(霓虹光效、悬浮动画和科技感配色)等设计元素,标题使用打字机动画,按钮具备光波扩散效果。甚至,这一网站还使用了响应式设计,能自动适配手机和桌面设备。

有用户按照下面的提示词,同时对新版 v3 与 r1 下达任务,实际产出的效果已经出现巨大差异——

创建一个包含 css 和 javascript 的单个 html 文件,以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件:

风:(例如,移动的云朵、摇曳的树木或风线);雨:(例如,落下的雨滴、形成的水坑);晴:(例如,闪耀的光线、明亮的背景);雪:(例如,落下的雪花、积雪)并排显示所有天气卡片。卡片应具有深色背景。在此单个文件中提供所有 html、css 和 javascript 代码。javascript 应包含一种在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气的动画。



左侧是 deepseek 新版 v3 模型的生成结果,右侧为 r1 的生成结果 deepseek 没有同时公开表示 r2 或者 v4 模型会在何时发布,但不少用户在体验过新版 v3 后,都觉得似乎 r2 的到来,也已经不远了。

有网友发现,deepseek-v3-0324模型的交流风格发生了明显变化。此前的模型因对话式、拟人化的语气备受好评,但这一版本呈现出更加正式、技术导向的风格。

有海外科技媒体评价,这种明显的风格变化似乎是deepseek工程师的有意设计。转向更精准、分析式的交流风格,表明该公司正将模型重新定位至专业和技术应用,而非休闲对话。

新华日报·交汇点记者 杨易臻 综合整理自网络


“DeepSeek-V3模型悄然更新,编程数学能力更强了” 的相关文章

马儿主动到派出所“求助”,武汉民警用DeepSeek助力其“回家”

马儿主动到派出所“求助”,武汉民警用DeepSeek助力其“回家”

明亮的路灯下,在武汉市公安局轨道交通管理分局汉新派出所门口,突然出现4匹高头大马在溜达撒欢。2月27日晚上9时许,汉新派出所的民警辅警发现后,使用Deepseek搜索出几条附近马场的信息,很快联系上马...

桦川:“调解+DeepSeek”开启基层社会治理智慧新篇

桦川:“调解+DeepSeek”开启基层社会治理智慧新篇

在基层社会治理的大棋盘上,矛盾纠纷调解是至关重要的一子。近日,桦川县综治中心创新举措,将矛盾纠纷调解工作与DeepSeek功能深度融合,成功化解多起矛盾纠纷,为基层治理难题提供了智慧解决方案,开启了基...

外媒:从DeepSeek到《哪吒2》 中国不断突破科技创新与艺术创造极限

外媒:从DeepSeek到《哪吒2》 中国不断突破科技创新与艺术创造极限

国际在线专稿:美国《欧亚评论》网站近日刊发学者伊姆兰·哈立德署名文章《从电影票房到人工智能:中国重新定义全球叙事》。文章聚焦近期火爆出圈的两大“中国智造”——国产AI大模型DeepSeek和国产动画影...

中旅国际与华为云合作接入DeepSeek满血版

中旅国际与华为云合作接入DeepSeek满血版

2月25日消息,中旅国际与华为云合作接入DeepSeek满血版大模型,打造面向文旅行业的领域大模型,推动文旅智能场景创新。据悉,华为昇腾AI云服务将在其中提供AI算力支持,将DeepSeek部署至客户...

巨大人才缺口!DeepSeek带火AI岗,“六小龙”全球高薪招贤

巨大人才缺口!DeepSeek带火AI岗,“六小龙”全球高薪招贤

(央视财经《经济半小时》)2025年春节,中国人工智能大模型DeepSeek在全球引发轰动。DeepSeek的崛起也让相关领域的人才在这个春招季炙手可热。春招首周,人工智能工程师的求职增速位居职业榜首...

DeepSeek,山东国企的强项是“应用”

DeepSeek,山东国企的强项是“应用”

自从国产大模型DeepSeek(深度求索)火了之后,包括山东在内的全国各地在反思,“为什么我们这里没有出现像杭州那样的六小龙”。各地自我反省,深挖制约创新的思想、机制、人才、营商环境等不足,形成一种自...