当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

1周前 (03-25)DeepSeek技术交流76

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

DeepSeek能干啥 探索全能数据分析平台的潜力

DeepSeek能干啥 探索全能数据分析平台的潜力

标题:DeepSeek能干啥?探索全能数据分析平台的潜力关键词:DeepSeek,数据分析,智能工具,大数据,企业决策,AI分析描述:DeepSeek作为一款先进的数据分析工具,凭借其强大的数据处理能...

多地组织干部学用DeepSeek!专家称人员要调整观念

多地组织干部学用DeepSeek!专家称人员要调整观念

在各地政务系统密集宣布接入DeepSeek的同时,苏州、郑州、来宾、延安等地也掀起了一阵组织领导干部学用人工智能辅助决策、拥抱新技术的热潮。2月18日,清华大学新闻学院、人工智能学院双聘教授沈阳在接受...

四川长虹:长虹AI TV已正式接入DeepSeek

四川长虹:长虹AI TV已正式接入DeepSeek

金融界3月27日消息,有投资者在互动平台向四川长虹提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的...

当红炸子鸡DeepSeek,为何花心思自研存储?

当红炸子鸡DeepSeek,为何花心思自研存储?

国产大模型DeepSeek横空出世,新的技术突破正快速转化为行业价值。近日,宇视科技正式推出DeepSeek一体机系列,以“开箱即用、私有化部署、应用赋能”等特性,无缝衔接用户需求,让智能应用真正“用...

DeepSeek有望助力全球南方国家跨越数字鸿沟

DeepSeek有望助力全球南方国家跨越数字鸿沟

“我认为DeepSeek有潜力帮助全球南方国家缩小数字鸿沟并加速现代化。”日前在南非举行的数字化转型峰会上,南非人工智能企业Matogen首席执行官雅各布斯·艾蒂安说。随着全球数字化进程加速,人工智能...

从炸圈到质疑,一夜之间Manus经历了什么?

从炸圈到质疑,一夜之间Manus经历了什么?

文 | 明晰野望从开年凭一举之力打破英伟达上涨神话的DeepSeek,到近期阿里、腾讯等大模型加速进化开源,2025是中国科技大年,也是信心修复之年。无论是资本市场还是普罗大众,人们都期待更多王炸出现...