当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

1周前 (03-25)Deepseek最新资讯73

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

电科数字:目前在持续跟进几十个关于DeepSeek的项目机会

电科数字:目前在持续跟进几十个关于DeepSeek的项目机会

电科数字近日在电话会议上表示,目前公司在持续跟进几十个关于DeepSeek的项目机会,根据客户类型可分为三类:一是技术交流客户,正在与公司进行相关技术沟通与探讨;二是正在部署的客户,需要公司在国产化适...

浦东头部企业纷纷接入DeepSeek大模型!“人工智能+”在千行百业加快应用

浦东头部企业纷纷接入DeepSeek大模型!“人工智能+”在千行百业加快应用

“deepseek的出现,标志着ai进入‘效率革命’的阶段,开辟了在垂直领域深度赋能的新战场,推动行业竞争焦点从‘参数竞赛’转向‘成本控制与场景适配’。”深耕人工智能领域多年的极豆科技ceo汪奕菲在本...

托普云农(301556)已接入deepseek

托普云农(301556)已接入deepseek

 同花顺(300033)金融研究中心03月24日讯,有投资者向托普云农(301556)提问, 请问公司是否接入deepseek?  公司回答表示,您好!我司已接入。此次接入对公司业绩无直接影响,截止目...

艾美疫苗全面接入DeepSeek大模型

艾美疫苗全面接入DeepSeek大模型

2月23日晚,港股公司艾美疫苗(06660.HK)发布自愿公告,全面部署接入DeepSeek大模型,通过本地化策略,推动DeepSeek-R1版本在集团全业务场景应用,实现疫苗全生命周期的“降本、提质...

记者观察|DeepSeek和DeepFake:一字之差折射出什么?

记者观察|DeepSeek和DeepFake:一字之差折射出什么?

“以前识别假新闻看三要素:错别字、夸张标题、模糊图片。现在?连亲妈发来的生日祝福视频都可能是AI(人工智能)造的!”网络安全博主“代码侠”在直播间举起两瓶矿泉水,左边贴着“DeepSeek出品”标签,...

大连银行牵手DeepSeek开启金融智能化转型新篇章

大连银行牵手DeepSeek开启金融智能化转型新篇章

在数字化时代的浪潮下,DeepSeek大模型的迅速崛起正深刻改变着各个行业的发展格局,在银行业更是掀起了一场技术变革。日前,大连银行凭借多年来在人工智能领域的精耕细作和对大模型技术的沉淀积聚,依托开源...