当前位置：首页 > Deepseek最新资讯 > 正文内容

基于华为昇腾训练性能不输英伟达！自家模型爆料：DeepSeek-R2本月要发布

2周前 (08-12)Deepseek最新资讯112

　　快科技8月12日消息，ChatGPT-5已经发布，那么国产大模型DeepSeek大版本更新也就不远了。

　　从网友向DeepSeek提出的问题看，该模型给出的答案是，DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。

　　在这样的背景下，国产算力链多家公司股价出现了大涨，比如寒武纪直接今天20cm涨停，股价创历史新高，市值突破3550亿元。

　　按照之前的说法，DeepSeek-R2大模型将会采用一种更先进的混合专家模型（MoE），其结合了更加智能的门控网络层（Gating Network）以优化高负载推理任务的性能。

　　有分析师预计，DeepSeek-R2的定价可能显著低于OpenAI同类产品，预示着其可能颠覆现有AI服务的定价模式。

　　此外，还有相关消息显示，DeepSeek-R2预计比GPT-4成本下降97%；并且是在昇腾卡上做的训练，主打一个全方位全产业链的自主可控。

　　据相关人士透露的情况，DeepSeek-R2的总参数量可能会达到1.2万亿，比DeepSeek-R1的6710亿参数增加大约一倍。

　　据华为实验室统计，这个性能相当于英伟达上一代A100训练集群的91%左右deepseek。至于这些是不是真实的，还有待观察，但看起来确实更强大、更自主了。原文出处：基于华为昇腾训练性能不输英伟达！自家模型爆料：DeepSeek-R2本月要发布，感谢原作者，侵权必删！

标签: deepseek

返回列表

　　盛夏酷暑，高温天气持续，当人们回到家中，迎接他们的往往是如同蒸笼般的闷热环境。传统制冷方式在应对现代家庭对舒适度日益增长的需求时，已显得力不从心。如何让夏天更舒适，成为了亟待解决的难题...

　　区块链周刊（Blockchain Weekly）是一家成立于2025年、总部位于香港的专业区块链与Web3媒体平台，具有国际期刊资质（ISSN 3104-5227），专注于行业深度研究...

　　你说的这个情况，近十年只有意大利输给阿根廷那次。意大利当时都啥样了，就同一年也输了德国 2-5，输了北马其顿和奥地利。世界杯都没进去。输阿根廷不正常吗？　　智利15...

　　8月11日，DeepSeek服务突遭全面宕机，API接口、网页平台以及App均无法访问或响应。许多网友也通过微博话题”DeepSeek崩了“反馈服务异常。根据DeepSeek在官网发布...

　　【文/观察者网柳白】半年多前，中国人工智能应用DeepSeek横空出世，在全球科技界掀起轩然大波。　　英国广播公司（BBC）8月10日发文写道，DeepSeek震...

　　智东西8月7日报道，昨天，小红书hi lab（人文智能实验室）开源了其首款多模态大模型dots.vlm1，这一模型基于DeepSeek V3打造，并配备了由小红书自研的12亿参数视觉编...

基于华为昇腾训练 性能不输英伟达！自家模型爆料：DeepSeek-R2本月要发布