当前位置:首页 > Deepseek应用场景 > 正文内容

比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

6个月前 (04-11)Deepseek应用场景348

近日,硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于 CloudMatrix 384超节点昇腾云服务和高性能推理框架 SiliconLLM,用大规模专家并行最佳实践正式上线 DeepSeek-R1。

该服务在保证单用户 20 TPS水平前提下,单卡 Decode吞吐突破 1920 Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1的模型精度与 DeepSeek官方保持一致。


其中,通过架构的全面创新,基于新型高速总线架构的 CloudMatrix超节点集群在总算力、互联带宽、内存带宽上领先业界。

此前,硅基流动在大模型云服务平台 SiliconCloud首发推出了基于昇腾云的稳定生产级 DeepSeek-V3 & R1 推理服务,并支持模型私有化集群部署,这次合作推动基于国产算力的 DeepSeek-R1推理服务持续升级。


DeepSeek风暴席卷全球,特别是以其高效、低成本的 MoE架构为应对大模型推理挑战打开了局面。不过,如果没有强大的 AI Infra 技术能力,要想部署好 DeepSeek并非易事。

DeepSeek使用了大规模专家并行(Expert Parallelism,大 EP并行)的 MoE模型架构,若采用单机部署方案,最终的性能远不如 DeepSeek官方公布的部署方案,且至少有数倍成本差距。更具挑战的是,虽然 DeepSeek公开了大 EP 并行方案,但技术难度较大,业内还没有其他团队快速复现这一部署方法。

针对这些难题,硅基流动与华为云联合攻关实现了技术突破。我们在 CloudMatrix 384超节点昇腾云服务上部署 DeepSeek-R1 时采纳了大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现高吞吐及更高性能,大幅提升了用户体验。同时,我们使用昇腾高性能算子库,以及硅基流动推理加速框架 SiliconLLM在模型、机制、算子上的协同优化,实现在国产算力上,不损失模型精度的情况下,获得 DeepSeek-R1 推理效率与资源利用率的显著提升。

硅基流动与华为云的合作不仅提供坚实的全国产软硬件体系部署方案,让 DeepSeek推理服务更经济高效,也展现了 AI 生态合作的强大能量。硅基流动将继续加深与华为云的联合创新,共同提升产品体验,加速模型在更多场景落地。


“比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1” 的相关文章

DeepSeek全球时刻,全球南方有望破“智能鸿沟”

DeepSeek全球时刻,全球南方有望破“智能鸿沟”

【导读】4月26日,全球南方系列十讲的第二讲“数字技术在全球南方的开源与共享”,在华东师范大学普陀校区举办。华东师范大学政治与国际关系学院教授余南平做主讲,并在圆桌环节与华东师范大学上海人工智能金融学...

DeepSeek说:为什么感觉时间越过越快?

DeepSeek说:为什么感觉时间越过越快?

关于时间感知随年龄增长而加快的现象,科学界提出了多个理论来解释这一普遍体验。以下是主要原因的解析:1. 记忆密度理论(新异刺激理论)◦ 核心机制:大脑通过存储新体验的数量来衡量时间长度。童年...

高考数学全卷重赛!新选手Gemini夺冠,豆包DeepSeek并列第二

高考数学全卷重赛!新选手Gemini夺冠,豆包DeepSeek并列第二

AI挑战全套高考数学题来了!话接上回。高考数学一结束,我们连夜使用六款大模型产品,按照一般用户截图提问的方式,挑战了 14 道最新高考客观题,不过有网友质疑测评过程不够严谨,所以这次我们加上解答题,重...

DeepSeek说:我们打赢关税战了吗?

DeepSeek说:我们打赢关税战了吗?

从2025年5月12日发布的中美联合声明内容来看,双方在关税等问题上取得了阶段性突破,但长期博弈态势仍未改变。结合相关信息分析如下:一、短期成果:关税大幅下调超出预期1. 关税对等削减双方同意将4月2...

中国AIGC应用全景图谱公布:DeepSeek、字节、腾讯、美图产品入选

中国AIGC应用全景图谱公布:DeepSeek、字节、腾讯、美图产品入选

4月16日,量子位智库发布2025中国AIGC应用全景图谱,呈现中国AIGC应用现状及趋势,图谱中既有字节、腾讯等头部大厂,也有DeepSeek这样的行业冠军。作为近两年的明星AI公司,美图公司旗下多...

美商务部禁止在政府设备上用DeepSeek?

美商务部禁止在政府设备上用DeepSeek?

本报记者 李 萌路透社17日报道称,根据该媒体及知情人士了解,美国商务部下属一些部门最近几周通知员工,禁止在政府设备上使用中国的人工智能(AI)模型DeepSeek。路透社称,美商务部在发给工作人员的...