当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

6个月前 (03-19)Deepseek应用场景369

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

中国工程院院士张亚勤:无人驾驶将迎来“DeepSeek时刻”|院士上封面

中国工程院院士张亚勤:无人驾驶将迎来“DeepSeek时刻”|院士上封面

封面新闻记者 边雪过去数十年,从沟通、消费、娱乐到生产、交通、商业往来,无不深深烙刻上数字化的印记。在中国工程院院士,清华大学智能产业研究院(AIR)院长张亚勤眼中,数字世界正逐步与物理世界、生物世界...

DeepSeek赋能潮起

DeepSeek赋能潮起

新华社北京3月21日电 3月21日,《新华每日电讯》发表题为《DeepSeek赋能潮起》的报道。2025年开年,DeepSeek彻底突破技术圈层,直抵社会大众,成为热议高频词。刚刚结束的全国两会上,人...

接入DeepSeek后,到底能干些什么?

接入DeepSeek后,到底能干些什么?

近期,DeepSeek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序。记者从工业和信息化部了解到,三家基础电信企业已全面接入国产开源大模型DeepSeek。除了运营商的云平台...

DeepSeek,来我司裁员了

DeepSeek,来我司裁员了

AI接管人力资源部“谁家好公司开始用AI裁员了?”‍‍‍‍‍最近两个月里,AI的全民认知普及,跑出了中国速度。最焦虑的莫过于商界和职场,资本家迫切探求AI能多大程度降本增效,打工人暗自忧心饭碗不保。D...

天融信:公司已发布DeepSeek安全智算一体机

天融信:公司已发布DeepSeek安全智算一体机

新京报贝壳财经讯 3月1日,天融信在互动平台表示,公司已发布DeepSeek安全智算一体机,融合“计算、存储、网络、安全、智能”五大能力,为客户提供高性能、安全可靠的一体化智算中心建设方案。...

智能应对多种场景 DeepSeek助力四川环境应急

智能应对多种场景 DeepSeek助力四川环境应急

4月6日,记者从四川省生态环境厅获悉,近日新增一位环境应急“助手”——一款基于DeepSeek大模型与生态环境应急指挥平台深度融合的AI助手。目前,通过阶段性探索,该AI助手已初步形成智能问答、智能分...