当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

3周前 (02-25)Deepseek最新资讯54

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

梅州市12345热线正式接入DeepSeek

梅州市12345热线正式接入DeepSeek

2月21日,梅州市正式将DeepSeek大模型应用于12345政务服务便民热线,以AI技术赋能民生诉求响应,此举标志着梅州政务服务向智慧化、数字化转型迈出关键一步。梅州市政务服务和数据管理局相关负责人...

青岛AI企业加速拥抱“DeepSeek新时代”

青岛AI企业加速拥抱“DeepSeek新时代”

步入2025年,DeepSeek带来全球AI(人工智能)产业新变数。青岛人工智能行业将如何把握机遇,乘势发展?2月18日下午,全市人工智能产业发展座谈会召开,与会企业给出了答案。目前,青岛人工智能产业...

华南理工大学上线满血版DeepSeek!面向省内院校开放

华南理工大学上线满血版DeepSeek!面向省内院校开放

好消息!新学期即将开始华南理工大学本地化部署的满血版DeepSeek-R1正式上线!为进一步培养师生AI思维和使用AI的能力华南理工大学基于学校“成务”科学计算平台成功完成满血版DeepSeek-R1...

科蓝软件:已成功将DeepSeek-R1模型整合至公司魔聚平台

科蓝软件:已成功将DeepSeek-R1模型整合至公司魔聚平台

人民财讯3月5日电,科蓝软件(300663)3月5日在互动平台表示,公司已成功将DeepSeek-R1模型整合至公司的人工智能应用平台——魔聚平台。具体来说,魔聚平台成功部署并全面投入使用了DeepS...

科德数控:已部署DeepSeek等AI大模型进行本地化验证

科德数控:已部署DeepSeek等AI大模型进行本地化验证

金融界3月11日消息,有投资者在互动平台向科德数控提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的...

Deepseek成赶作业“神器”?老师们有话说→

Deepseek成赶作业“神器”?老师们有话说→

寒假接近尾声不少中小学生正抓紧时间“赶作业”与往年不同的是曾经忙碌代写寒假作业的“枪手”们因为DeepSeek等AI的横空出世而开始感受到“失业”的压力许多孩子不再埋头“啃”作业而是熟练地给DeepS...