当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2个月前 (02-24)Deepseek最新资讯124

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

弘亚数控售后服务系统接入Deepseek

弘亚数控售后服务系统接入Deepseek

弘亚数控售后服务系统接入Deepseek每经AI快讯,有投资者在投资者互动平台提问:您好,建议弘亚数控及其子公司工业软件尽快接入DeepSeek,以提供公司工作、生产效率,谢谢。弘亚数控(002833...

deepseek怎么样?与豆包相比呢?

deepseek怎么样?与豆包相比呢?

我认为deepseek和豆包两个AI软件没有可比性,主要是定位不同,有各自的特点1️⃣比如deepseek偏推理性,能够把自主思考和推理的过程展示出来,你会发现其实自己有时候陷在自有思维里面 dee...

风险vs机遇!近百家公司抢搭“DeepSeek快车”

风险vs机遇!近百家公司抢搭“DeepSeek快车”

DeepSeek大热,风险与机遇并存。自蛇年新春开市以来,A股刮起两股风,一是“哪吒风”,二是“DeepSeek风”。A股市场上,一场围绕着以DeepSeek为中心的投资盛宴火热开启,几乎沾上Deep...

接入DeepSeek之后,企业什么样?

接入DeepSeek之后,企业什么样?

阅读提示随着DeepSeek等人工智能技术的不断成熟,传统企业和行业正站在转型升级的关键节点。这场由技术驱动的变革浪潮,在提升效率和优化成本的同时,也催生出新的商业模式和增长点,为经济发展注入新的动力...

利用DeepSeek做私域的4大引流秘籍+5个躺着赚钱的副业

利用DeepSeek做私域的4大引流秘籍+5个躺着赚钱的副业

最近一段时间,DeepSeek突然火了,说实话,咱们做互联网的人都知道这个是干嘛的,但大多数普通人根本就不知道DeepSeek这玩意究竟有什么用,更不知道如何运用这个神奇的工具去变现,去做私域。今天一...

有了DeepSeek加持,中国情趣娃娃干翻日本娃娃

有了DeepSeek加持,中国情趣娃娃干翻日本娃娃

没想到,DeepSeek走红之后,第一个搭上这股东风的产业竟然是充气娃娃。不过这次,不再靠充气和皮肤,而是靠AI了。最近,来自广东中山的成人玩偶制造公司金三玩美(WMdoll)一下子火了。去年12月,...