当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

3周前 (02-24)Deepseek最新资讯47

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

扬州海关政务终端接入DeepSeek

扬州海关政务终端接入DeepSeek

原标题:扬州海关政务终端接入DeepSeek科技日报讯 (尹红燕 单晓明 记者陈瑜)近日,扬州海关依托DeepSeek研发的大模型技术在政务服务领域取得突破,首批3台“扬关小智”智能政务终端正式投入运...

黄山AI旅行助手全面接入DeepSeek大模型

黄山AI旅行助手全面接入DeepSeek大模型

上证报中国证券网讯(记者 杨翔菲)记者2月21日从黄山旅游获悉,日前,公司旗下途马科技已将黄山AI旅行助手全面接入DeepSeek大模型。此举成为文旅产业与人工智能深度融合的里程碑,黄山景区将成为国内...

如何找到并启用微信内的DeepSeek功能(附排查方法)

如何找到并启用微信内的DeepSeek功能(附排查方法)

我的iOS微信和安卓微信都有接入DeepSeek的AI搜索功能,而且用了10多天,重度用户一枚。作为过来人,有必要给不知道的人分享下经验。 一句话总结,微信内的DeepSeek功能有多个登入口,...

​DeepSeek预测10年后可能会消失的12种职业

​DeepSeek预测10年后可能会消失的12种职业

DeepSeek预测10年后可能会消失的12种职业: 1. 超市收银员2. 银行柜员3. 电话客服4. 基础翻译(英语等通用语种)5. 基础会计(凭证录入岗)6. 数据录入员7. 高速公路收...

赋能千行百业!DeepSeek落地再提速

赋能千行百业!DeepSeek落地再提速

今年伊始,来自中国的AI大模型DeepSeek凭借好用、开源、免费三大特点火爆全球。AI大模型是指使用大规模数据和强大的计算能力训练出的人工智能模型,这些模型通常具有高度的准确性和泛化能力,可应用于自...

吉安:实现DeepSeek+政务服务三大场景创新应用

吉安:实现DeepSeek+政务服务三大场景创新应用

12345政务服务便民热线中心大江网/大江新闻客户端讯 记者周雪莉摄影报道:随着国产人工智能大模型DeepSeek的全球瞩目,各地加速推进“人工智能+政务服务”转型。近日,吉安市实现DeepSeek在...