当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

2个月前 (02-26)Deepseek最新资讯163

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

中原消金:用DeepSeek解锁消费金融新机遇

中原消金:用DeepSeek解锁消费金融新机遇

近日,国产大模型深度求索(DeepSeek)凭借卓越的性能表现,迅速赢得了金融机构的青睐,在金融业内掀起了一股应用人工智能的新热潮。金融机构纷纷接入DeepSeek,期望在实际业务中开拓新的增长点。截...

四川长虹:长虹AI TV已正式接入DeepSeek

四川长虹:长虹AI TV已正式接入DeepSeek

金融界3月27日消息,有投资者在互动平台向四川长虹提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的...

4天赚了20万元!DeepSeek 掀起“淘金热”,有人已赚到第一桶金

4天赚了20万元!DeepSeek 掀起“淘金热”,有人已赚到第一桶金

春节以来,国产AI大模型DeepSeek以更创新的算法和架构,表现出更低成本、更优效能和更广泛的应用场景迅速火爆全球。它的强大也在不断凸显——不仅在于功能,更在于它让曾经遥不可及的AI技术,真正走进了...

DeepSeek横扫家电圈!暴走三万步,带你看尽AWE最火AI黑科技

DeepSeek横扫家电圈!暴走三万步,带你看尽AWE最火AI黑科技

智东西3月21日报道,昨天,一年一度的中国家电盛会——AWE中国家电及消费电子博览会正式在上海开幕,各路科技巨头纷纷亮出最新家电及消费科技产品,展会现场十分火爆,人头攒动。  从C...

接入DeepSeek后,到底能干些什么?

接入DeepSeek后,到底能干些什么?

近期,DeepSeek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序。记者从工业和信息化部了解到,三家基础电信企业已全面接入国产开源大模型DeepSeek。除了运营商的云平台...

DeepSeek激发信心,A股渐入佳境

DeepSeek激发信心,A股渐入佳境

本周A股进一步走强,上证综指全周累计上涨1.30%至3346.72点;深综指、创业板综指、科创50、北证50全周分别上涨1.86%、2.57%、0.36%、3.84%。DeepSeek的技术突破提振了...