当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

2周前 (02-26)Deepseek最新资讯59

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

旭光电子发布DeepSeek边缘一体机

旭光电子发布DeepSeek边缘一体机

旭光电子控股子公司西安睿控创合电子科技有限公司将DeepSeek大模型与边缘计算深度融合,推出睿智系列AI智算工控机,构建了从7B、14B、70B等不同容量参数模型运行环境,以创新性应用技术重塑工业智...

中原消费金融:用DeepSeek重塑消费金融智能化范式

中原消费金融:用DeepSeek重塑消费金融智能化范式

近日,国产大模型DeepSeek凭借卓越的性能表现,迅速赢得金融机构的青睐,成为金融行业数字化转型的重要推动力。金融机构纷纷接入DeepSeek,期望在实际业务中开拓新的增长点。与此同时,消费金融行业...

官宣!海信电视正式接入DeepSeek

官宣!海信电视正式接入DeepSeek

2月11日,海信电视宣布正式接入DeepSeek,并支持满血R1和V3版本自由切换,成为行业首个搭载深度思考智能体的电视品牌。目前,海信电视正在进行用户终端的升级发布,预计3-5天内,所有搭载智能体的...

大江时评:从DeepSeek到Manus,中国AI领域何以“黑马”频出

大江时评:从DeepSeek到Manus,中国AI领域何以“黑马”频出

江山代有才人出。3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus,引发网络热议和关注。据悉,Manus在GAIA基准测试中取得了SOTA(State-of-the-...

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek开源周,今日正式收官!内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。具体来说,包括以下两项内容:Fire-Flyer文件系统(简称3FS,第三个F代表File)...

15家银行集体押注,DeepSeek如何掀起金融AI革命?

15家银行集体押注,DeepSeek如何掀起金融AI革命?

银行业加速布局DeepSeek大模型,仍需解决技术幻觉问题。DeepSeek的开源模式和强大推理分析功能,为银行业的应用场景打开了想象空间。当传统银行遇上科技“新宠”DeepSeek,会碰撞出怎样的火...