当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

2个月前 (02-26)DeepSeek技术交流135

一开始,我还以为 DeepSeek 会走传统路线,比如大厂常见的蒸馏技术,搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求,但缺点也很明显,就是小模型再怎么优化,和大模型比起来,性能还是会有损失 结果 DeepSeek 完全没按套路出牌,它不是去压缩模型,而是换了个角度,直接假设未来算力足够,然后想办法更高效地用好现有显卡架构。换句话说,不是缩小参数规模,而是在同等规模下优化计算方式,让计算更具性价比 这种思路比纯工程优化要“硬核”得多。一般来说,搞小模型是比较务实的工程方案,但 DeepGEMM 这种技术驱动的做法更有延展性。它不仅和小模型方法兼容,而且即使以后显卡更强、模型规模更大,这套技术依然能继续用,不会过时

“DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?” 的相关文章

辽宁12345正式接入DeepSeek

辽宁12345正式接入DeepSeek

近日,辽宁12345热线平台系统已正式接入DeepSeek,通过双引擎智能驱动架构,形成“前端智能交互—中台智能治理—后台智能分析”的闭环管理体系。据了解,辽宁12345热线平台系统在接入DeepSe...

海口市检察院举办“DeepSeek应用与创新”主题沙龙

海口市检察院举办“DeepSeek应用与创新”主题沙龙

为深入贯彻最高检“数字检察”战略部署,推动人工智能技术与检察工作深度融合,3月4日,海口市检察院举办2025年第一期“椰城检语·青年智享会”主题沙龙——DeepSeek应用与创新。市院机关各部门干警代...

财务人如何用DeepSeek摆脱加班?这6招让你躺赢!DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?

财务人如何用DeepSeek摆脱加班?这6招让你躺赢!DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?

DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?每次新技术浪潮涌来,总有人说财务会被取代。但工具再先进,还是要看在什么人手里。DeepSeek不会让财务这个职业消失,但一定会加剧两极分...

不联网也能用AI!武汉企业推出DeepSeek本地部署主机

不联网也能用AI!武汉企业推出DeepSeek本地部署主机

长江日报大武汉客户端2月20日讯(记者郝天娇)春节期间,我国国产开源大模型深度求索(DeepSeek)在全球范围“火出圈”。上周五,黄陂区企业武汉攀升鼎承科技有限公司(以下简称攀升科技)正式推出搭载本...

deepseek如何做海报?deepseek能设计海报吗?

deepseek如何做海报?deepseek能设计海报吗?

deepseek如何做海报?deepseek能设计海报吗?关于使用DeepSeek制作海报,以下是分步解决方案:一、明确功能边界DeepSeek是文本生成模型,无法直接输出海报图像或排版文件,但可通过...

英伟达宣布创造满血 DeepSeek 推理世界记录

英伟达宣布创造满血 DeepSeek 推理世界记录

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。据介...