当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型“Model 1”曝光,疑似“高效推理模型”

4周前 (01-21)Deepseek最新资讯48

  新浪科技讯 1月21日下午消息,DeepSeek于官方GitHub仓库更新了一系列FlashMLA代码,在这些更新中,一个名为“Model 1”的模型引起了广泛关注。

  据悉,目前这个还很神秘的Model1不仅出现在了代码与注释中,甚至还有与DeepSeek-V3.2并驾齐驱的文件。这也不禁引发广大网友猜测,认为Model 1很可能就是传闻中DeepSeek将于春节前后发布的新模型代号。

  最新消息显示,Model1是DeepSeek FlashMLA中支持的两个主要模型架构之一,另一个是DeepSeek-V3.2。这很可能是一个高效推理模型,相比V3.2内存占用更低,适合边缘设备或成本敏感场景。此外,它也可能是一个长序列专家deepseek,针对16K+序列优化,适合文档理解、代码分析等长上下文任务。(文猛)原文出处:DeepSeek新模型“Model 1”曝光,疑似“高效推理模型”,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek新模型“Model 1”曝光,疑似“高效推理模型”” 的相关文章

12月24日DeepSeek预测:雷霆vs马刺,西部巅峰对决,亚历山大能否带队复

12月24日DeepSeek预测:雷霆vs马刺,西部巅峰对决,亚历山大能否带队复

  圣诞大战前夕,西部榜首雷霆(26胜3负)将客场挑战老牌劲旅马刺(21胜7负),这场堪称西部决赛预演的较量因10天前马刺111-109险胜雷霆更添火药味。两支进攻效率联盟前六的球队相遇,...

知情人士:DeepSeek将于2月发布其最新旗舰AI模型

知情人士:DeepSeek将于2月发布其最新旗舰AI模型

  据两位直接知情人士透露,深度求索(DeepSeek)预计将在未来几周内推出新一代旗舰级人工智能模型,该模型主打强劲的代码生成能力。   两位知情人士表示,这款代号为V...

年终盘点DeepSeek点燃AI热,贵金属引领周期逆袭,商业航天奏响年末最强音.

年终盘点DeepSeek点燃AI热,贵金属引领周期逆袭,商业航天奏响年末最强音.

  ,2025年A股行情迎来年终“收官”,在4月上旬经历快速向下“挖坑”行情后,市场迎来一波长达半年多的单边震荡向上主升行情,沪指于10月28日一度站上4000点整数关。除去国内外AI大模...

超越DeepSeek!豆包夺原生AI APP月活第一

超越DeepSeek!豆包夺原生AI APP月活第一

  曾居首位的DeepSeek,8月用户规模虽仍处亿级,但因-4.0%的环比增速,排名下滑1位。   其他选手表现各异,腾讯元宝以22.4%的高环比增速,稳坐第三,月活规...

DeepSeek-R1面世一周年,大模型竞争持续升温

DeepSeek-R1面世一周年,大模型竞争持续升温

  DeepSeek-R1 面世到今天已经整整一年了,这一年里各种大模型真是卷的飞起[doge]原文出处:DeepSeek-R1面世一周年,大模型竞争持续升温,感谢原作者,侵权必删!...

DeepSeek-V3.2系列开源,性能直接对标Gemini-3.0-Pro

DeepSeek-V3.2系列开源,性能直接对标Gemini-3.0-Pro

  DeepSeek官微推文中写道,“DeepSeek-V3.2模型在Agent评测中达到了当前开源模型的最高水平”。   在指令跟随、数学证明、逻辑验证方面,DeepS...