当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?

4个月前 (05-29)DeepSeek技术交流361
DeepSeek低调升级,引发科技圈热议。
5月28日,DeepSeek 在官方微信群发布消息称,DeepSeek R1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API 接口和使用方式保持不变。
不过,澎湃新闻记者查询官方网站等,发现没有对此次更新的详细信息。记者咨询了一位DeepSeek内部人士,对方回复称是“小升级”。
根据Hugging Face,DeepSeek-R1此次开源版本为0528。
从宣传来看,此次升级十分低调,不过,根据网友测评,此次升级可不是简单的“小升级”。
有科技媒体分析称,时隔4个月,DeepSeek-R1完成了超进化,编码能力强到离谱,而且思考时间更长了。据称,新模型基于DeepSeek-V3-0324训练(参数为660B)。在LiveCodeBench基准上,DeepSeek-R1-0528性能几乎与o3-mini(High)和o4-mini(Medium)实力相当,一举超越了Gemini 2.5 Flash。
科技类网站“AIGC开放社区”的评论称,在著名代码测试平台Live CodeBench中显示,其性能可以媲美OpenAI最新的o3模型高版本。也有网友对新版R1的风格进行了测试,几乎和OpenAI的o3差不多。
从社交媒体的反馈来看,网友最为关注的是此次DeepSeek R1更新后的思考时间变长。据测评显示,此次DeepSeek单任务处理时长可达30-60分钟。
此外,有网友通过实验对比了Claude-4-Sonnet与DeepSeek-R1-0528的实际表现。可以看到,DeepSeek-R1生成的代码在模拟物理碰撞方面表现更好。
值得注意的是,此前有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。
有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
不过,当时有内部人士向记者坦言,该传言真实度不高。从目前的情况分析,DeepSeek或许将用此次R1版本的升级,取代R2版本的推出。
尽管网友评测得出的结论十分惊喜,但是也有业内人士向记者表示,建议理性客观看待,也期待更为权威的测评结果。
在DeepSeek R1发布更新后,远在大洋彼岸的AI巨头英伟达(Nasdaq:NVDA)发布截至4月27日的2026财年第一财季财报,期内实现营收440.62亿美元,同比上涨69%,高于市场预期的432.8亿美元;美国通用会计准则(GAAP)下净利润187.75亿美元,同比上涨26%。在财报电话会上,英伟达CEO黄仁勋再次谈到DeepSeek所引发的市场对于推理模型的关注,以及推理模型会需要更大的算力支持,这将驱动推理算力需求。
澎湃新闻记者 范佳来


“DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?” 的相关文章

多家能源企业接入DeepSeek,能源行业迎来数智化跃迁

多家能源企业接入DeepSeek,能源行业迎来数智化跃迁

近期,多家能源公司纷纷接入DeepSeek大模型。2月15日,中国华能集团有限公司完成了DeepSeek系列模型的本地化部署,推出了“睿智小能”AI助手,与“iHN+”移动门户实现集成,为日常办公与管...

直击股东大会|麒麟信安:2025年国防业务发展有所加快,希望利用DeepSeek一体机打开市场

直击股东大会|麒麟信安:2025年国防业务发展有所加快,希望利用DeepSeek一体机打开市场

5月21日下午,麒麟信安召开2024年年度股东大会,包括公司总经理、董秘等在内的高管参加并与投资者现场交流。据悉,麒麟信安2024年实现企稳回升,全年实现营业收入2.86亿元,同比增长75.24%;归...

拎包入住、免费过渡!在嘉定找到DeepSeek不会说的隐藏福利

拎包入住、免费过渡!在嘉定找到DeepSeek不会说的隐藏福利

怀揣着梦想初来嘉定,却在住宿问题前犯了难?不怕,“ai界的六边形战士”——deepseek来帮忙!q江湖救急!来嘉定工作,住宿方面想要经济节约又住得舒适的,可以怎么选?deepseek:目前,上海市嘉...

DeepSeek是免费的吗?揭秘DeepSeek的使用方式与价值!

DeepSeek是免费的吗?揭秘DeepSeek的使用方式与价值!

标题:DeepSeek是免费的吗?揭秘DeepSeek的使用方式与价值!关键词:DeepSeek,免费,搜索工具,使用方式,功能,免费版,付费版描述:DeepSeek,作为一款全新推出的搜索工具,一直...

山石网科发布DeepSeek大模型应用一体机解决方案

山石网科发布DeepSeek大模型应用一体机解决方案

每经快讯,据山石网科微信公众号3月3日消息,近日,山石网科发布DeepSeek大模型应用一体机解决方案,致力于为用户提供一站式“算力+大模型+安全应用”服务能力。山石网科股票山石网科发布deepsee...

红塔证券:红塔证券已经成功上线DeepSeek-R1大模型

红塔证券:红塔证券已经成功上线DeepSeek-R1大模型

每经AI快讯,有投资者在投资者互动平台提问:长城证券002939智源AI中心已上线了大模型DeepSeek-R1与阿里Qwen2.5,公司员工可通过系统中的AI工具中心进行使用体验。请问贵公司未来也考...