当前位置:首页 > Deepseek最新资讯 > 正文内容

刚刚,DeepSeek新模型开源!五大能力变化明显,附一手体验

1周前 (08-20)Deepseek最新资讯89

  智东西8月20日报道,昨日晚间,DeepSeek在官方群宣布:DeepSeek线上版本模型已升级至DeepSeek V3.1,上下文窗口从原有的64k扩展至128k,网页、App、小程序都可体验这一模型。

  此外,DeepSeek还将App、网页端的“深度思考(R1)”字样改为了“深度思考”,有网友猜测这是融合推理模型与非推理模型的征兆,但DeepSeek官方尚未发布任何关于这一改动的消息。

  这一模型现已上传至Hugging Face,不过目前仅开源了未经指令微调的Base版本(基础模型),其配置文件、脚本代码和模型权重均可供下载。与DeepSeek-V3-0324相比,模型参数量、张量类型没有明显变化。

  智东西第一时间在网页端对新模型的能力进行了体验,从初步体验结果来看,这一模型在编程(尤其是前端能力)、物理定律理解、创意写作、数学、回答语气等方面都出现不同程度的提升和变化。

  我们向DeepSeek-V3.1发送了如下消息:“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页。”

  与DeepSeek-V3-0324相比,DeepSeek-V3.1写出的代码长度增加,开发耗时更久,不过,其最终交付的结果在完成度、美观性上有了一定提升。

  可以看到,DeepSeek-V3.1打造的网页在布局上更为合理,重点清晰,对网站栏目也有更为丰富的规划,还配上了图片,虽然并未全部显示。

  与之相比,DeepSeek-V3-0324此前生成的网页更为简单,特效也没有DeepSeek-V3.1打造的网页丰富。

  我们让DeepSeek-V3.1复现了Chrome浏览器断网时的小恐龙游戏,2分钟左右模型完成了开发。

  从页面的画风、游戏规则上来看,这一小游戏与原版差别不大,但是小恐龙的外观并未准确还原。同时,游戏障碍的生成、跳跃的方式(无法“二段跳”)导致可玩性较差。

  小众历史问题能较好地考察模型在幻觉方面的表现——如果没有足够的信息,模型会不会直接胡编乱造?

  智东西曾向DeepSeek-V3-0324提出“布须曼人喝牛奶吗”的问题,这涉及非洲南部的一个少数民族。

  当被问及同样的问题时,DeepSeek-V3.1与上代模型有了明显区别,其回答内容的信息量进一步增加,提供了更多细节。在经过事实核查后,DeepSeek-V3.1新增的细节基本都有事实印证,并非胡编乱造。

  DeepSeek-V3.1在回答问题时,语气更为活泼、温暖,语言更通俗、口语化,先是肯定了用户的问题,然后再进行回答。回答中提供了更多的背景情境,让解释更丰满deepseek、更有故事性。

  DeepSeek-V3下结论时更加绝对和肯定,DeepSeek-V3.1则使用了更多条件性语句,更强调情况的复杂性和演变过程,避免了非黑即白的结论,也可以说成为了“端水大师”。

  DeepSeek-V3.1也认为马斯克更牛,但给Altman“找补”了不少。它并未遵循用户限定只输出一个名字的指令,而是给两位AI大佬都奉上了一番夸赞,将端水政策进行到底。

  在9.8-9.11这样的基础算术题上,DeepSeek-V3.1最终能给出正确答案,过程却有些曲折。它先是得出了一版正确答案,却又在最终回答时给错数字,反思后,才改回了正确版本。

  DeepSeek-V3.1上线后,也有不少网友第一时间用上了这一模型。AI博主Zephyr反映,新模型打造的小球跳动效果更加符合物理定律了,还有重力、摩擦、旋转速度、弹跳等可调整的参数。

  体验完模型能力后,一些网友已经迫不及待蹲守DeepSeek的Hugging Face主页,按照惯例,后续或许会有更多不同版本的DeepSeek-V3.1开源。原文出处:刚刚,DeepSeek新模型开源!五大能力变化明显,附一手体验,感谢原作者,侵权必删!

标签: deepseek

“刚刚,DeepSeek新模型开源!五大能力变化明显,附一手体验” 的相关文章

算力大事件!中国算力大会举行,DeepSeek新模型适配下一代国产芯片

算力大事件!中国算力大会举行,DeepSeek新模型适配下一代国产芯片

  我国在用算力中心标准机架达1085万架,智能算力规模达788 EFLOPS,干线400G端口数量大幅增加至14060个,存力总规模超过1680 EB,全国算力中心平均电能利用效率(PU...

广大特材:暂未考虑引入deepseek为公司控股股东

广大特材:暂未考虑引入deepseek为公司控股股东

  金融界8月6日消息,有投资者在互动平台向广大特材提问:董秘您好deepseek,贵司管理层多年没能将市值提上去,是否考虑引入deepseek为公司控股股东,让他借壳上市,我们全体股民非...

DeepSeek预测:南特vs巴黎圣日耳曼!姆巴佩接班人杜埃能否率队血洗法甲老牌

DeepSeek预测:南特vs巴黎圣日耳曼!姆巴佩接班人杜埃能否率队血洗法甲老牌

  北京时间8月18日凌晨2:45,2025赛季法甲揭幕战将在博茹瓦尔球场打响。南特作为法国足球历史上最成功的俱乐部之一(8次法甲冠军+3次法国杯),将在主场迎战卫冕冠军巴黎圣日耳曼。尽管...

DeepSeek面临算力天堑,AI竞赛中受制于显卡短缺与国产平台适配

DeepSeek面临算力天堑,AI竞赛中受制于显卡短缺与国产平台适配

  #互联网公司# 算力,简单来说就是AI模型的“动力源”。国外AI巨头背后有英伟达这样的强大支持者,其掌握的H100、B200等顶级显卡,几十万张卡同时运行,算力源源不断,如同“无限的自...

北大拿下2篇最佳论文,DeepSeek实习生立功,华人横扫这场AI顶会

北大拿下2篇最佳论文,DeepSeek实习生立功,华人横扫这场AI顶会

  智东西7月31日报道,昨天,第63届计算语言学协会年会(ACL 2025)在奥地利召开。作为自然语言处理领域最具学术影响力的会议之一,本届ACL吸引了超过8300多篇论文的投稿,中国大...

DeepSeek预测:莱切vsAC米兰!红黑军团客场血洗小辣椒?帕夫洛维奇领衔后

DeepSeek预测:莱切vsAC米兰!红黑军团客场血洗小辣椒?帕夫洛维奇领衔后

  北京时间8月30日凌晨2:45,意甲第2轮将上演一场颇具看点的对决——小辣椒莱切坐镇维亚德尔马雷球场迎战七届欧冠得主AC米兰。上赛季惊险保级的莱切首轮闷平热那亚,而阿莱格里的米兰则爆冷...