当前位置:首页 > DeepSeek技术交流 > 正文内容

全国高校首个!东南大学继DeepSeek又上线QwQ-32B

2个月前 (03-09)DeepSeek技术交流159

本文转自【新华日报】;

近日

东大基于昇腾国产算力平台

正式接入阿里最新开源模型QwQ-32B

成为全国首个上线QwQ-32B服务的高校

国产算力基座+头部大模型双轨融合

将为教学科研注入更强的AI动能

QwQ-32B:DeepSeek-R1的超强平替

性能比肩顶级模型

QwQ-32B虽仅有32B参数,但通过大规模强化学习训练,在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)等任务中表现媲美671B参数的DeepSeek-R1,甚至部分指标实现超越。

上图展示了 QwQ-32B 与其他领先模型在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)中的性能对比,QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。

低成本、易部署

模型支持消费级显卡本地部署,大幅降低硬件门槛,适配昇腾平台的高效算力资源,助力师生在科研中快速实现AI推理需求。

智能体能力革新

集成工具调用与动态推理能力,模型可根据环境反馈调整策略,适用于复杂任务处理,如数据分析、实验模拟等科研场景。

来源:东南大学微信公众号


“全国高校首个!东南大学继DeepSeek又上线QwQ-32B” 的相关文章

国脉文化:目前公司部分产品已接入DeepSeek等多种主流开源大模型

国脉文化:目前公司部分产品已接入DeepSeek等多种主流开源大模型

每经AI快讯,有投资者在投资者互动平台提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的考量?如果公...

DeepSeek什么都好,但真的不建议这样用……

DeepSeek什么都好,但真的不建议这样用……

进入三月,DeepSeek的热度有增无减,从最初面市到现在一个多月,首批用户体验后的反馈期终于来了。我身边的朋友都用疯了!有用来算命的,家里祖孙三代算到再无可算,DeepSeek娃说命里缺金,家长也管...

DeepSeek大模型赋能“有诉必应马上办”

DeepSeek大模型赋能“有诉必应马上办”

本报讯(记者 张弘靓)记者从西宁市数据局(市政务服务监管局)获悉,为进一步贯彻习近平总书记考察青海时提出的“切实保障和改善民生,尽力而为、量力而行,多办顺民意、惠民生、暖民心的实事,扎实解决群众急难愁...

日媒:DeepSeek为何没在日本诞生

日媒:DeepSeek为何没在日本诞生

《日本经济新闻》网站3月31日文章,原题:日中人工智能专家谈论,Deep Seek为何没在日本诞生 中国初创企业DeepSeek推出的高性能、低成本的生成式人工智能(AI)模型,震惊了世界。在日本,人...

DeepSeek一夜爆红后会取代哪些职业?

DeepSeek一夜爆红后会取代哪些职业?

DeepSeek一夜爆红后会取代哪些职业?随着DeepSeek一夜爆红,人工智能正逐步渗透到生活工作的方方面面。最近,一张各职业被AI取代难易程度图在金融圈引起讨论,根据图解,AI率先取代的是高机械性...

免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP

免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP

借助新版DeepSeek-V3,任何人现在可以一次性创建任何应用或游戏了——而且是一边开发一边看效果的那种。在Hugging Face中,这个名为DeepSite的应用火了。有网友直呼,这不就是网页版...