当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek激活“芯”机遇

4周前 (02-17)Deepseek最新资讯45

本土AI生态小伙伴正在朝着DeepSeek“集结”时,海外AI芯片商也快速行动起来。位于美国加州的AI芯片厂商 Cerebras已经接入了DeepSeek-R1 大语言模型,其CEO 在接受采访时表示,公司已经被运行R1大模型的订单压垮。

  上海证券报记者统计,除了华为昇腾、沐曦、燧原科技、海光信息等十几家本土云端AI芯片厂商宣布适配或上架DeepSeek模型服务外,中星微、云天励飞等在端侧AI也积极接入DeepSeek模型。

  在多位业内人士看来,DeepSeek的真正意义是推动降低端侧AI应用成本,打开了端侧应用的想象空间,从而开启AI普惠时代。在此逻辑下,整个智能硬件产业在AI化中,进入新一轮成长周期,云侧和端侧AI芯片商将率先受益。

  记者注意到,或许是为抢抓AI产业机遇,本土GPU(图形处理器)公司陆续开启IPO辅导。最新案例是,2月7日,GPU公司格兰菲智能科技股份有限公司(简称“格兰菲”)提交了IPO辅导备案,这也是近7个月以来第5家本土GPU芯片公司进入IPO辅导阶段。

  云侧AI芯片商积极适配DeepSeek

  DeepSeek的朋友圈已经扩大到了海外芯片商。

  位于美国加州的AI 芯片厂商 Cerebras于2月10日对媒体表示,其已经运行了DeepSeek-R1 大语言模型。Cerebras曾推出用于AI的晶圆级芯片,单芯片峰值算力达到125 PFLOPS,搭配片外内存可以实现最高1.2PB的内存容量。

  国内AI生态圈小伙伴纷纷朝其聚拢,本土GPU公司更是纷纷响应部署。在云侧AI领域,已经有华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、燧原科技、昆仑芯、芯动力等十几家GPU芯片企业,相继宣布适配或上架DeepSeek大模型服务。

  以海光信息为例,公司于2月5日宣布,其技术团队成功完成DeepSeek V3和R1模型、DeepSeek-Janus-Pro多模态大模型与海光DCU(深度计算单元)的适配,并正式上线。公司表示,因DCU采用了GPGPU通用加速计算架构,DeepSeek模型可直接在DCU上运行,技术团队的主要工作是进行精度验证和持续的性能优化。本次适配优化的DeepSeek-Janus-Pro模型具备跨模态理解与生成能力,专注于结合视觉与语言理解能力,旨在处理更复杂的跨模态任务。

  对本土AI芯片企业来说,DeepSeek既是机遇,也是挑战,完成对其模型的适配,会推动企业算力和数据中心互联能力迈上一个新台阶。

  就机遇来说,在本土主流AI芯片公司基本完成对DeepSeek蒸馏版小模型的兼容支持后,此前可运行Llama、Qwen等常见模型的平台,便可直接无修改地运行DeepSeek蒸馏版小模型。这意味着,随着DeepSeek的应用爆发,芯片厂新一轮的市场竞争将拉开帷幕,部分公司有望脱颖而出。

  而在挑战方面,DeepSeek满血版的V3和R1拥有6710亿参数,对硬件要求大幅提升且需要额外的推理框架支持,需在推理的解码部分部署320个GPU,这种“超节点”式部署对本土芯片商是全新的挑战。

  一位知名AI创业者观察到,由于新的挑战,目前仅有约一半的本土芯片商成功上线运行了满血版。

  推理AI芯片商抢抓先机

  Cerebras的CEO 安德鲁·费尔德曼在接受采访时表示,公司已经被R1的订单压垮。其表示,DeepSeek对人工智能的影响不仅在当下,更在于将刺激出更大的AI系统。随着成本的降低,市场正在变得越来越大。

  多家机构也持类似观点。花旗分析师Laura Chen的团队表示,DeepSeek的出现,推动AI技术的低成本化和边缘化,使云端和边缘处理的混合AI模型被认为是AI未来的发展方向,将重塑半导体行业格局。银河证券也在研报中称,DeepSeek推动本土AI芯片适配,助力供应链升级,端侧小模型或将遍地开花,进一步带动国产算力的需求。

  云天励飞、中星微等本土AI芯片厂商也在端侧积极适配DeepSeek大模型。

  比如,2月8日,中星微技术宣布旗下星光智能系列AI芯片、解决方案全面融合DeepSeek大模型能力,通过“XPU芯片+大模型”的双引擎驱动,在行业应用、知识管理、边缘计算等领域实现技术突破。

  早在2月5日,云天励飞宣布,春节期间,云天励飞芯片团队完成DeepEdge10“算力积木”芯片平台与DeepSeek-R1系列大模型的适配,可以交付客户使用。DeepSeek V3/R1 671B MoE等大模型也在有序适配中。适配完成后,DeepEdge10芯片平台将在端、边、云全面支持DeepSeek全系列模型。

  云天励飞在接受记者采访时表示,AI计算分为训练和推理两个环节,根据应用场景可以分为云端和边缘。AI云端训练市场是被英伟达垄断,但是在边缘推理领域,比如用于机器人、无人机、无人车的芯片,在全球领域都还没有形成垄断的格局。边缘AI推理芯片是值得本土芯片厂商关注、大力追赶和抢占的方向。

  GPU公司陆续启动IPO

  本土GPU公司(包括高性能技术和图形图像)正在陆续开启IPO辅导。最新案例是,2月7日,格兰菲智能科技股份有限公司(简称“格兰菲”)提交了IPO辅导备案,这也是近7个月第5家进入IPO辅导的GPU公司。

  官网介绍,格兰菲成立于2020年,其致力于通过提供GPU和AMOLED显示驱动解决方案,帮助客户在计算机软硬件、自动驾驶、网络游戏、智能办公等领域解决各种潜在挑战,满足客户多样化需求。

  据记者统计,自2024年8月以来,还有燧原科技、壁仞科技、摩尔线程、沐曦等本土GPU芯片公司开启了IPO辅导,拟在A股上市。燧原科技等四家公司也均宣布,完成了对DeepSeek大模型的接入和适配。

  一位半导体业内人士表示,以DeepSeek为代表的AI大模型带动GPU市场快速增长,但GPU研发投入巨大,能率先获得二级市场支持的公司,将更有望抓住产业发展机遇。

  多家A股公司也在布局GPU相关领域。比如,青云科技、弘信电子等选择了牵手燧原科技,科华数据与天数智芯签署了战略合作协议,四川长虹、中贝通信、科大讯飞等则采用华为AI芯片昇腾910B。


“DeepSeek激活“芯”机遇” 的相关文章

什么是AI公务员?AI公务员能做哪些工作?

什么是AI公务员?AI公务员能做哪些工作?

AI公务员是指利用人工智能技术,在政府部门中执行特定任务的智能系统。这些系统能够模拟人类公务员的某些职能,提高工作效率和服务质量。以下是对AI公务员所能执行的工作的详细介绍:AI公务员的主要工作公文处...

财通基金完成DeepSeek大模型部署

财通基金完成DeepSeek大模型部署

财通基金宣布,公司近日完成了DeepSeek大模型本地化部署,探索DeepSeek与应用系统的深度融合。通过与“智搜”、“智办”等应用场景的融合,提升投研、营销、客户服务体验和管理效率。财通基金将根据...

50个DeepSeek高阶提示词,一键职场开挂!(附下载)

50个DeepSeek高阶提示词,一键职场开挂!(附下载)

“ 知识就是力量,科技就是生产力!”在快节奏的现代生活中,我们总是在寻找那些能够让我们事半功倍的秘密武器。今天,我要向大家强烈推荐一份宝藏资料——《DeepSeek50个高阶提示词.pdf》...

湘潭政务服务开启DeepSeek新节奏

湘潭政务服务开启DeepSeek新节奏

AI赋能数字湘潭建设湘潭政务服务开启DeepSeek新节奏(记者 陈颖 通讯员 葛亚芬 朱欣)3月10日,基于DeepSeek-R1满血版大模型建设的“湘潭政务推理大模型”正式上线,这是湘潭市探索以A...

新国都子公司上海拾贰区信息技术公司相关产品已接入DeepSeek大模型

新国都子公司上海拾贰区信息技术公司相关产品已接入DeepSeek大模型

新国都子公司上海拾贰区信息技术公司相关产品已接入DeepSeek大模型每经AI快讯,新国都2月25日在互动平台表示,DeepSeek为开源大模型,各家厂商均可根据自身需求对其进行模型的适配与本地化部署...

扬州海关政务终端接入DeepSeek

扬州海关政务终端接入DeepSeek

原标题:扬州海关政务终端接入DeepSeek科技日报讯 (尹红燕 单晓明 记者陈瑜)近日,扬州海关依托DeepSeek研发的大模型技术在政务服务领域取得突破,首批3台“扬关小智”智能政务终端正式投入运...