当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

2个月前 (03-03)Deepseek最新资讯140

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

传音控股:传音控股旗下Infinix、TECNO品牌已接入DeepSeek

传音控股:传音控股旗下Infinix、TECNO品牌已接入DeepSeek

每经AI快讯,有投资者在投资者互动平台提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的考量?如果公...

宿州:DeepSeek引领AI应用浪潮 打造“智”变引擎

宿州:DeepSeek引领AI应用浪潮 打造“智”变引擎

在当今科技飞速发展的时代,AI技术已成为推动各行业变革的核心力量。其中,DeepSeek以其独特的技术优势,不仅推动了AI应用的爆发式增长,更为产业变革带来了深远影响。近年来,宿州市将数字化转型作为赢...

微信+DeepSeek“王炸组合”或催生AI应用井喷式发展

微信+DeepSeek“王炸组合”或催生AI应用井喷式发展

连日来,中国多家互联网大厂纷纷宣布将大热的国产开源大模型DeepSeek接入自家搜索功能,引发外界高度关注。微信已为搜索功能接入DeepSeek-R1模型,目前处于小范围灰度测试中,可供部分用户免费使...

企业微信+DeepSeek来了-企业微信接入DeepSeek

企业微信+DeepSeek来了-企业微信接入DeepSeek

【企业微信接入DeepSeek】《科创板日报》21日讯,今日,企业微信发布新版本,灰度接入满血版DeepSeek-R1大模型,正式发布"智能机器人"、"智能表格-客户跟进...

接入DeepSeek!汉阳政务服务开启“AI时代”

接入DeepSeek!汉阳政务服务开启“AI时代”

AI智能客服“知小音”24小时在线,数字人“汉小阳”实时解答。3月6日,武汉市汉阳区政务服务全面接入DeepSeek智能技术。线上,手机打开“汉阳云政务”微信小程序,身着一袭古装的AI智能客服“知小音...

快递物流行业迎来“DeepSeek时刻”,以AI重构“速度-成本”最优解

快递物流行业迎来“DeepSeek时刻”,以AI重构“速度-成本”最优解

曾几何时,AI领域信奉“大力出奇迹”,随着DeepSeek横空出世,以“四两拨千斤”的创新路径,仅以数百万美元的训练成本就实现了Chat-GPT4的同等性能,同时参数量也仅为对手的几十分之一。这就是D...