当前位置：首页 > DeepSeek技术交流 > 正文内容

DeepSeek-V3升级：评测达75.9%正确率，代码生成提速40%

6个月前 (03-26)DeepSeek技术交流415

人工智能领域迎来重大突破，DeepSeek于2025年3月24日发布DeepSeek-V3模型。该模型在MMLU-pro测试中达到75.9%的正确率，在代码生成、长文本处理等多个领域展现出卓越性能。

技术创新引领突破

DeepSeek-V3通过MoE架构的深度优化，实现了代码生成响应延迟降低40%。模型创新性引入动态路由机制，使计算节点协作更加精密。在处理代码时，V3展现出独特的"上下文记忆"能力，能够自动适配不同技术栈，并针对GPU驱动兼容性问题提供回退方案。

智能对话全面升级

模型在对话能力方面实现重大突破，信息提取准确率达到92.3%，较前代提升37个百分点。通过"记忆锚点"技术，V3能够在多轮对话中保持语义连贯性。借助AMD Instinct MI300X GPU的深度优化，推理吞吐量较竞品提升30%，为实时风控、自动驾驶等场景提供有力支持。

开源普惠创新生态

DeepSeek-V3采用MIT开源协议，在保持6710亿总参数的同时，将实际参与推理的激活参数控制在37B左右。通过"激活参数动态调整"技术，模型部署成本降低45%。在百度智能云千帆平台上，V3上线24小时内调用量激增230%，其中80%来自首次尝试大模型的中小团队。该模型还突破性地实现了40000token的上下文处理能力，在Codeforces竞赛中获得51.6分的优异成绩。

本文源自：金融界