广和通成功在MediaTek MT8893上部署DeepSeek-R1-0528
近日,广和通在MediaTek MT8893平台上成功部署并运行了DeepSeek-R1-0528-Qwen3-8B模型,显著提升了端侧AI设备的处理效率与智能化水平,特别是在本地化复杂文本处理的智能会议场景中表现出色。本次部署采用动态控制思维链输出的创新方式,通过实现思维链思考过程与输出结果解耦的技术路径,在确保模型快速输出结果的同时,使模型仍能进行深度逻辑推理。
依托MT8893的4nm工艺与第七代APU能效优化,以及Qwen3-8B蒸馏模型的轻量化优势,本方案在提升推理能力的同时有效降低了功耗,使终端具备低能耗、低发热与长时间稳定运行的特性,提供了更加可靠与高效的使用体验。
联发科技的MT8893芯片是专为边缘AI计算设计的高性能平台,拥有八大核的CPU运算能力、高效的能耗控制以及对AI工作负载的专门优化,广泛适用于需要实时处理的端侧AI场景。MT8893集成48 TOPS的NPU,能够高效执行复杂的神经网络模型,为像DeepSeek-R1-0528-Qwen3-8B这样的大模型提供充足的算力支持。在广和通的优化下,MT8893平台确保DeepSeek-R1-0528-Qwen3-8B模型在智能会议机等设备上流畅运行,实现低延迟、高精度、低功耗的语音转写和内容摘要生成。
DeepSeek-R1-0528是深度求索(DeepSeek)在2025年5月28日发布的最新升级版本。该模型基于2024年12月发布的DeepSeek V3 Base模型,在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。其在数学、编程与通用逻辑等多个基准测评中取得了优异成绩,整体表现接近国际顶尖模型。在此基础上,DeepSeek 还基于 R1-0528 的思维链训练推出了DeepSeek-R1-0528-Qwen3-8B蒸馏模型。该模型以Qwen3-8B Base为底座,在AIME 2024 数学测试中的准确率相比原始Qwen3-8B 提升约 10%,整体表现接近Qwen3-235B,仅次于DeepSeek-R1-0528本体,非常适合端侧设备部署,为会议纪要生成、文本摘要和多语言交互等应用提供了兼顾高性能与高效率的解决方案。
搭载了DeepSeek-R1-0528-Qwen3-8B模型的广和通AI解决方案将为智能会议机带来全新的体验。DeepSeek-R1-0528模型强大的自然语言处理能力,能够实时、准确地进行语音精准识别和转写,并快速生成会议纪要摘要,大大提升了会议效率。结合广和通在AI语音解决方案方面的技术积累,其AI语音方案具备强抗噪性deepseek、离线理解力,助力会议机实现更自然的多语言语音交互,适用于跨国企业或多语种会议环境。虽然DeepSeek-R1-0528-Qwen3-8B关闭了中间思考过程的输出以提升响应速度,但模型保留了完整的思维链,确保了其在处理复杂逻辑和生成高质量文本时的深度和准确性。
本次广和通在MT8893平台成功部署DeepSeek-R1-0528-Qwen3-8B模型,并针对智能会议机等场景优化,体现了其软硬件一体化的全栈式解决方案能力。端侧AI正加速渗透千行百业。广和通持续携手AI合作伙伴,推动大模型在边缘侧的高效部署,让智能终端拥有思考能力。原文出处:广和通成功在MediaTek MT8893上部署DeepSeek-R1-0528-Qwen3-8B模型,全面提升终端推理能力,感谢原作者,侵权必删!