DeepSeek-R1满血版性能飙升四倍，成本大降，竟是因为……

301

近日，天翼云DeepSeek模型推理技术迎来重大升级！该技术不仅支撑DeepSeek-R1满血版模型实现性能的四倍提升，更将大规模部署模型的成本降至原来的25%以下，为AI应用落地铺就更为宽广的道路。

两大升级技术

● 量化技术赋能

针对模型的浮点计算进行深度优化，使用高效量化算法，大幅减少计算资源消耗，提升推理速度，同时保证性能不打折！

● 通信传输优化

优化通信算子编排与通信方式，显著提升MoE模型推理中的通信效率，助力DeepSeek-R1模型的整体处理能力再上新台阶！

升级亮点

● 天翼云提供的DeepSeek-R1满血昇腾版每实例性能提升至原版本207%，首字输出仍保持百毫秒级响应。

● 天翼云提供的DeepSeek-R1满血昇腾版每实例部署所需机器数减少一半，仅为两台。

此次升级DeepSeek-R1为行业的大规模AI应用提供了更完善的解决方案。DeepSeek-R1满血昇腾版整体部署成本降至原来25%以下意味着，企业可以在不增加太多预算的情况下，享受到更强大、更高效的AI服务，加速了AI技术的普及与应用。

目前“息壤”智算平台已支持部署DeepSeek版的产品：

科技创新的目标是解决实际应用，促进行业进步。天翼云始终坚持务实创新的理念，将技术升级与市场需求紧密结合，推动AI技术从理论走向实践，从实验室走向生产线。未来，天翼云将继续探索更多前沿AI技术路径，为广大开发者和用户提供更优质、更具性价比的模型服务，推动AI应用普惠化，共筑数字中国的智慧未来。

扫码即刻体验

性能更高、成本更低的

DeepSeek-R1满血版模型

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者