海光信息技术团队近日成功完成DeepSeekV3和R1模型与海光DCU(深度计算单元)的国产化适配,并正式上线!用户现可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,或直接登录[www.sourcefind.cn]搜索“DeepSeek”,即可基于DCU平台快速部署和使用相关模型。DeepSeekV3和R1模型基于Transformer架构,采用了Multi-Head Latent Attention(MLA)和DeepSeek MoE两大核心技术。MLA通过减少KV缓存显著降低了内存占用,提升了推理效率;DeepSeekMoE则通过辅助损失实现了专家负载的智能平衡,进一步优化了模型性能。海光DCU技术团队表示,将持续推动大模型迭代适配与优化更新,携手更多优秀大模型企业为行业客户提供更高效、更经济、更安全的AI解决方案。同时,团队也将积极探索更多应用场景,推动AI技术在更多行业的落地与普及。DeepSeek给AI以及整个科技领域的冲击还远未结束,秉持开源思想,DeepSeek已经将其成功路径展现在世人面前。声明:以上部分内容来源光合组织等网络素材
参考:官宣:DeepSeek V3和R1模型完成海光DCU适配并正式上线,光合组织