近日,国产芯片纷纷接入国产大模型DeepSeek,其中以飞腾的S5000C和D3000以及龙芯3C6000/D、3C5000和3A6000系列为代表,成功实现对DeepSeek全系列大模型的端到端支持,覆盖数据中心和终端场景,本地部署的推理效率与国外同类产品架构解决方案相当,性能卓越,成本优异。这一突破标志着国产芯片与AI大模型的协同适配取得实质性进展,为构建自主可控的人工智能技术生态奠定基础。
腾云S5000C和腾锐D3000
早在2024年,DeepSeek-V2.5 236B大模型便已在飞腾腾云S5000C平台成功实现稳定运行。基于飞腾腾云S5000C的设备搭配8块国产AI卡,其整体性能可达到国外平台性能的80%左右,已支撑行业用户在项目中使用。
春节期间,DeepSeek发布了最新的DeepSeek-V3和R1版本后,基于飞腾腾云S5000C的服务器可以与多款AI加速卡配合实现DeepSeek蒸馏版和全量版部署。在单机8卡服务器平台已进行蒸馏版DeepSeek-R1-Distill-Llama-70B版本测试,实测推理速度可达到22tokens/s,本地部署的推理效率与国外同类产品架构解决方案相当。完整版DeepSeek R1 671B模型采用分布式推理框架,基于四机32卡AI服务器集群运行可部署成功,为企业级私有化部署提供完善的软硬件解决方案。


龙芯3C6000和3A6000
龙芯中科方面,联合太初元碁等产业伙伴,仅用 2 小时即在太初 T100 加速卡上完成 DeepSeek-R1 系列模型的适配工作,快速上线包含 DeepSeek-R1-Distill-Qwen-7B 在内的多款大模型服务。
DeepSeek 成功部署于基于3A6000、统信UOS桌面操作系统的望龙电脑

龙芯 3C6000 D 双路服务器成功启动 DeepSeek

龙芯 3C5000 服务器 + OpenCloudOS Stream23 成功启动 DeepSeek

声明:以上来源飞腾、龙芯官微、仅供参考
参考:https://mp.weixin.qq.com/s/d-zvyB2EI0EaRa8TEs-kZw
https://mp.weixin.qq.com/s/RvTu9R9jGeuWhKYfU1q62g
最后,别忘了点“❤”小红星




