暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
deepseek大模型生态报告(赛迪,200502).pdf
131
150页
5次
2025-03-10
5墨值下载
I
deepseek 大模型生态报告
赛迪研究院电子信息研究所
2025 2
I
一、DeepSeek 大模型背景 ....................... 1
(一)深度求索公司情况 ................... 1
(二)模型迭代历程 ....................... 2
(三)研发团队情况 ....................... 3
1. 北京大学罗福莉 ............................................ 4
2. 北京大学高华佐 ............................................ 4
3. 北京邮电大学曾旺丁 .................................... 5
4. 北京大学朱琪豪 ............................................ 5
5. 北京大学代达劢 ............................................ 6
6. 北京大学王炳宣 ............................................ 6
7. 浙江大学梁文锋 ............................................ 7
二、DeepSeek 大模型应用现状 ................... 8
(一)国内情况 ........................... 8
(二)全球情况 .......................... 10
三、DeepSeek 大模型技术特点 .................. 11
(一)技术创新 .......................... 11
1. 压缩:从结构到量化 .................................. 11
1)多层注意 MLA ........................... 12
2FP8 混合精度训练框架 ................ 13
2. 并行:对硬件的极限使用 .......................... 16
1DualPipe 节点通信 ..................... 16
2)无辅助损失的负载均衡策略 ......... 18
3)底层通信优 ................................. 20
3. 总结 .............................................................. 20
(二)训练成本 .......................... 21
四、DeepSeek 大模型产业生态 .................. 22
(一)企业 .............................. 22
of 150
5墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜