- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
deepseek大模型生态报告
赛迪研究院电子信息研究所
2025年2月
I
目录
一、DeepSeek大模型背景1
(一)深度求索公司情况1
(二)模型迭代历程2
(三)研发团队情况3
1.北京大学罗福莉4
2.北京大学高华佐4
3.北京邮电大学曾旺丁5
4.北京大学朱琪豪5
5.北京大学代达劢6
6.北京大学王炳宣6
7.浙江大学梁文锋7
二、DeepSeek大模型应用现状8
(一)国内情况8
(二)全球情况10
三、DeepSeek大模型技术特点11
(一)技术创新11
1.压缩:从结构到量化11
(1)多层注意力MLA12
(2)FP8混合精度训练框架13
2.并行:对硬件的极限使用16
(1)DualPipe跨节点通信16
(2)无辅助损失的负载均衡策略18
(3)底层通信优化20
3.总结20
(二)训练成本21
四、DeepSeek大模型产业生态22
(一)企业22
I
1.DeepSeek系列新模型正式上线昇腾社区,华
为小艺已接入DeepSeek22
2.三大运营商全面接入DeepSeek23
3.多家公司宣布接入DeepSeek23
4.微软、英伟达、亚马逊全部接入DeepSeek!
25
5.燧原科技实现全国各地智算中心DeepSeek
的全量推理服务部署26
6.多家券商也积极“拥抱”DeepSeek26
(二)生态27
1.Deepseek应用27日登顶苹果中国地区和美
国地区应用商店免费APP下载排行榜27
2.DeepSeek在开源社区GitHub上的Star数首
次超越OpenAI28
3.国家超算互联网正式上线DeepSeek29
4.传DeepSeek正准备适配中国国产GPU...29
5.DeepSeek的风,火速吹遍了终端企业30
(三)应用32
1.文学32
2.编程32
(四)基础设施35
五、DeepSeek大模型产业影响35
(一)对人工智能技术的影响35
1.吴恩达谈DeepSeek:中国AI迎头赶上,扩
大算力并不是AI进步的唯一途径35
2.蒸馏技术将成为行业突破口36
(二)对产业生态的影响37
1.DeepSeek开源对于企业战略价值37
2.DeepSeek是否真的绕开了CUDA?39
3.DeepSeek会导致对智算中心的需求大幅减
少吗?39
II
(三)对国际竞争的影响46
文档评论(0)