- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
行业深度研究/计算机
目录
1DeepSeek给予云厂商低门槛部署“杀手级”应用机会,市场需求有望迎来广阔机遇3
1.1创新技术架构:打破传统内存和算力瓶颈3
1.2DeepSeek突破硬件限制,算力“卖铲人”市场全面打开5
2云厂商是DeepSeek能力的“放大器”:充足的算力“弹药”与用户覆盖能力8
2.1海量算力的重新定价拉开算力平价时代序幕8
2.2云厂商平台优势明显,阈值上限再度打开10
2.3云服务厂商成为心向往之12
3重点公司梳理15
3.1金山云:知名独立云服务商15
3.2优刻得:国产方案+全线云产品积淀16
3.3顺网科技:国内边缘算力领军者16
3.4网宿科技:专注边缘计算+全球部署17
3.5深信服:混合云架构+全渠道战略18
3.6青云科技:混合云先行者+智算生态矩阵19
3.7三六零:专家协作模型云协同+AI安全护航20
3.8金山办公:云办公行业领先者发挥新质生产力作用21
3.9萤石网络:以云为重,终端+AI的两翼齐飞22
3.10软通动力:天璇AI平台获DeepSeek优化能力跃迁23
3.11科大讯飞:讯飞星火深耕AI教育领域24
4风险提示26
插图目录27
表格目录27
本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明2
行业深度研究/计算机
1DeepSeek给予云厂商低门槛部署“杀手级”应
用机会,市场需求有望迎来广阔机遇
1.1创新技术架构:打破传统内存和算力瓶颈
DeepSeek通过多方面创新实现在低算力的同时性能优异。DeepSeek模型
对算力要求相比以往大模型大幅降低,主要得益于其在架构设计、训练策略、算法
优化以及硬件适配等多方面的创新。
多头潜注意力(MLA)、深度求索混合专家系统(DeepSeekMoE)的创新架
构显著降低训练和推理时的内存占用和计算量。传统计算方式存在对KV矩阵重
复计算的问题,这不仅浪费了大量的计算资源,还会导致显存消耗过大,影响模型
的运行效率。而MLA技术巧妙地解决了这个难题,它通过独特的算法设计,减
少了对KV矩阵的重复计算,大大降低了显存的消耗。而MOE技术将模型分解
为多个专家模型和一个门控网络,门控网络根据输入数据的特点,智能地选择合适
的专家模型来处理,这样不仅减少了知识冗余,还提高了参数利用效率。在自然语
言处理的语言模型任务中,使用MOE结构的DeepSeek模型可以用相对较少
的参数,保持甚至提升语言生成的质量,同时显著降低训练和推理时的内存占用和
计算量,根据CSDN,DeepSeekMoE在保持性能水平的同时,实现了相较传统
MoE模型40%的计算开销降低。
图1:MLA及DeepSeekMOE基础架构
DeepSeek-V3论文,民生证券研究院
DeepSeek-R1在继承了V3的创新架构的基础上,在后训练阶段大规模使用
了强化学习技术,自动选择有价值的数据进行标注和训练,减少数据标注量和计算
本公司具备证券投资咨询业务资格,请务必阅读最后一页免责声明3
行业深度研究/计算机
文档评论(0)