计算机行业华为系列深度之十八暨genai系列深度之四十九：算力新变局，训练范式、架构创新、工程优化-申万宏源-20250207.docxVIP

下载本文档

0
0
约3.16万字
约 48页
2025-02-11 发布于山西
举报
版权申诉

计算机行业华为系列深度之十八暨genai系列深度之四十九：算力新变局，训练范式、架构创新、工程优化-申万宏源-20250207.docx

1、本文档共48页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

计算机行业及产业

计算机

行业及产业

行业研究行业深度2025年02月07日算力新变局：训练范式、架构创新、工程优化

行业研究行业深度

2025年02月07日

看好——华为系列深度之十八暨GenAl系列深度之四十九

看好

相关研究

《Deepseek

《Deepseek全解，从算法到算力——计算机行业周20250204》

2025/02/04

《Al算力软件生态：难以突破吗?一华为系列深度之十五》2024/09/19

证券研究报告

●Al大模型训练范式正在转向多阶段，强化学习算力投入仍需提升。OpenAlo1后，黄仁勋提出三大ScalingLaw:预训练、后训练和推理阶段提升算力投入，都能够提升模型性能。DeepseekV3和R1模型爆火，后训练阶段的强化学习(ReinforcementLearning)以及推理阶段的长思考是核心特点，也再次佐证了后训练阶段、推理阶段的ScalingLaw。我们认为这两大ScalingLaw仍处于起步阶段，模型厂商将继续加码强化学习，算力投入仍有增量空间。

证券分析师

黄忠煌A0230519110001

huangzh@

洪依真A0230519060003

hongyz@李国盛A0230521080003ligs@

杨海晏A0230518070003

yanghy@林起贤A0230519060002linqx@刘洋A0230513050006

liuyang2@

研究支持

曹峥A0230123040004

caozheng@

联系人

曹峥

(8621

caozheng@

●模型架构创新，训推成本降低正在进行时。国内外厂商，均有多种创新。1)MoE混合专家模型：降低训练过程激活参数量以减少计算量，已几乎成为标配；2)注意力机制的改进：线性注意力机制、稀疏注意力机制，将计算复杂度从o(N^2)降低至o(N),MQA、GQA、MLA等降低了KV-Cache,优化推理成本，后续注意力机制仍将改进。

●Infra工程优化，模型性价比持续提升。模型架构的创新，给硬件通信和显存带来了压力，infra优化至关重要，Deepseek是工程优化的代表。根据清华大学博士的测算，DeepSeekV3模型在H800算力集群上的算力使用效率MFU约为36.1%~39%,相较半年前的DeepSeekV2提升了61%,为DeepSeek节省了近1200万元的成本。根据Semianalysis,DeepseekV3的价格(MMLUcost/1MTokens)较GPT-4下降了90倍以上，Al模型性价比持续提升。

●开源+蒸馏趋势下Al模型智能平权开启，杰文斯悖论可能生效。“算法优化—成本下降—渗透率提升一强化训推投入”闭环逻辑持续。算法和硬件架构优化带来的成本下降，会令模型厂商使用同等投入买到更多训练Flops,加速模型能力的更新以及应用加速渗透，从而带动推理算力需求的爆发。同时，deepseekV3、R1模型，以及1.5B至70B的蒸馏模型均为开源，可部署在端侧，帮助端侧Al渗透。

●宏观维度，海内外大厂加码资本开支趋势延续。海外大厂微软、Meta2024年资本支出增速保持在40%以上，谷歌FY25全年Capex为750亿美元，相比此前市场预期大幅上修。国内，以腾讯、阿里为代表的厂商24年前三季度加码Capex。字节2025年算力资本开支有望向Meta看齐，小米也即将入局大模型，算力军备竞赛仍在持续。

●本轮预期差在国产算力性能和生态突破。2024年国产AI芯片性能、生态均有突破，部分产品硬件算力指标接近英伟达H100。软件生态方面，海光DTK学习CUDA,有

“类CUDA”属性，华为昇腾采用全栈自有路线，工具链完备，适配程度高、算子丰富、社区活跃，有望成全球Al算力“第二极”。

●建议关注：浪潮信息、神州数码、紫光股份、海光信息、泰嘉股份、澜起科技、中芯国际、盛科通信-U、烽火通信，中兴通讯等。

●风险提示：技术路线不确定；技术研发迭代进展不及预期；供应链稳定风险；竞争加剧风险。

申万宏源研究微信服务号

请务必仔细阅读正文之后的各项信息披露与声明

行业深度

投资案件

结论和投资分析意见

训练范式、架构创新、工程优化三大因素共同推动模型成本下降。

开源+蒸馏趋势下Al模型智能平权开启，杰文斯悖论生效，算力总需求仍可能增加。“算法优化—成本

您可能关注的文档

文档评论（0）

4A方案 + 关注: 实名认证

服务提供商

擅长策划，|商业地产|住房地产|暖场活动|美陈|圈层活动|嘉年华|市集|生活节|文化节|团建拓展|客户答谢会

咨询作者（1399人已咨询）服务中

1亿VIP精品文档

更多 >

计算机行业华为系列深度之十八暨genai系列深度之四十九：算力新变局，训练范式、架构创新、工程优化-申万宏源-20250207.docxVIP