网站大量收购独家精品文档,联系QQ:2885784924

2025大模型训练性能瓶颈定位流程案例.pdfVIP

2025大模型训练性能瓶颈定位流程案例.pdf

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

MindStudio

7.0.0

大模型训练性能瓶颈定位流程案例

文档版本01

发布日期2025-01-13

安全声明

产品生命周期政策

华为公司对产品生命周期的规定以“产品生命周期终止政策”为准,该政策的详细内容请参见如下网址:

/ecolumnsweb/zh/warranty-policy

漏洞处理流程

华为公司对产品漏洞管理的规定以“漏洞处理流程”为准,该流程的详细内容请参见如下网址:

/cn/psirt/vul-response-process

如企业客户须获取漏洞信息,请参见如下网址:

/enterprise/cn/security-advisory

华为初始证书权责说明

华为公司对随设备出厂的初始数字证书,发布了“华为设备初始数字证书权责说明”,该说明的详细内容请参

见如下网址:

/enterprise/zh/bulletins-service/ENEWS2000015766

华为企业业务最终用户许可协议(EULA)

本最终用户许可协议是最终用户(个人、公司或其他任何实体)与华为公司就华为软件的使用所缔结的协议。

最终用户对华为软件的使用受本协议约束,该协议的详细内容请参见如下网址:

/cn/about/eula

产品资料生命周期策略

华为公司针对随产品版本发布的售后客户资料(产品资料),发布了“产品资料生命周期策略”,该策略的详

细内容请参见如下网址:

/enterprise/zh/bulletins-website/ENEWS2000017760

文档版本01(2025-01-13)版权所有©华为技术有限公司ii

MindStudio

大模型训练性能瓶颈定位流程案例目录

目录

1常见性能问题场景1

2问题定位方法2

2.1性能问题定位流程2

2.2AscendPyTorchProiler采集性能数据3

2.3MindstudioInsight定位4

3性能调优案例9

3.1案例描述9

3.2MindStudioInsight分析定位9

3.3msttadvisor辅助定位11

文档版本01(2025-01-13)版权所有©华为技术有限公司iii

MindStudio

大模型训练性能瓶颈定位流程案例1常见性能问题场景

1常见性能问题场景

大模型从外部设备迁移到昇腾设备,并在昇腾设备上训练的过程中,可能会出现性能

问题。常见的两大性能问题场景是开箱性能优化场景和性能长跑劣化场景。

●开箱性能优化:主要是用户在昇腾平台使用模型时,发现性能差,直接进行性能

层面的优化。

●性能长跑劣化:一般是用户在训练过程中,由于不可预知的引入,导致模型出现

了一些性能劣化的问题,需要定位性能劣化的原因,并解决问题。

图1-1场景介绍

文档版本01(2025-01-13)版权所有

文档评论(0)

Seeker研报 + 关注
实名认证
文档贡献者

如果有被下架的,可以私我发你,欢迎垂询各种研究报告!也可以咨询定制获取特定主题报告,欢迎光临!

1亿VIP精品文档

相关文档