- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
MindStudio7.0.0
大模型训练性能瓶颈定位流程案例
大模型训练性能瓶颈定位流程案例 目录
目录
常见性能问题场景 1
问题定位方法 2
性能问题定位流程 2
AscendPyTorchProfiler采集性能数据 3
MindstudioInsight定位 4
性能调优案例 9
案例描述 9
MindStudioInsight分析定位 9
msttadvisor辅助定位 11
大模型训练性能瓶颈定位流程案例 1常见性能问题场景
1常见性能问题场景
大模型从外部设备迁移到昇腾设备,并在昇腾设备上训练的过程中,可能会出现性能问题。常见的两大性能问题场景是开箱性能优化场景和性能长跑劣化场景。
开箱性能优化:主要是用户在昇腾平台使用模型时,发现性能差,直接进行性能层面的优化。
性能长跑劣化:一般是用户在训练过程中,由于不可预知的引入,导致模型出现了一些性能劣化的问题,需要定位性能劣化的原因,并解决问题。
图1-1场景介绍
2问题定位方法
性能问题定位流程
AscendPyTorchProfiler采集性能数据MindstudioInsight定位
性能问题定位流程
大模型训练的基本性能调优流程如下:图2-1基本性能调优流
性能调优最重要的就是对症下药,先定界问题,再对问题进行针对性优化。
首先进行性能数据采集,可以使用AscendPyTorchProfiler提供的接口进行数据采集和解析;
接下来,使用MindStudioInsight可视化工具定界性能问题,定界结果通常分为计算、调度、通信三个方向的问题;
除此之外,用户还可以直接使用mstt中的Advisor工具辅助定位问题,Advisor工具通过内置的案例集,自动对性能数据进行分析,并输出性能调优建议;
最后,用户可以针对不同问题使用对应的调优手段进行调优,每次调优后重跑训练,采集性能数据,使用MindStudioInsight可视化工具查看调优手段是否产生效果。重复这个过程,直到解决性能问题。
AscendPyTorchProfiler采集性能数据
AscendPyTorchProfiler是大模型在AscendPyTorch框架下训练过程中提供的一套采集性能数据的API接口,能够采集到框架侧、CANN侧和device侧的原始性能数据,并完成解析。在训练脚本(如train_*.py文件)内插入torch_npu.profiler相关采集、解析的配置和参数,再启动训练,即可采集性能数据。
importtorchimporttorch_npu#Profiler采集、解析的前置配置参数experimental_config=torch_npu.profiler._ExperimentalConfig(export_type=torch_npu.profiler.ExportType.Text,profiler_level=torch_npu.profiler.ProfilerLevel.Level0,msprof_tx=False,aic_metrics=torch_npu.profiler.AiCMetrics.AiCoreNone,l2_cache=False,op_attr=False,data_simplification=False,record_op_args=False,gc_detect_threshold=None)#
importtorchimporttorch_npu
#Profiler采集、解析的前置配置参数
experimental_config=torch_npu.profiler._ExperimentalConfig(
export_type=torch_npu.profiler.ExportType.Text,profiler_level=torch_npu.profiler.ProfilerLevel.Level0,msprof_tx=False,aic_metrics=torch_npu.profiler.AiCMetrics.AiCoreNone,l2_cache=False,
op_attr=False,data_simplification=False,record_op_args=False,gc_detect_threshold=None
)
#大模型训练的次数
steps=7
withtorch_npu.profiler.profile(activities=[
torch_npu.profiler.ProfilerActivity.CPU,torch_n
您可能关注的文档
- 财务主管应如何转型才能聚信心,塑未来?全球财务主管基因调查报告.docx
- 广东电力市场2024年半年报告.docx
- 2025年江苏省乡村光伏应用观察报告.docx
- 威胁情报需求洞察报告.docx
- 驾乘低空经济新风,畅享新质出行体验.docx
- 供给紧约束下的美国经济新平衡—2024年度全球金融市场.docx
- 光照未来:光伏组件企业可持续披露观察与建议.docx
- 中国互联网保险发展报告.docx
- 重大改革渐次落地,金融监管持续优化——2024年度中国金融监管.docx
- 电信运营商无人机应用市场发展分析报告.docx
- DeepSeek培训课件入门宝典:第2册 开发实战篇 .pptx
- 全面认识全过程人民民主-2024春形势与政策课件.pptx
- 2024春形势与政策-全面认识全过程人民民主.pptx
- 2025年春季学期形势与政策第二讲-中国经济行稳致远讲稿.docx
- 2024春形势与政策-铸牢中华民族共同体意识课件.pdf
- 2024春形势与政策-走好新时代科技自立自强之路课件 (2).pptx
- 2024春形势与政策-走好新时代科技自立自强之路课件.pptx
- 形势与政策学习指导教学-整套课件.pdf
- 2023年春季形势与政策讲稿第三讲-开创高质量发展新局面.pdf
- DeepSeek培训课件-清华大学-DeepSeek模型本地部署与应用构建.pptx
最近下载
- 溢洪道水面线计算(分段求和法).xls VIP
- 在线网课学习课堂《科技英语交流(北京理大)》单元测试考核答案.docx
- 一年级活动五《小小衣物整理师》PPT课件.ppt
- Python编程配套课件-第二章Python基础知识-适合零基础、少儿编程,中小学编程学习者.pptx VIP
- 2023年哈尔滨师范大学计算机科学与技术专业《计算机组成原理》科目期末试卷A(有答案).docx VIP
- 20S515:钢筋混凝土及砖砌排水检查井.pdf VIP
- 2025年部编版一年级下册语文看图写话专项积累练习含答案 .pdf VIP
- 二年级数学下册北师大版全册教材分析解读精品课件ppt.pptx
- 第1章 环境艺术设计制图基础 .ppt
- 特瑞普利单抗注射液-临床用药解读.pptx
文档评论(0)