- 1、本文档共65页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
目录
摘要I
AbstractIII
第一章概述1
1.1研究背景和意义1
1.2国内外研究现状2
1.2.1GPU共享2
1.2.2性能预测3
1.2.3集群调度4
1.3主要研究内容5
1.4论文结构6
第二章相关技术介绍7
2.1GPU共享7
2.2性能预测8
2.2.1深度学习计算图8
2.2.2图神经网络8
2.2.3多任务学习9
2.3集群调度10
2.3.1容器技术10
2.3.2Kubernetes11
2.4本章小结15
第三章面向集群调度的通用精准的深度学习模型性能预测器17
3.1整体框架17
3.2计算图解析器18
3.2.1图的定义18
3.2.2图的特征19
3.3单性能指标预测模型20
3.3.1SeerBlock21
3.3.2FMM聚合函数23
3.3.3虚拟节点23
3.4多性能指标预测模型24
3.5基准数据集构建24
3.5.1模型结构24
3.5.2性能指标收集26
3.6本章小结27
第四章调度系统实现29
4.1整体框架29
4.1.1核心组件29
4.1.2基本流程30
4.2集群协作器30
4.2.1节点监测30
4.2.2任务管理32
4.3调度器35
4.3.1任务选择策略35
4.3.2任务放置策略36
4.4本章小结36
第五章实验与评估39
5.1性能预测实验39
5.1.1实验设置39
5.1.2整体效果40
5.1.3消融实验41
5.1.4对比实验44
5.1.5多性能指标预测相关实验46
5.1.6其它实验47
5.2集群调度实验48
5.2.1实验设置48
5.2.2实验分析50
5.3本章小结52
第六章总结与展望53
参考文献55
致谢61
攻读学位期间发表的学术论著63
摘要
DeepLearningDL
近年来,深度学习(,)技术在机器翻译、图像识别、内容推荐、自
DL
动驾驶等领域取得了巨大的成功,然而,任务的训练和推理往往是耗时且资源密集的,
GraphicsProcessingUnitGPU
为了加速这些任务的执行,图形处理器(,)集群的构建至关
重要。传统的GPU集群调度算法通常以整个GPU为资源分配的最小单位,导致大量GPU
资源浪费。为了更有效地利用GPU资源、缩短任务的完
文档评论(0)