- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
基于超算云的高性能计算服务化平台
湖南大学国家超级计算长沙中心
1、背景和挑战
2、高性能计算服务化关键技术
3、超算云服务平台及整体架构
提炼算法分解背景:高性能计算服务化是面向业务需求领域的全流程服务化
提炼
算法
分解
实际问题
1
数学模型
2
求解器
3
任务
调度
4
并行
计算
计算
结果
MPV混动车型
MPV
SUV
微卡电动车
微卡
背景:高性能计算服务化=高性能计算集群+云原生+函数计算
FAAS
SAAS
PAAS
IAAS
Functions
Application
Runtime
OperationSystem
VirtualizationContainer
高性能计算机/超算系统
基础数学函数库(高性能计算算子)
归并N体波尔兹曼磁快速傅里叶稀疏矩阵
比对方法流体力学变换向量乘
前后处理模块冲压成形仿真
前后处理模块
冲压成形仿真
体积成形仿真
结构力学分析仿真
热力学分析仿真
裂纹扩张仿真
工程优化工具箱
材料数据库
dockeropenstackSOUD
docker
openstack
SOUDSOFTWAME
背景
背景:大规模异构是超级计算发展的主流
2013.06
天河二号
每秒5.49亿亿
次
CPU+MIC
2016.06
神威·太湖之光
每秒12.5亿亿次
申威26010
片上主处理器(1个)
和协处理器(64个)
内存共享
2018.62020.62021
美国顶点日本富岳天河三号
每秒百亿亿次每秒20亿亿次Power+GPU
每秒百亿亿次
每秒20亿亿次
Power+GPU
ARM飞腾+迈创
ARM
A64FX处理器
48计算核心
4协处理核心
挑战:传统超算在操作使用上难以原生适应高效的计算服务化,
智能应用场景、AI计算特性为高性能计算服务化提出了更高要求
超算调度系统超算算法库
涉及数据的
涉及数据的
实际特征较少
模型和数据
自适应/并行难
缺乏适应超算
异构并行的机
器学习算法库
感知差
自适应低
算力浪费
需解决的问题1
Serverless:数据和应用感知的任务调度与资源分配
需解决的问题2
云原生:构建高效的分布式机器学习环境
需解决的问题3
函数计算:融合高性能计算与机器学习算子
高效能数据
并行处理与
智能分析系统
如何基于现有主流超算系统的系统结构
构建高性能计算云服务基础设施,解决HPCfor大数据与AI计算的难题
1、背景和挑战
2、高性能计算服务化关键技术
3、超算云服务平台及整体架构
Serverless
Serverless:数据和应用感知的任务调度与资源分配
Serverless≠FaaS
Serverless=FaaS+BaaS
BaaS=DC+DaaS
构建数据和应用感知的分布式
计算和数据处理环境
Serverless:数据和应用感知的任务调度与资源分配
Spark中的Shuffle过
Spark中的Shuffle过程均衡调度
自适应数据流中间分区方法
基于动态内存感知的任务调度算法
任务调度
数据偏斜
Spark中的SKRSP
环境感知
环境感知任务调度
计算框架最优本地性感知任
计算框架
务调度算法
其它任务调度
其它任务调度
优化总通信距离的Executor分配方法
略
Serverless:数据和应用感知的任务调度与资源分配
提出面向Hadoop架构的内部通信量优化的Shuffle过程任务放置策略
Splitn
Split:2
DataNode1
Split2t
Splitz
DataNode2
Split
Splita
DataNode3
HDFS
Data
Block
map-out
map-out
map-out
Intermediat
edata
Monitors
SamplingJob
物Dhsraol
Data
Block
Data
Dispatchin
gMatrix
Data
Block
Reservoir
和缝除新体
Task
Placement
Cost
Matrix
MapPhase
Reduce
Placeme
nt
Pa
ShufflePhase
ReducePhase
WorkingJob
提出抗数据偏斜的Spark中间数据分片机制
分片0
分片1
中间数据分布预测
①采样②分布预测
采样任务0
分
您可能关注的文档
最近下载
- 电容式液位传感器及测量原理.doc
- 译林版小学一年级英语上册全套教案.pdf VIP
- 2023-2024年广东省广州市海珠区六年级上册期末数学试卷及答案(人教版).pdf
- [GB5009标准]GB 5009.156-2016 食品安全国家标准 食品接触材料及制品迁移试验预处理方法通则.pdf
- JTG-T 3650-2020公路桥涵施工技术规范.doc
- 县统计局党支部工作总结.pptx VIP
- 县人大常委会办公室的资料搜集提纲.doc VIP
- 某大型家电集团微波电器事业部通用分权规范手册.xls VIP
- 超声引导下针刀治疗.pptx VIP
- 2024年湖南司法警官职业学院单招职业技能测试题库及答案解析.docx VIP
文档评论(0)