第三章并行计算性能评测分解.pptx

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
国家高性能计算中心(合肥) 1 2017-4-1 第三章 并行计算性能评测 3.1 并行机的一些基本性能指标 3.2 加速比性能定律 3.2.1 Amdahl定律 3.2.2 Gustafson定律 3.2.3 Sun和Ni定律 3.3 可扩放性评测标准 3.3.1 并行计算的可扩放性 3.3.2 等效率度量标准 3.3.3 等速度度量标准 3.3.4 平均延迟度量标准 国家高性能计算中心(合肥) 2 2017-4-1 CPU的某些基本性能指标 工作负载 执行时间 浮点运算数 指令数目 并行执行时间 T comput 为计算时间,T paro 为并行开销时间,T comm为相互通信时间 T n = T comput + T paro+ T comm 例:估计APRAM模型下执行时间 国家高性能计算中心(合肥) 3 2017-4-1 存储器性能 存储器的层次结构(C,L,B) 估计存储器的带宽 RISC add r1,r2,r3 r 8bytes 100MHz B = 3*8*100*106 B/s= 2.4GB/s 国家高性能计算中心(合肥) 4 2017-4-1 并行与通信开销 并行和通信开销:相对于计算很大。 PowerPC (每个周期 15ns 执行4flops; 创建一个进程1.4ms 可执行372000flops) 开销的测量:乒--乓方法(Ping-Pong Scheme)节点0发送m个字节给节点1;节点1从节点0接收m个字节后,立即将消息发回节点0。总的时间除以2,即可得到点到点通信时间,也就是执行单一发送或接收操作的时间。 可一般化为热土豆法(Hot-Potato),也称为救火队法(Fire-Brigade) 0——1 —— 2 —— … —— -n-1 —— 0 国家高性能计算中心(合肥) 5 2017-4-1 Ping-Pong Scheme if (my _node _id =0) then /*发送者*/ start _time =second( ) send an m-byte message to node 1 receive an m-byte message from node 1 end_time = second( ) total_time = end_time – start_time communication_time[i] = total_time/2 else if (my_node_id = 1) then /*接收者*/ receive an m-byte message from node 0 send an m-byte message to node 0 endif 国家高性能计算中心(合肥) 6 2017-4-1 并行开销的表达式:点到点通信 通信开销 t(m) = t0 + m/ r∞ 通信启动时间 t0 渐近带宽r∞ :传送无限长的消息时的通信速率 半峰值长度m1/2 :达到一半渐近带宽所要的消息长度 特定性能π0:表示短消息带宽 t0 = m1/2 / r∞ = 1 /π0 国家高性能计算中心(合肥) 7 2017-4-1 并行开销的表达式:整体通信 典型的整体通信有: 播送(Broadcasting):处理器0发送m个字节给所有的n个处理器 收集(Gather):处理0接收所有n个处理器发来在消息,所以处理器0最终接收了m n个字节; 散射(Scatter):处理器0发送了m个字节的不同消息给所有n个处理器,因此处理器0最终发送了m n个字节; 全交换(Total Exchange):每个处理器均彼此相互发送m个字节的不同消息给对方,所以总通信量为mn2个字节; 循环移位(Circular-shift):处理器i发送m个字节给处理器i+1,处理器n-1发送m个字节给处理器0,所以通信量为m n个字节。 国家高性能计算中心(合肥) 8 2017-4-1 机器的成本、价格与性/价比 机器的成本与价格 机器的性能/价格比 Performance/Cost Ratio :系指用单位代价(通常以百万美元表示)所获取的性能(通常以MIPS或MFLOPS表示) 利用率(Utilization):可达到的速度与峰值速度之比 国家高性能计算中心(合肥) 9 2017-4-1 算法级性能评测 加速比性能定律 并行系统的加速比是指对于一个给定的应用,并行算法(或并行程序)的执行速度相

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档