多核处理器体系结构及并行设计.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多核处理器体系结构及并行设计

多核处理器体系结构及并行程序设计 天津大学 于策 yuce_air@ Outline 多核处理器简介 并行程序设计方法学(PCAM) 科研及技术(天津大学SRDC及IBM技术中心) Outline 多核处理器简介 并行程序设计方法学(PCAM) 科研及技术(天津大学SRDC及IBM技术中心) 什么是多核处理器? 两个或多个独立运行的内核集成于同一个处理器上面 双核处理器 =一个处理器上包含2个内核 多核处理器 = 一个处理器上包含2个或多个内核 为什么要采用多核技术? 最终目标: 提升用户的体验 摩尔定律 —— 不断发展和改进处理器的性能 最大限度地利用越来越多的晶体管 实现最优的价值 缩减处理时间,提高计算能力 开发平台的新特性和新功能 通过并行方式改进处理器的性能 多核技术的发展 几种不同的技术 HT – Hyper Threading: 2 threads running on the same processor core 处理器上的某些资源会被共享 使用相同的缓存和运算器 DC – Dual Core: 2 execution cores in the same processor package 共享系统总线 与双处理器的性能相同 DP/MP – Dual/Multi-Processing: 2 or more processors in the same system 只共享系统总线,独立缓存 高性能,资源冲突少 双核技术 VS. 超线程技术 双核是真正意义上的双处理器 不会发生资源冲突 每个线程拥有自己的缓存、寄存器和运算器 一个3.2GHz Smithfiled在性能上并非等同于3.2GHz P4 with HT 的2倍 HT 使处理器的性能至少提升了1/3 双核的性能相当于2块 non-HT 处理器 双核技术与HT技术在性能上的对比 Ex 1: 两个floating point线程 (Smithfield client) 每个线程拥有自己的FPU, 没有资源冲突 尽管性能上没有提升太多,但仍然优于HT Ex 2: 一个integer线程与一个floating point线程 性能大幅度提升 没有资源冲突 多核技术与超线程技术的结合 AMD与Intel双核架构的对比 多核面临的困难 如何计算软件授权? 按CPU个数收取软件授权费用 按芯片个数收取软件授权费用 应用软件是否支持? 如果应用程序是基于多处理器编写的 如果应用程序是基于单处理器编写的 双核发热大,散热是难题 DualCore、SMP、Cluster Outline 多核处理器简介 并行程序设计方法学(PCAM) 科研及技术(天津大学SRDC及IBM技术中心) PCAM设计方法学 划分(Partitioning) 通讯(Communication) 组合(Agglomeration) 映射(Mapping) PCAM设计方法学 设计并行算法的四个阶段 划分(Partitioning) 通讯(Communication) 组合(Agglomeration) 映射(Mapping) 划分:分解成小的任务,开拓并发性; 通讯:确定诸任务间的数据交换,监测划分的合理性; 组合:依据任务的局部性,组合成更大的任务; 映射:将每个任务分配到处理器上,提高算法的性能。 PCAM设计过程 域分解 划分的对象是数据,可以是算法的输入数据、中间处理数据和输出数据; 将数据分解成大致相等的小数据片; 划分时考虑数据上的相应操作; 如果一个任务需要别的任务中的数据,则会产生任务间的通讯; 域分解 示例:三维网格的域分解,各格点上计算都是重复的。下图是三种分解方法: 功能分解 划分的对象是计算,将计算划分为不同的任务,其出发点不同于域分解; 划分后,研究不同任务所需的数据。如果这些数据不相交的,则划分是成功的;如果数据有相当的重叠, 意味着要重新进行域分解和功能分解; 功能分解是一种更深层次的分解。 划分判据 划分是否具有灵活性? 划分是否避免了冗余计算和存储? 划分任务尺寸是否大致相当? 任务数与问题尺寸是否成比例? 功能分解是一种更深层次的分解,是否合理? 通讯 通讯是PCAM设计过程的重要阶段; 划分产生的诸任务,一般不能完全独立执行,需要在任务间进行数据交流;从而产生了通讯; 功能分解确定了诸任务之间的数据流; 诸任务是并发执行的,通讯则限制了这种并发性; 通讯判据 所有任务是否执行大致相当的通讯? 是否尽可能的局部通讯? 通讯操作是否能并行执行? 同步任务的计算能否并行执行? 组合 组合是由抽象到具体的过程,是将组合的任务能在一类并行机上有效的执行; 合并小尺寸任务,减少任务数。如果任务数恰好等于处理器数,则也完成了映射过程; 通过增加任务的粒度和重复计算

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档