文本教程系统结构chap.pptx

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第12章 阵列处理机曹强计算机学院武汉光电国家实验室信息存储部caoqiang@hust.edu.cn张晨曦 刘依(版)12.1 阵列处理机的操作模型和特点12.2 阵列处理机的基本结构12.3 阵列处理机实例12.4 阵列处理机的并行算法举例阵列处理机核心:一个由多个处理单元构成的阵列采用资源重复的方法,设置较多的处理单元来提高并行性。用单一的控制部件来控制多个处理单元对各自的数据进行相同的运算和操作。又称为SIMD计算机。有时还被称为并行处理机。12.1 阵列处理机的操作模型和特点阵列处理机的操作模型用一个控制部件CU同时管理多个处理单元PE。CU对指令进行译码,并把指令播送到各处理单元。所有处理单元均被动地接收并执行从控制部件广播来的同一条指令,但它们所操作的对象却是不同的数据。12.1 阵列处理机的操作模型和特点阵列处理机的操作模型 12.1 阵列处理机的操作模型和特点阵列处理机的操作模型可用五元组表示 阵列处理机=(N,C,I,M,R)其中:N:机器的处理单元(PE)数。例如:Illiac Ⅳ计算机有64个PE MP-1计算机有16384个PEC:控制部件CU直接执行的指令集,包括标量指令和程序流控制指令。I:由CU广播至所有PE进行并行执行的指令集。包括算术运算、逻辑运算、数据寻径、屏蔽以及其他由每个PE对它的数据所执行的局部操作。12.1 阵列处理机的操作模型和特点M:屏蔽方案集每种屏蔽将所有PE划分成允许操作和禁止操作两种工作模式。R:数据寻径功能集说明互连网络中PE间通信所需要的各种设置模式。例如:MasPar MP-1计算机的操作特性如下: (1)MP-1是一种SIMD机器,其PE数N=1024~16384。 (2)CU执行标量指令,将译码后的向量指令广播到PE阵列,并控制PE间通信。 (3)每个PE都是RISC处理机,能执行不同数据的整数运算和标准浮点运算。PE从CU接收指令。 12.1 阵列处理机的操作模型和特点 (4)屏蔽方案设在每个PE中,并由CU连续监控,它能在运行时动态地使每个PE处于工作或禁止状态。 (5)MP-1有一个X-Net网格网络和一个全局多级交叉开关寻径器,以实现CU-PE之间、X-Net的8个近邻和全局寻径器的通信。阵列处理机的特点 以单指令流多数据流方式工作。通过设置多个相同的处理单元来开发并行性。利用并行性中的同时性,而不是并发性。所有处理单元必须同时进行相同的操作。以某一类算法为背景的专用计算机。 12.1 阵列处理机的操作模型和特点阵列机的研究必须与并行算法的研究密切结合,以便能充分发挥它的处理能力。阵列机的控制器实质上是一台标量处理机,而为了完成I/O操作以及操作系统的管理,尚需一个前端机。 实际的阵列机系统是由3部分构成的一个异构型多处理机系统。12.2 阵列处理机的基本结构12.2.1 分布式存储器的阵列机分布式存储器的阵列机结构含有多个相同的处理单元PE,每个PE有各自的本地存储器LM。PE之间通过数据寻径网络以一定方式互相连接。它们在阵列控制部件的统一指挥下,实现并行操作。指令的执行顺序基本上是串行进行的。程序和数据是通过主机装入控制存储器。12.2 阵列处理机的基本结构分布式存储器的阵列处理机结构 12.2 阵列处理机的基本结构指令送到控制部件进行译码。标量指令:直接由标量处理机执行。向量指令:阵列控制部件通过广播总线将它广播到所有PE中去并行地执行。执行程序所需的数据集经划分后通过数据总线分布存放到各PE的本地存储器LM。各PE之间通过数据寻径网络互连,实现PE间的通信,控制部件通过执行程序来控制数据寻径网络。PE的同步是在控制部件的控制下由硬件实现。可以让所有PE在同一个周期执行同一条指令12.2 阵列处理机的基本结构也可以通过采用屏蔽逻辑来控制某些PE在指定的指令周期是否参与执行 各种阵列处理机的主要差别 在于数据寻径网络的不同。Illiac Ⅳ: 4-邻连接网络结构 (在过去是最常用的一种)CM-2:嵌在网格中的超立方体MasPar MP-1:X-Net加多级交叉开关寻径器12.2 阵列处理机的基本结构12.2.2 共享存储器的阵列机共享存储器的阵列处理机结构 集中设置存储器 共享的多体并行存储器SM通过对准网络与各处理单元PE相连。存储模块的数目等于或略大于处理单元的数目。必须减少存储器访问冲突 (将数据合理地分配到各存储器模块中 )在处理单元数目不太多的情况下是很理想的所有阵列指令都必须使用长度为n的向量操作数 (n为PE的个数)12.2 阵列处理机的基本结构共享存储器的阵列处理机结构 互连网络是共享存储器SM和处理单元PE之间的必由之路。 12.3 阵列处理机实例12.3.1 实例1:Illiac Ⅳ阵列处理机 美国宝来

文档评论(0)

136****1820 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档