- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 第 6 章 并行处理机和相联处理机 * 第 6 章 并行处理机和相联处理机 第 8 章 并行处理机 8.1 并行处理(SIMD)机原理 8.2 并行处理机算法 8.3 并行处理机举例 并行处理机是通过重复设置大量相同的处理单元PE(Processing Element),将它们按一定的方式互连,在统一的控制部件CU(Control Unit)控制下,对各自分配来的不同数据并行地完成同一条指令所规定的操作。它依靠操作一级的并行处理来提高系统的速度。 并行处理机的控制部件中进行的是单指令流,因此与高性能单处理机一样,指令基本上是串行执行,最多加上使用指令重叠或流水线的方式工作。 指令重叠是将指令分成两类,把只适合串行处理的控制和标量类指令留给控制部件自己执行,而把适合于并行处理的向量类指令播送到所有处理单元,控制让处于活跃的那些处理单元去并行执行。因此这是一种标量控制类指令和向量类指令的重叠执行。 8.1.1 并行处理机的原理和基本构成 并行处理机分类 并行处理机根据存贮器采用的组成方式不同分成两种基本构成。 (1)分布存贮的并行处理机 各个处理单元设有局部存贮器存放分布式数据,只能被本处理单元直接访问。此种局部存贮器称为处理单元存贮器(Processing Element Memory)PEM。在控制部件CU内设有一个用来存放程序的主存贮器CUM。整个系统在CU统一控制下运行系统程序的用户程序。执行主存中的用户程序指令播送给各个PE,控制PE并行地执行。 (2)共享存贮的并行处理机。 每个PE没有局部存触器,存储模块以集中形式为所有PE共享。互连网IN受CU控制,具有双向性采用分布式存贮器组成基本结构。 … ICN PE0 PE1 PEN-1 MM0 MM1 MMN-1 CU SC I/O-CH I/O SM … … PEM0 PE0 PEM1 PE1 PEMN-1 PEMN-1 ICN CU CUM I/O 接口 D SC (A)具有共享存贮器并行处理机结构 (B)分布存贮器并行处理机结构 共享-分布存储器 并行处理机的特点 并行处理机的单指令流多数据流处理方式和由它产生的特殊结构是以诸如有限差分、矩阵、信号处理、线性规划等一系列计算问题为背景发展起来的。这些计算问题的共同特点是可以通过各种途径把它们转化成为对数组或向量的处理,而并行处理机正好利用多个处理单元对向量或数组所包含的各个分量同时计算, 从而获得很高的处理速度。 并行VS流水, 资源重复,Vs 时间重叠; 同时性,VS 并发性; 其设备利用率却可能没有多个单功能流水线部件那样高。 只有在硬件价格有了大幅度下降及系统结构有了较大改进的情况下,并行处理机才能具有较好的性能价格比。 第 8 章 并行处理机 8.1 并行处理(SIMD)机原理 8.2 并行处理机算法 8.3 并行处理机举例 处理单元阵列 由64个PUi构成,每个Pui包括(PEi和PEMi) 由64个结构完全相同的处理单元PEi 构成,每个处理单元PEi字长64位,PEMi为隶属于PEi的局部存储器,每个存储器有2K字,全部PEi由CU统一管理,PEi都有一根方式位线,用来向CU传送每个PEi的方式寄存器D中的方式位,使CU能了解各PEi的状态是否活动,作为控制它们工作的依据。 阵列控制器 CU 相当一台小型控制计算机 对处理单元阵列实现控制,(发控制信号,广播公共地址,广播公共数据)对指令流进行译码控制,利用CU内部资源可以进行标量操作,接受和处理各类中断,其他输入输出操作。 I/O系统 由磁盘文件系统DFS,输入输出子系统和宿主计算机S/C构成(驻留操作系统,编译程序,I/O服务程序等) 8.2.1 并行处理机的算法 8.2.1 并行处理机的算法 ILLIAC Ⅳ的处理单元阵列结构 图 8.2 ILLIAC Ⅳ处理单元的互连结构 PU16 PU0 PU8 PU7 PU55 PU63 PU0 PU1 PU7 PU8 PU9 PU15 PU56 PU57 PU63 PU0 PU1 PU7 PU56 PU57 PU58 在阵列处理机上,解决矩阵加法是最简单的一维情形。若有两个 8×8 的矩阵A、B相加,所得结果矩阵C也是一个 8×8的矩阵。只需把A、B居于相应位置的分量存放在同一个PEM内,且在全部 64个PEM中,令A的分量均为同一地址α,B的分量单元均为同一地址α+1,而结果矩阵C的各个结果分量也相应存放于各PEM同一地址α+2的单元内,如图
您可能关注的文档
- 商业项目策划招商代理服务合同剖析.doc
- 第五章 建年处理3 万吨硅片切割砂浆循环利用项目.docx
- 第七章 黑马程序员C语言教程:技术文档.docx
- 体育保健学作业和答案.doc
- 目录服务器厂商参考教材.docx
- 第九章 网络代理设置不求人 常见代理服务全攻略.doc
- 第五章 金运达国际物流.docx
- 中国十大艺术网站榜-附件.doc
- 省、市级河道管理范围划界技术标准剖析.doc
- 第九章 2010香港自由行攻略.doc
- 2024年湖南省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年江西省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年安徽省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年福建省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年广东省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年河北省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年河南省高考英语试卷(含答案解析)+听力音频.docx
- 2024年湖北省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年湖南省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年江苏省高考英语试卷(含答案解析)+听力音频+听力原文.docx
文档评论(0)