网站大量收购独家精品文档,联系QQ:2885784924

指令流多数据流计算机.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

6.4.2阵列处理机的常用算法及性能分析3.累加和7S=∑aii=0如果在阵列处理机上采用成对递归相加的算法,则只需log28=3次加法时间。首先,8个原始数据A(i),0≤i≤7,存放在8个PEM的a单元中,然后按下述步骤求累加和。第1步置全部PE为活跃状态;第2步全部A(I),0≤I≤7,从PE的a单元读到相应PE的RGA中;第3步令K:=0;第4步全部PE的(RGA)转送到RGR;第5步全部PE的(RGR)经过互连网络向右传送2k步距;第6步令j=2k-1;第7步置PE0至PEj为不活跃状态;第8步处于活跃状态的PE执行(RGA):=(RGA)+(RGR)的操作;第9步K:=K+1;第10步若K3,则转第四步;否则,继续往下执行;第11步置全部PE为活跃状态;第12步全部PE的(RGA)存入相应PEM的a+1单元中。01234567RGA01234567RGRK=00123456RGR700-11-22-33-44-55-66-7RGA00-11-22-33-44-55-66-7RGRK=100-11-22-33-44-55-66-700-10-20-31-42-53-64-7RGARGR00-10-20-31-42-53-64-7RGRK=21-42-53-64-700-10-20-3RGR00-10-20-30-40-50-60-7RGA【例6.1】A和B都是元素为浮点表示的64×64的二维数组,一次浮点加法的计算过程可由取数、求阶差、对阶、尾数加、规格化和存数共6个段组成,若每个段的执行时间均为,请分别求出在下列结构不同的处理机上完成C=A+B所需时间及相对于顺序处理方式的加速比。顺序处理方式的处理机。具有浮点加法流水线的流水处理机,且浮点加法流水线分为6个段,各段执行时间均为。8×8的阵列处理机,且处理阵列上的每个处理器只能顺序处理浮点加运算。8×8的阵列处理机,且处理阵列上的每个处理器均能流水处理浮点加运算。64×64的阵列处理机。计算机系统结构(第二版)目录单指令流多数据流计算机的基本结构与特点分布式存储器SIMD计算机实例分析集中式共享存储器SIMD计算机实例分析阵列处理机的算法及性能分析第6章单指令流多数据流计算机第6章

单指令流多数据流计算机并行处理机的所有处理单元同时执行从控制部件广播来的同一条指令,但指令使用不同的数据,因此,并行处理机是指令操作级并行的单指令流多数据流处理机。单指令流多数据流(SIMD)计算机的关键特征是它的并行处理机。单指令流多数据流计算机的

基本结构与特点它的并行处理机是由单一控制部件控制多个处理单元同时进行运算操作,多个处理单元通常通过互连网络连接成阵列结构,故也称为阵列处理机。单指令流多数据流计算机的两种基本结构根据存储器的组织方式不同,单指令流多数据流计算机的基本结构分为两种:集中式共享存储器型分布式存储器型logo分布式存储器SIMD计算机基本结构并行处理机的每个处理单元都有自己的局部存储器,存放可直接访问的数据。所有的处理单元通过互连网络互联。阵列控制部件CU是一台功能专用的处理机,它执行程序流控制指令和程序中的标量运算。管理处理机SC运行操作系统,管理系统资源。图6.1分布式存储器的SIMD计算机基本结构2.集中式共享存储器SIMD计算机基本结构并行处理机的所有处理单元共享由个存储体组成的并行存储器,处理单元与存储体之间通过互连网络互连。CU和SC的功能与采用分布式存储器构型的SIMD计算机没有什么差别。图6.2集中式共享存储器的SIMD计算机基本结构第一章节6.1.2单指令流多数据流计算机的主要特点SIMD的效率取决于计算程序向量化的程度。SIMD计算机的互连网络决定了SIMD计算机能适应的算法类别,SIMD计算机是根据功能专用化的原则组成的一种异构型多计算机系统。SIMD计算机的实际有效速度取决于另外两个因素。一是标量运算速度,二是编译过程的时间开销。SIMD计算机依靠的并行措施是资源重复。6.2分布式存储器SIMD计算机实例分析两种典型的SIMD计算机采用分布式存储器结构的并行处理

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档