网站大量收购独家精品文档,联系QQ:2885784924
  1. 1、本文档共98页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * 存储器分布的SIMD特点: SIMD计算机开发的是PE之间的空间并行性。 存储器分布的SIMD计算机由同一阵列控制部件控制的PE阵列组成。 程序和数据通过主机装入控制存储器。 指令是送到控制部件进行译码。 标量操作或控制操作,则将直接由与控制部件相连的标量处理机执行。 向量操作,则将它广播到所有PE并行地执行。 划分后的数据集合通过向量数据总线广播到所有PE的本地存储器。 PE通过数据寻径网络互连。数据寻径网络执行PE间的通信,如移数、置换和其它寻径操作。控制部件通过执行程序来控制数据寻径网络。PE的同步由控制部件的硬件实现。 所有PE在同一个周期执行同一条指令。 可以用屏蔽逻辑来决定任何一个PE在给定的指令周期执行或不执行指令。 (2) 共享存储器模型 是一种PE使用共享存储器的SIMD计算机。PE和存储器之间的通信网络是一个对准网络,它也受控制部件控制。 * * * * * * * * * * * * * * * * * * * * * * * * * * * * 实现的机器: 瑞典计算机科学研究所的数据扩散机(DDM,Hagersten等,1990) KendallSquareReserch公司的KSR—1机器(Burkhart等,1992)。 特点: COMA模型是NUMA机的一种特例,将NUMA 中分布主存储器换成了高速缓存; 全部高速缓冲存储器组成了全局地址空间; 远程高速缓存访问则借助于分布高速缓存目录进行,分级目录往往可用来寻找高速缓存块的副本,这与所用的互连网络有关; 数据的初始位置并不重要,因为它最终将会迁移到要用到它的地方。 模型的演变: 例如,高速缓存一致性非均匀存储存取(CC—NUMA)模型。 可以用分布共享存储器和高速缓存目录来描述。 CC—NUMA模型的实例 斯坦福大学的Dash系统(Lenosh等,1990)和麻省理工学院的Alewife系统(Agarwal等,1990); 这些将在后面讨论。 4.典型的多处理机 二、分布存储型多计算机系统 1.概念 由多个计算机结点,通过消息传递网络互相连接而成,每个结点是一台由处理机、本地存储器和有时接有磁盘或I/0外围设备组成的自治的计算机。 2.特点: 消息传递网络提供结点之间的点到点静态连接 传统的多计算机已被称为近地存储访问(NORMA)机 所有本地存储器是私用的,而且只有本地处理机才能访问; 私用存储器逐渐在分布共享存储器的多计算机中将被逐步取消。 3. 多计算机的换代 现代多计算机用硬件寻径器来传送信息; 计算机结点与寻径器相连,边界上的寻径器与 I/O和外围设备连接; 任何两结点间的消息传递会涉及一连串的寻径器和通道。 在异构多计算机系统中,可以有多种类型的结点,结点间的通信是通过可兼容的数据表示和消息传递协议来实现的。 消息传递型多计算机的发展换代 第一代(1983—1987)是基于处理机板技术,采用了超立方体结构和软件控制的消息交换方法。 加州理工学院的Cosmic和InteliPSC/1是这一代研制的代表。 第二代(1988—1992)是用网格连接的系统结构、硬件消息寻径和中粒度分布计算的软件环境实现的; IntelParagon和ParsysSuperNodel000可作为代表性产品。 现在面临的第三代(1993—)预期是细粒度计算机 麻省理工学院的J-Machine和加州工学院的Mosaic,VLSI片上实现处理机和通讯工具。 示例: IBM POWER4体系结构特点 PowerPC 64位体系结构 单芯片双处理器,MCM八处理器 集成多处理器互连接口 集成I/O控制器 集成L3Cache控制器 集成存储控制器 IBM POWER4 (MCM结构) IBM POWER4 (32CPU) 4.典型多计算机 多计算机的可编程性取决于: 高效编译器实用 高效的分布式操作系统实用 总结: 本节区分了多处理机和多计算机的主要差别和分类。 ?3 多向量机和SIMD计算机 一、向量超级计算机 1.早期的超级计算机可分为: 流水线向量机; SIMD计算机两类。 执行过程: 当译出的指令为向量操作; 它将被送至向量控制器,控制器将监督主存储器与向量功能流水线之间的向量数据流,向量数据流由控制器协调控制; 向量处理机则装有若干条向量功能流水线。 2.寄存器—寄存器的系统结构 如1976年推出的Cray 1。 向量寄存器用来保存向量操作数、中间和最终的向量结果; 向量功能流水线从向量寄存器检索操作数,并将结果放入寄存器。 3.存储器—存储器结构 这种结构比较早,与寄存器—寄存器结构的区别就在于采用向量流水部

文档评论(0)

xinshengwencai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5311233133000002

1亿VIP精品文档

相关文档