计算机系统结构课件第九章-多处理机(广工).ppt

计算机系统结构课件第九章-多处理机(广工).ppt

  1. 1、本文档共94页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机系统结构课件第九章-多处理机(广工)

* * * * * * * * * * * * * * * * * * * * * * * * * * CM-5 32到16384个处理器结点 每个结点有一个SPARC处理机,32MB存储器,64位浮点和整数操作,速度为128Mflops的向量处理部件 控制处理机1到几十台 根据需要配置存储器和磁盘 输入输出接口与图形设备、海量辅助存储器及高性能网络相连 占地面积为30米×30米,峰值速度超过1Tflops 三个网络:数据网络、控制网络和诊断网络 数据网络提供点对点通信 控制网络提供广播、同步、扫描和系统管理功能 诊断网络从后台访问所有系统硬件,测试系统完整性,检测和隔离错误 数据网络和控制网络有很好的可扩展性,与处理机类型无关 可划分成一个或多个分区供用户使用 每个分区一台控制处理机,一组处理结点,数据和控制网络的专用部分 允许任何分区中的进程访问任何I/O设备 * 2 CM-5网络结构 数据网络采用胖树型网 数据处理结点、控制处理机和I/O通道都位于胖树的叶子上 利用胖树的层次结构特性,可划分一棵子树给一个用户 * 2 CM-5网络结构 采用4元胖树实现,每个内部开关结点由n个寻径器芯片组成。每个寻径器与4个子芯片和2个或4个父芯片相连 可分配不同的子树处理不同的作业,子树的大小任意 为把消息从一台处理机传送到另一台处理机,首先沿树将消息向上传送到离两台处理机最近的公共祖先,然后向下传送到目的处理机 每台处理机与数据网络有两条连接通路,每个叶子结点的输入和输出的频宽为40兆字节/秒 当一个消息沿树向上传送时,使用哪条父连接通路则有几种选择 * 3 控制处理机 控制处理机由CPU、存储器、本地磁盘、网络接口、以太网组成。它相当于一台标准工作站 网络接口通过控制网络和数据网络使处理机与系统的其它部分相连 控制处理机专门执行管理功能,不需要高性能的运算部件 每台控制处理机运行操作系统,负责并行处理资源的管理 一部分控制处理机管理用户区的计算资源,其它管理I/O资源 * 4 处理结点 采用SPARC处理器,利用重叠寄存器窗技术,实现快速的进程切换,使不同时间不同用户分区能够动态地使用处理结点 网络接口通过控制网络和数据网络将结点与系统的其它部分相连 向量部件执行由标量处理机发出的向量指令,每个向量部件有一个流水ALU和64个64位的寄存器 每条向量指令可能传送给一个指定的向量部件、或一对向量部件、或同时广播给所有4个向量部件 标量处理机负责地址转换和循环控制,与向量部件的操作并行执行 每个结点的峰值速度为128Mflops 16384个处理结点的总峰值速度为214×27=221 Mflops =2Tflops 网络的系统结构设计,做到与所选择的处理器无关 * 处理结点基本结构 处理结点基本结构 带向量部件的处理结点 * 9.4.2 对称多处理机 (SMP) SMP称为共享存储多处理机(Shared Memory mulptiProcessors) 也称对称多处理机(Symmetry MultiProcessors) 1 三种模型 (1) UMA多处理机 均匀存储器存取模型(Uniform Memory Access) 存储器被所有处理机均匀共享 所有处理机对所有存储单元具有相同的存取时间 每台处理机有局部Cache 外围设备可共享 (2) NUMA多处理机 非均匀存储器存取(Nonuniform Memory Access)模型 存储器访问时间随存储单元的位置不同而变化 共享存储器物理上是分布在所有处理机中的本地存储器 所有局部存储器地址空间的集合就组成了全局地址空间 处理机访问本地存储器较快,访问属于另一台处理机的远程存储器则较慢,因通过互连网络会产生附加的时间延迟 * 系统互连网络 NUMA多处理机模型 P1 LM1 …… P2 LM2 Pn LMn 系统互连网络 (总线、交叉开关、多级网络) UMA多处理机模型 P1 …… P2 Pn SM1 SM2 SM2 I/O …… 多处理机 * (3) COMA多处理机 只有Cache的存储器结构(Cache-Only Memory Architecture)模型 COMA是一种只用Cache的多处理机系统 COMA模型是NUMA模型的一种特例,后者分布存储器换成了Cache 在每个处理机结点上没有主存储器,全部Cache组成了全局虚拟地址空间 远程Cache访问通过分布Cache目录D进行 共享存储系统拥有统一的寻址空间,程序员不必参与数据分配和传输 * 互连网络 COMA多处理机模型 D1 Cache1 …… P1 D2 Cache2 P2 Dn Cachen Pn COMA多处理机模型 * 2 S2MP结构 1996年SGI Origin 2000服务

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档