计算机系统结构(讲).pptVIP

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机系统结构(讲)

计算机系统结构 (第九讲) 厦门大学计算机科学系 陆达 2004年12月20日 第六章 向量处理机 6.3 向量处理机的存取模式和数据结构 6.3.1 数值算法的存取模式 数值计算问题可能遇到的存取模式;存取模式对加快算法执行速度的作用;怎样设计机器以支持数值计算中经常遇到的存取模式 例子: 求解线性方程组 A*x=b 高斯消去法: A=L*U L*y=b 和 U*x=y L为下三角矩阵 U为上三角矩阵 算法的核心是N次循环的每一循环产生矩阵L的新的一列和矩阵U的新的一行 图6.11:采用高斯消去法在LU分解时某个循环各部分数据的位置 程序6.1:高斯消去法 程序6.1(高斯消去法)的特点: (1)~(4),见P360 由此得到的结论: 第一点~第四点,见P360-361 6.3.2 向量处理机的数据结构 与算法相关的数据存取问题 三种访问方式: (1)、仅需按行存取 图6.12(a) (2)、仅需按行存取 图6.12(b) (3)、既要按行存取又要按列存取 图6.13 9*8个单元存放8*8个数据 向量操作数的四个量: (1)、起始地址 (2)、元素个数 (3)、精度(每个元素的位数) (4)、步距(两个相邻元素间的偏移量) (向量的步距表示向量存取过程中,从一个元素到下一个元素的地址增量) 图6.14:BSP计算机五级数据流水线结构示意图 (存储器模块数目不是2的幂,而是一个质数17) 图6.15:一种按行、按列和按对角线存取效率都较高的数据结构 5*5个单元存放4*4个数据 访问行元素的步距为1;访问列元素的步距为6;访问对角线元素的步距为7 1、6、7与5是互质的 6.4.1 向量处理机系统结构的设计目标 1、较好地维持向量/标量性能平衡 向量处理机还需要具有处理标量的功能 向量平衡点(vector balance point):为了使向量硬件设备和标量硬件设备的利用率相等,一个程序中向量代码所占的百分比。希望花在向量硬件上的时间和标量硬件上的时间相等 每台处理机重复设置流水线功能部件可以提高向量运算性能;或者是向量部件采用超流水线技术 图6.16(a)、图6.16(b):高性能向量处理机性能数据 (Cray、Fujitsu、NEC、Hitachi) 表6.1:7种超级计算机向量和标量性能的比较 2、可扩展性随处理机数目的增加而提高 所谓可扩展性是指在确定的应用背景下,向量处理机系统性能要随处理机数目的增加而线性地提高 可扩展性的三个目标: (1)、规模可扩展性 (2)、换代可扩展性 (3)、问题可扩展性 3、增加存储器系统的容量和性能 大规模存储器系统必须为标量处理提供低时延、为向量处理提供高频宽、为解决大型复杂问题提供大容量和高吞吐率的性能 图6.17:向量处理计算机存储器容量 存储器必须采用高效的层次结构:数据文件或磁盘、动态RAM的扩充存储器、静态RAM的快速共享存储器、用RAM阵列实现的高速缓存/局部存储器 4、提供高性能的I/O和易访问的网络 图6.16(c):向量处理计算机系统所支持的I/O频宽 6.4.2 提高向量处理机性能的常用技术 1、链接技术 寄存器-寄存器向量处理机有关的资源预定问题 图6.18:四类向量指令 图6.19:功能部件和操作数寄存器的预定(四种情况) 什么是链接技术? 结果寄存器可能成为后继指令的操作数寄存器,这种技术称为两条流水线的链接(chaining)。 流水线链接是从流水线的内部定向概念发展而来的。链接是当从一个流水线部件得到的结果直接送入另一个功能流水线的操作数寄存器时所发生的连接过程。 例6.1: V0 - 存储器 (存储器取) V2 - V0+V1 (向量加) V3 - V2V3 (左移) V5 - V3^V4 (逻辑积) 图6.20:Cray 1的流水线链接举例 图6.21:例6.1中的链接时间图 例6.2: 向量运算:D=A*(B+C) V3 - A V2 - V0+V1 V4 - V2*V3 第一、第二条指令可并行执行;第三条指令与第一、第二条指令均存在先写后读的相关冲突,可将第三条指令与第一、第二条指令链接执行。如图6.22 执行时间: (1)、三条指令全部采用串行方法: 3*N+22 (2)、前二条指令并行执行,第三条指令串行执行: 2*N+15 (3)、采用链接

文档评论(0)

phltaotao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档