第三章存储系统-Welcometonginx!.pptVIP

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
假设:把向量数据元素送往向量功能部件以及把结果存入向量寄存器需要一拍时间,从存储器中把数据送入访存功能部件需要一拍时间。 存储器 A B C V0 V1 V2 V3 1 2 3 4 5 6 访存口 1 2 3 4 5 6 浮点加 1 2 3 4 5 6 7 D V4 浮点乘 1. 3条指令全部用串行方法执行,则执行时间为: [(1+6+1)+N-1]+[(1+6+1)+N-1] +[(1+7+1)+N-1] = 3N +22 (拍) 2. 前两条指令并行执行,然后再串行执行第3条指令,则执行时间为: [(1+6+1)+N-1]+[(1+7+1)+N-1] = 2N +15 (拍) 3. 第1、2条向量指令并行执行,并与第3条指令链接执行。 从访存开始到把第一个结果元素存入V4所需的拍数(亦称为链接流水线的建立时间)为: [(1+6+1)] +[(1+7+1)] = 17 (拍) 3条指令的执行时间为: [(1+6+1)]+ [(1+7+1)] +(N-1) = N+16 (拍) V3 ← A V2 ← V0 + V1 V4 ← V2 * V3 进行向量链接的要求 保证:无向量寄存器使用冲突和无功能部件使用冲突 1)前一条指令的结果是后一条指令的输入。 2)当一条向量指令的两个源操作数分别是两条先行指令的结果时,要求先行的两条指令产生运算结果的时间必须相等,即要求有关功能部件的通过时间相等。 3)要进行链接执行的向量指令的向量长度必须相等,否则无法进行链接。 4)只有在前一条指令的第一个结果元素送入到结果向量寄存器的那一个时钟周期才可以进行链接。 例. 以下两条向量指令只能串行执行的是( ) A. V1 ←存储器??? B. V2 ← V0+V1 V3 ← V1+V2? V5 ← V3*V4 C. V2 ← V0+V1? ??? D. V2 ← V0+V1 ? V5 ← V3+V4?????? V5 ← V2*V3 答案:C 第四章 向量处理机 3. 分段开采技术 如果向量的长度大于向量寄存器的长度,该如何处理呢? 当向量的长度大于向量寄存器的长度时,必须把长向量分成长度固定的段,然后循环分段处理,每一次循环只处理一个向量段。这种技术称为分段开采技术。 例.设A和B是长度为N的向量,考虑在Cray-1向量处理器上实现以下的循环操作: DO 10 I = 1,N 10 A(I)= 5.0 * B(I) + 1.0 第四章 向量处理机 5.0 * B(I) + 1.0 当N ≤64时,可以用以下指令序列: S1 ← 5.0 ;将常数5.0送入标量寄存器S1 S2 ← 1.0 ;将常数1.0送入标量寄存器S2 VL ← N ;在向量长度寄存器VL中设置向量长度N V0 ← B ;从存储器中将向量B读入向量寄存器V0 V1 ← S1 × V0 ;向量B中的每个元素分别和常数S1相乘 V2 ← S2 + V1 ;向量V1中的每个元素分别和常数S2相加 A ← V2 ;将计算结果从向量寄存器V2存入存储器的向量A 当N 64时,就需要进行分段开采。 循环次数K : 余数L: S1 ← 5.0 ;将常数5.0送入标量寄存器S1 S2 ← 1.0 ;将常数1.0送入标量寄存器S2 VL ← L ;在向量长度寄存器VL中设置向量长度L V0 ← B ;从存储器中将向量B[0..L-1]读入向量 ; 寄存器V0 V1 ← S1 * V0 ;向量B中的每个元素分别和常数S1相乘 V2 ← S2 + V1 ;向量V1中的每个元素分别和常数S2相加 A ← V2 ;将计算结果从向量寄存器V2存入存储器 ;的向量A[0..L-1] 处理余 数部分, 计算L 个元素 第四章 向量处理机 For (I=0 to K-1) { V0 ← B ;从存储器中将向量B[L+I*64..L+I*64+63] ;读入向量寄存器V0 V1 ← S1 * V0

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
文档贡献者

本账号下所有文档分享可拿50%收益 欢迎分享

1亿VIP精品文档

相关文档