《计算机系统结构》 课件 第三章 流水线技术与向量处理技术.ppt

《计算机系统结构》 课件 第三章 流水线技术与向量处理技术.ppt

  1. 1、本文档共154页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

[例3.7]假设每种流水功能部件只有一个,下面一组向量指令能分成几个编队?LV V1,RX ;取向量XMULTSV V2,F0,V1 ;向量和标量相乘LV V3,RY ;取向量YADDV V4,V2,V3 ;向量加SV RY,V4 ;存结果向量解:这一组向量指令分为以下4个编队:LVMULTSV LVADDVSV将一个编队计算一个元素的执行时间记为Tg,若程序分为m个编队,向量长度为n,则整个程序用于对向量元素流水计算的时间为mnTg。若向量寄存器的长度为MVLn,则对长度为n的向量需分为组,分组按编队进行计算。假设对一组向量按编队计算时,执行标量代码的开销为Tv,启动向量部件的开销为Tstart,那么,整个程序的执行时间为[例3.8]在一台向量处理机上实现A=B×s计算,其中A和B是长度n=200的向量,s是一个标量。向量寄存器长度MVI.=64,各功能部件的启动开销为:取数和存数部件为12个时钟周期、乘法部件为7个时钟周期,执行标量代码的开销Tv=15个时钟周期,对一个向量元素执行一次操怍的时间Tg一1个时钟周期。求计算A的总执行时间。解:假设向量A和B存放在向量寄存器Ra和Rb中,标量s在标量寄存器FS中,分组计算由下面三条向量指令完成。LV V1,Rb ;取向量BMULTVS V2,V1,FS ;向量B和标量s相乘SV Ra,V2 ;存向量A由于这三条指令有数据相关,需划分为三个编队,m=3。向量需要分为=4组进行计算,每组计算前都需花费Tv=15个时钟周期为本组向量计算进行有关的标量操作和花费Tstart来启动向量部件。根据Tn的计算公式可得T200=4×(15+Tstart)+3×200×1=660+4Tstart其中,Tstart是向量取(LV)的启动时间(12个时钟周期)、向量乘(MULTVS)的启动时间(七个时钟周期)和向量存(SV)的启动时间(12个时钟周期)的和,所以Tstart=12+7+12=31个时钟周期。因此可得计算向量A的总的执行时间为T200=660+4×31=784个时钟周期,并可得出向量A的一个结果元素的平均执行时间为784/200=3.9个时钟周期。向量流水线的最大性能R∞向量流水线的最大性能R∞表示当向量长度趋于无穷大时的向量流水线的最大吞吐率,单位为MFLOPS。它可用于评价向量处理机的峰值性能。R∞可表示为若长度为n的向量计算的总时钟周期数为Tn,则一个向量元素的平均执行时钟周期数为了Tn/n。由此可将上式写为[例3.9]向量处理机CrayY-MP/8的机器周期时间为6ns。,一个周期可以完成一次加和一次乘运算。另外,八台处理机在最好情况下可以同时运算而互不干扰。计算CrayY-MP/8的峰值性能。解:CrayY-MP/8的峰值性能为作业:3-1,3-2,3-3,3-5,3-6,3-7,3-8,3-12,3-18超标量超流水线处理机超标量超流水线处理机是超标量流水与超流水技术的结合。若一条指令包含取指令、译码、执行、存结果四个子过程,各子过程经过时间均为Δt′,且机器时钟周期Δt=3Δt′,则指令在并行度m=9的超标量超流水线处理机中的操作情况如图3.38所示。在一个时钟周期内机器指令发射三次,每次发射三条指令,每个功能段延迟时间都是Δt′,则在流水线满负荷工作时,完成12个任务只需要5Δt。美国DEC公司1992年推出的Alpha21064处理器就采用了超标量超流水结构。设流水线的级数为k,流水线中每级的执行时间均为τ,采用超流水线时处理器的时钟频率为主机时钟频率的n倍,采用超标量时处理器的发射度为m。对于不同类型的流水线在执行N条指令时的执行时间有所不同。单发射标量流水线m发射超标量流水线单发射n倍超流水线m发射n倍超标量超流水线一般情况下,当时钟频率和流水线级数相同时,有m发射的超标量处理机速度最多为单发射处理机速度的m倍。具有n倍时钟频率的超流水线处理机,它的速度最多可为单频标量流水线的n倍。具有n倍时钟频率和m发射的超标量起流水线处理机,它的组合加速比可为单频标量流水线的m·n倍。[例3.5]设有12个任务需要进入流水线,已知流水线的功能段均为四个,每个功能段的处理时间都是Δt。现计算在下列情况中完成12个任务分别需要多少时间?(1)单发射标量流水线。(2)超标量流水线,每个时钟周期可以同时发射三条指令。(3)超流水线,每个时钟周期可以分时发射三

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档