《计算机系统结构》课件全套(单博炜)第1--5章 计算机系统结构导论--- 并行处理机.ppt

《计算机系统结构》课件全套(单博炜)第1--5章 计算机系统结构导论--- 并行处理机.ppt

  1. 1、本文档共522页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

将一个编队计算一个元素的执行时间记为Tg,若程序分为m个编队,向量长度为n,则整个程序用于对向量元素流水计算的时间为mnTg。若向量寄存器的长度为MVLn,则对长度为n的向量需分为组,分组按编队进行计算。假设对一组向量按编队计算时,执行标量代码的开销为Tv,启动向量部件的开销为Tstart,那么,整个程序的执行时间为[例3.8]在一台向量处理机上实现A=B×s计算,其中A和B是长度n=200的向量,s是一个标量。向量寄存器长度MVI.=64,各功能部件的启动开销为:取数和存数部件为12个时钟周期、乘法部件为7个时钟周期,执行标量代码的开销Tv=15个时钟周期,对一个向量元素执行一次操怍的时间Tg一1个时钟周期。求计算A的总执行时间。解:假设向量A和B存放在向量寄存器Ra和Rb中,标量s在标量寄存器FS中,分组计算由下面三条向量指令完成。LV V1,Rb ;取向量BMULTVS V2,V1,FS ;向量B和标量s相乘SV Ra,V2 ;存向量A由于这三条指令有数据相关,需划分为三个编队,m=3。向量需要分为=4组进行计算,每组计算前都需花费Tv=15个时钟周期为本组向量计算进行有关的标量操作和花费Tstart来启动向量部件。根据Tn的计算公式可得T200=4×(15+Tstart)+3×200×1=660+4Tstart其中,Tstart是向量取(LV)的启动时间(12个时钟周期)、向量乘(MULTVS)的启动时间(七个时钟周期)和向量存(SV)的启动时间(12个时钟周期)的和,所以Tstart=12+7+12=31个时钟周期。因此可得计算向量A的总的执行时间为T200=660+4×31=784个时钟周期,并可得出向量A的一个结果元素的平均执行时间为784/200=3.9个时钟周期。向量流水线的最大性能R∞向量流水线的最大性能R∞表示当向量长度趋于无穷大时的向量流水线的最大吞吐率,单位为MFLOPS。它可用于评价向量处理机的峰值性能。R∞可表示为若长度为n的向量计算的总时钟周期数为Tn,则一个向量元素的平均执行时钟周期数为了Tn/n。由此可将上式写为[例3.9]向量处理机CrayY-MP/8的机器周期时间为6ns。,一个周期可以完成一次加和一次乘运算。另外,八台处理机在最好情况下可以同时运算而互不干扰。计算CrayY-MP/8的峰值性能。解:CrayY-MP/8的峰值性能为作业:3-1,3-2,3-3,3-5,3-6,3-7,3-8,3-12,3-18第四章存储系统存储器是用于存放程序和数据的计算机核心部件之一,其性能直接关系到整个计算机系统性能的高低。存储系统是指存储器硬件以及管理存储器的软、硬件,对存储系统的基本要求是大容量、高速度和低成本。如何以合理的价格设计容量和速度满足计算机系统要求的存储器系统,始终是计算机体系结构设计中的关键问题之一。本章将着重介绍存储系统的基本原理及并行存储器、虚拟存储器、高速缓冲存储器(Cache)的有关技术存储系统及性能存储器的三个主要指标是:容量、速度和价格。存储器容量SM=W·l·m。其中,W为单个存储体的字长,l为单个存储体的字数,m为并行工作的存储体的个数。也就是说,存储器的容量正比于单个存储体的字长、单个存储体的字数和并行工作的存储体的个数。存储器的速度可以用访问时间TA、存储周期TB,或频宽Bm来描述。Bm是存储器被连续访问时,可以提供的数据传送速率,通常用传送信息的位数(或字节数)每秒来衡量。单体的Bm=W/TM,m个存储体并行工作时可达到的最大频宽Bm=W·m/TM。以上指的都是理想情况为了下存储器所能达到的最大频宽,由于存储器不一定总能连续满负荷的工作,所以,实际频宽往往要低于最大频宽。存储器的价格可以用总价格C或每位价格c来表示。具有SM位的存储器每位价格c=C/SM。存储器价格包含了存储单元本身及为该存储器操作所必需的外围电路的价格。人们对存储器的要求是“容量大、速度快、价格低”,然而这三个要求是相互矛盾的。通过研究不同的存储器实现技术可以发现,存储器的速度越快,价格就越高;存储器的容量越大,速度就越慢,价格也越高。解决上述矛盾在组成上引入并行和重叠技术,构成并行主存系统。在保持每位价格基本不变的情况下,能使主存的频宽得到较大的提高。改进存储器的系统结构,发展多层次存储体系(或称存储系统)。所谓存储体系,是指计算机系统的存储器部分由多种不同的存储器构成,由操作系统和硬件技术来完成程序的定位,使之成为一个完整的整体。由于它由多级存储器构成,故又称之为存储层次

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档