《计算机系统结构》全套教学课件.pptx

《计算机系统结构》全套教学课件.pptx

  1. 1、本文档共520页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

计算机系统结构;外文参考书;JohnHennessy;硬件专业的课程顺序;课程目录;课程目录;第1章计算机系统结构导论;1.1.1计算机系统的层次结构;语言实现的两种基本技术;1.1.2计算机系统的结构、组成和实现;研究内容包括:;计算机组成;计算机组成设计要确定的内容;计算机实现;计算机系统结构、组成和实现三者的关系;计算机等级;系列机;模拟与仿真;;计算机系统结构中并行性的发展;并行性概念;并行性的等级;提高并行性的途径;并行处理的发展过程;单机系统中的并行性;多机系统发展;1.3计算机系统的分类;Flynn分类法;四种分类;冯氏分类法;;系统结构发展的因素;1.4计算机性能的评价;2.Amdahl定律;系统加速比依赖于两个因素:;;例题;[例1.2]若在整个测试程序的执行时间中,求浮点数平方根FPSQR的操作占10%。现有两种改进方案:一种是采用FPSQR硬件,使其速度加快到10倍;另一种是使所有浮点数指令FP速度加快到4倍,并设FP指令占整个程序执行时间的40%。请比较两种方案的优劣。

解:硬件方案,Fe=0.1,Se=10,则

FP加速方案,Fe=0.4,Se=4,则

比较结果可知,FP加速方案更优。注意,结论的前提是程序量的40%为FP指令。

;3.程序访问的局部性原理;1.4.2CPU性能公式;;;;;;;1.4.1系统结构的性能评价标准;1.MIPS和MFLOPS;;;另一种替代标准是MFLOPS(MillionFloatingPointOperationsPerSecond),即百万次浮点运算每秒。MFLOPS定义为:

由于MFLOPS衡量机器性能时存在下述缺陷,故也不能作为系统性能评价的标准。

(1)MFLOPS只能衡量机器浮点操作的性能,而不能体现机器的整体性能。例如编译程序,不管机器的性能有多好,它的MFLOPS部不会太高。

(2)MFLOPS的衡量是基于浮点操作而非指令来进行的,所以它可以用来比较不同指令集的机器之间的浮点操作性能,但比较的结果并非可靠。由于不同机器的浮点运算集可能不同,例如,机器A有浮点除法指令,而机器B没有,它们对浮点操作的支持就会不同,完成程序中的浮点除法时,前者的浮点操作次数比后者少得多,执行时间也少于后者,所以难以按MFLOPS评价它们的性能优劣。;;;;2.性能测试;;本章小结;软件对于系统结构的影响;系列机方法;模拟和仿真方??;统一的高级语言方法;应用对于系统结构的影响;器件对于系统结构的影响;系统结构的生命周期;定量分析技术;加速比;例题1.6;例题1.7;例题1.8;CPU性能公式;程序执行时间的另一表述;时钟周期总数的另一计算方法;例1.9;;例1.10;程序访存的局部性原理;性能评价标准;常用的几种评价指标;MIPS存在的不足之处;MFLOPS;测试程序;例1.11;;性能比较;程序执行的衡量标准;;几何平均值;例1.12;解:;解:;成本与价格;系统结构中并行性的发展;并行性的分级;从执行程序的角度;;提高并行性的技术途径;单处理机系统中并行性;多处理机系统中的并行性;;20世纪90年代来的我国并行机;;;;;天河一号实物;神威太湖之光;并行处理机的系统结构类型;本章作业;;第二章指令系统;;数据表示;和数据结构的关系;数据表示例子;高级数据表示;1.自定义数据类型;带标志符的数据表示;优点;数据描述符;2.向量、数组数据表示;;优点;3.堆栈数据表示;例如;;在堆栈机器中的实现过程如图;浮点数尾数的下溢处理;1.截断法;2.舍入法;3.恒置1法;4.查表舍入法;2.2指令系统的优化设计;寻址方式分析;1.编址方式;2.程序定位技术;(1)直接定位;(2)静态再定位;(3)动态再定位;按整数边界存储的概念;;;指令格式的优化;1.操作码的优化;[例2.1];;;(1)等长操作码编码;(2)Huffman编码;Huffman编码的一般过程为:;[例2.2];;(3)扩展操作码编码;[例2.3];;;;;;地址码的优化;;一个操作数的地址码长度可以有很宽的变化范围,;;;3.指令格式优化;[例2.4];;;;;2.3计算机指令系统的发展方向;CISC方向改进指令系统;;面向高级语言的优化实现改进;;;CISC结构特点;RISC;RISC一般原则;RISC采用的基本技术;2.采用LOAD/STORE结构及重叠寄存器窗口技术;;RISC的好处;RISC的问题;RISC发展的新趋势;后RISC特征;CISC机器例子;RISC机器例子;;第三章流水线技术与向量处理技术;;3.1流水线的基本原理;流水线例子;1.重叠方式原理;;;2.重叠方式结构;;;先行控制;先行控制原理;先行控制结构;

文档评论(0)

163 + 关注
实名认证
内容提供者

知识分享

1亿VIP精品文档

相关文档