- 1、本文档共40页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2021/3/26 * *机器主频:指CPU内部主时钟脉冲的频率,常用f 表示。 主频单位—1GHz=1×103MHz=1×106KHz=1×109Hz; *存储容量:指存储器可存储二进制信息的总位数。 主存容量—容量S =存储单元个数×存储字长; 辅存容量—容量S =存储块个数×存储块长度; 最大主存容量—CPU能够访问的主存最大容量,它决定了CPU的地址和数据引脚数量 数据线位数:通常=机器字长或存储字长, 地址线位数:=log2(最大主存容量/数据线位数) 时钟周期—CPU内部基本操作的时长,常用TC表示; f 与TC关系—倒数关系,即f =1/TC 容量单位—1GB=1×210MB=1×220KB=1×230B=8×230bit; 思考:为何不用存储字长或机器字长为单位? 2021/3/26 * *响应时间:指一个任务从任务输入到结果输出的总时间, 即 T响应=TCPU+TI/O等待,TCPU=T运算+TMEM+TI/O 2、系统性能指标 时间是唯一标准,主要有响应时间和吞吐量两个指标。 特点—反映了单任务计算机系统的软硬件总体性能 优化:CPU转去执行其它程序 → 多任务计算机系统 CPU时间—TCPU=IN ×CPI×TC= n为指令系统的指令种类数,CPIi为第i 种指令所需时钟周期数; IN 为程序执行的总指令数(≠程序包含的指令数,但有关联); Ii为第i 种指令的执行次数,CPI为每条指令平均所需时钟周期数; TC为时钟周期,是机器主频的倒数 TCPU与程序算法、编译程序、指令系统、CPIi及TC均相关 2021/3/26 * 例1—某计算机主频为2GHz,指令系统只有Ⅰ类指令及Ⅱ类指令,指令长度分别为1B及2B,指令执行时间分别为5个及8个时钟周期。程序A的大小为2MB,其中30%空间为Ⅰ类指令;程序A执行时,所有指令中共有20%的指令需重复执行30次,在这些重复执行的指令中,有40%为Ⅱ类指令。求完成程序A的CPU时间。 解:程序A包含的Ⅰ类指令数=(2MB×30%)/1B=0.6×220条, Ⅱ类指令数=(2MB×70%)/2B=0.7×220条; 重复执行的指令数=(0.6×220+0.7×220)×20%=0.26×220条; 执行的Ⅰ类指令数=0.6×220+0.26×220×60%×29次, Ⅱ类指令数=0.7×220+0.26×220×40%×29次; TCPU=5.124×220×5×TC+3.716×220×8×TC =(25.62+29.728)×220×TC=55.348×220÷(2×109) ≈29ms 31 2021/3/26 * 特点—反映了多任务计算机系统的软硬件总体性能 △MIPS(每秒百万次指令) 缺点:不能反映指令系统功能强弱(可用相对MIPS法) 表示—因工作量无统一定义,通常用MIPS及MFLOPS代替 *吞吐量:又称吞吐率,指单位时间内能处理的工作量, 即 吞吐量 = n个任务的总工作量÷n个任务的总时间 △MFLOPS(每秒百万次浮点运算) 缺点:只反映了浮点操作能力,不能反映系统整体性能 *其他:RAS(可靠性/可用性/可维护),兼容性等 32 2021/3/26 * 二、性能设计 1、冯·诺依曼模型计算机的性能瓶颈 *CPU-MEM瓶颈:CPU与MEM的速度差距越来越大 CPU速度—4~5倍/3年,得益于VLSI技术、器件技术; MEM速度—1~2倍/3年,受限于容量-速度-成本的矛盾。 解决方案—需从结构与技术方面解决两者速度匹配问题 *指令串行执行瓶颈:指令逐条执行导致性能受限 解决方案1—快速串行处理,性能受器件技术的限制,改进效果不佳; 解决方案2—并行处理,性能受串行程序指令间相关的限制,需从结构与技术方面解决指令间相关问题 2021/3/26 * 2、性能平衡设计 重点解决CPU-MEM瓶颈,减少访存延迟、或提高访存效率 *增设Cache:减少访存延迟,减少访问主存频率; *增加总线数据宽度:提高访存效率,以减少访存次数; *采用多级总线:主
文档评论(0)