- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
假设有一条长流水线,仅仅对条件转移指令使用分支目标缓冲。假设分支预测错误的开销为4个时钟周期,缓冲不命中的开销为3个时钟周期。假设:命中率为90%,预测精度为90%,分支频率为15%,没有分支的基本CPI为1。
①求程序执行的CPI。
②相对于采用固定的2个时钟周期延迟的分支处理,哪种方法程序执行速度更快?
参考答案:
解:(1)程序执行的CPI=没有分支的基本CPI(1)+分支带来的额外开销
分支带来的额外开销是指在分支指令中,缓冲命中但预测错误带来的开销与缓冲没有命中带来的开销之和。
分支带来的额外开销=15%*(90%命中×10%预测错误×4+10%没命中×3)=0.099
所以,程序执行的CPI=1+0.099=1.099
(2)采用固定的2个时钟周期延迟的分支处理CPI=1+15%×2=1.3
由(1)(2)可知分支目标缓冲方法执行速度快。
计算机系统中有三个部件可以改进,这三个部件的部件加速比为:部件加速比1=30;部件加速比2=20部件加速比3=10
①如果部件2和部件3的可改进比例均为30%,那么当部件1的可改进比例为多少时,系统加速比才可以达到10?
②如果三个部件的可改进比例分别为20%、10%和30%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?
参考答案:
解:(1)在多个部件可改进情况下,Amdahl定理的扩展:
Sn?
1
(1??F)??F
ii Si
i
已知S
=30,S=15,S=15,S
=10,F=0.3,F=0.3,得:
1 2 3
10?
n 1 2
1
1(-0.3?0.3?F)?(0.3/30?0.3/20?F
/10)
3 3
得F=0.36,即部件3的可改进比例为36%。
3
(2)设系统改进前的执行时间为T,则3个部件改进前的执行时间为:(0.3+0.3+0.2)
T=0.8T,不可改进部分的执行时间为0.2T。
已知3个部件改进后的加速比分别为S=30,S=20,S=10,因此3个部件改进后的
1 2 3
执行时间为:
T?0.3T?0.3T?0.2T
?0.045T
n 30 20 10
改进后整个系统的执行时间为:Tn=0.045T+0.2T=0.245T
那么系统中不可改进部分的执行时间在总执行时间中占的比例是:
0.2T
0.245T
?0.82
设指令流水线由取指令、分析指令和执行指令3个部件构成,每个部件经过的时间为△t,连续流入12条指令。分别画出标量流水处理机以及ILP均为4的超标量处理机、超长指令字处理机、超流水处理机的时空图,并分别计算它们相对于标量流水处理机的加速比。
参考答案:
解:标量流水处理机的时空图:
执行分析取指
14 时间
1执行完12条指令需T=14△t。
1
超标量流水处理机与超长指令字处理机的时空图:
执行分析取指2超标量流水处理机中,每一个时钟周期同时启动4条指令。执行完12条指令需T
执行
分析
取指
2
执行
执行
分析
取指
5 时间
超长指令字处理机时空图
5 时间超标量处理机时空图
△t,相对于标量流水处理机的加速比为:
S2?
T 14 t
?1? ?2.8
?
T2 5?t
3超长指令字处理机中,每4条指令组成一条长指令,共形成3条长指令。执行完12条指令需T=5△t,相对于标量流水处理机的加速比为:
3
超流水处理机的时空图:
S3?
T 14 t
?1? ?2.8
?
T3 5?t
执行
分析
取指
4 55.75 时间
超流水处理机中,每1/4个时钟周期启动一条指令。执行完12条指令需T4=5.75△t,相对于标量流水处理机的加速比为:
S4?
T 14 t
?1? ?2.435
?
T4 5.75?t
设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段,每个阶段所需的时间分别为△t、△t和2△t 。分别求出下列各种情况下,连续执行N条指令所需的时间。
①只有“取指令”与“执行指令”重叠;
②“取指令、”“分析指令”与“执行指令”重叠。参考答案:
①连续执行N条指令所需的时间为:4△t+3(N-1)△t=(3N+1)△t
②连续执行N条指令所需的时间为:4△t+2(N-1)△t=(2N+2)△t
有一指令流水线如下所示
②求连续输入10条指令,该流水线的实际吞吐率和效率;
②该流水线的“瓶颈”在哪一段
您可能关注的文档
- 钢筋接头冷压连接法在桥梁工程中的应用.docx
- 钢筋力学性能检验报告.docx
- 钢筋连接专项施工方案.docx
- 钢筋切断机安全技术交底.docx
- 钢筋砼挡土墙施工技术交底.docx
- 钢筋砼盖板涵施工方案.docx
- 钢筋制作劳务合同.docx
- 钢筋专项施工方案技术交底 .docx
- 钢卷尺检定证书.docx
- 钢琴销售培训.docx
- 浙江省临海市白云高级中学2025届高三历史3月月考试题.doc
- 云南拾谷县第一中学2024_2025学年高二物理上学期10月月考试题.doc
- 2025版高考生物总复习第13讲基因的分离定律教案苏教版.doc
- 湖北省黄石实验高中2024_2025学年高一历史下学期期末考试模拟卷.doc
- 通史版2025版高考历史大一轮复习专题七近代化的曲折发展__中日甲午战争至五四运动前4第4讲从维新思想到新文化运动课后达标检测含解析新人教版.doc
- 2024年高考数学考试大纲解读专题04导数及其应用含解析文.doc
- 河南省许汝平九校联盟2024_2025学年高一语文上学期期末考试试题扫描版无答案.doc
- 江西省吉安市吉水县第二中学2024_2025学年高一历史上学期第二次月考试题.doc
- 北京市平谷区2025届高三政治一模考试试题含解析.doc
- 2025届中考物理第四讲物态变化专项复习测试无答案新人教版.docx
文档评论(0)