- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
windlx实验报告(共10篇)
windlx实验报告(共10篇)
WinDLX实验报告
WinDLX实验报告(I)
1.实验目的:
1)熟悉计算机流水线基本概念
2)了解DLX基本流水线的各段的功能了解各种不同指令在流水线中的实际流动情况3)对流水线做性能分析
4)了解影响流水线效率的因素——数据相关、结构相关、控制相关,了解相关的种类5)了解决数据相关的方法
2.实验内容:
1)在仿真器上分别运行单条指令:Load指令、Store指令、分支指令、寄存器ALU指令、立即数ALU指令,记录它们在流水线中的执行情况
2)仿真器运行一段无相关的程序,记录执行情况,计算流水线的加速比、吞吐率与效率。
3)在仿真器运行一段程序,统计该程序在流水线中出现的各种相关个数,及其引起的流水线暂停周期数
4)在流水线中设置定向路径来消除数据相关,运行程序并统计在流水线中出现的相关个数,及其引起的流水线暂停??期数
5)通过对程序进行编译优化并结合其他相关解决方法——分支预测与延迟槽,运行程序并统计在流水线中出现的相关个数,及其引起的流水线暂停周期数。
3.实验步骤:
1.)熟悉WinDLX的使用
用WinDLX模拟器执行求最大公约数程序gcm.s 。这个程序说明浮点指令的使用。该程序从标准输入读入两个个整数,求其最大公约数,然后将结果存放在R2寄存器中。该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。
实验结果:
在载入gcm.s和input.s之后,不设置任何断点运行。 a.不采用重新定向技术,得到的结果
b.采用定向技术,得到的结果:
从上面的数据我们可以看出定向的作用:
在定向技术存在的情况下Statistics 窗口中的各种统计数字:总的周期数(186) 和暂停数 (48 RAW, 17 Control, 18 Trap; 83 Total)
在定向技术不存在时候,控制暂停和 Trap 暂停仍然是同样的值,而RAW暂停从48变成了72,总的模拟周期数增加到217。所以定向技术带来的加速比:217/186=1.167DLXforwarded比 DLXnot forwarded 快16.7%。
我们得出结论:使用定向技术可以较明显减少周期暂停提高系统执行效率 2)不相关的程序
以下给出一段代码,为数条不相关指令构成。 ADDI R5, R5, 20 SUBI R4, R4, 0xffffffff AND R3, r5, R4 XOR R7, R3, R7 ADDI R8, R8, 1 ADDI R9, R9, 1 trap 0
在WinDLX中执行的结果如下:
如上图所示:
6条指令一共执行了10个周期,而每个指令都需要5个周期来完成。(trap返回指令不计入其中) 故可得加速比:5*6/10=3
实际吞吐率:流水线由5段组成,完成6条指令,m=5,n=6 T=5△t+(6-1) △t=10△t
Tp=n/T=3/(5△t),即为实际吞吐率。 效率: E=1/(1+(m-1)/n)=TP*△t=3/5
3)存在相关的程序a.数据相关
先给出一个存在数据相关的程序:
addi r3,r3,150 sw0x800,r3 addi r2,r2,0x500 lwr1,0x300(r2) bnez r1,loop addi r1,r1,555 sw0(r2),r1 trap 0
loop: sub r1,r1,1
执行结果时空图:
没有采用定向技术时运行该程序:得到
程序执行了708个周期,数据相关引起的时钟周期RAW stall为308个。 暂停时钟周期数占总执行周期数的百分比=40.10%
采用定向技术时运行该程序:得到
程序执行了611个周期,数据相关引起的时钟周期RAW stall为152个。 暂停时钟周期数占总执行周期数的百分比=24.88%
可见通过定向技术,减少了数据相关,缩短了程序的执行周期,整个性能为原来的1.158倍。 b.结构相关
下面这段程序存在结构相关
addi r1,r1,5 addi r2,r2,6 addi r3,r3,7 addi r4,r4,11 mult r1,r2,r1 mult r3,r4,r2 add r2,r1,r1 trap 0
执行之后得到的clock cycle programe
Statistics:
可见2个结构相关引起了4个stall,占总共20个CYCLE 的21.05%
为了避免结构相关,可以考虑采用资源重复的方法,比如,在流水线机器中设置相互独立的指令存储器和数据存储器,也可以将CACHE分割成指令CACHE 和数据CACHE。
实验总结:
通过本实验,基本掌握了WinDLX模拟
您可能关注的文档
- 2014年智能水表,热量表,燃气表,电表行业分析报告.doc
- 2014年江苏宜兴经济开发区投资发展有限公司债券信用评级报告.doc
- 2014年水库移民局围绕政府工作报告提出目标任务.doc
- 2014年河南省新华书店发行集团有限公司审计报告.doc
- 2014年电子银行报告.doc
- 2014年百货超市零售连锁行业分析报告,百度云.doc
- 2014年电大中国法制史形成性报告册.doc
- 2014年石油行业报告.doc
- 2014年第一季互联网发展状况报告.doc
- 2014年经济分析报告.doc
- 大学生职业规划大赛《新闻学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《应用统计学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《音乐学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《中医学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《信息管理与信息系统专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《汽车服务工程专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《水产养殖学专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《市场营销专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《音乐表演专业》生涯发展展示PPT.pptx
- 大学生职业规划大赛《音乐学专业》生涯发展展示PPT.pptx
文档评论(0)