体系结构第3章 第5讲.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
体系结构第3章 第5讲

* * 第二步改进,这次分支结果在ID段有效!!! * 分支延迟指令的含义? * * * 硬件or软件的策略? * * * * 注意值为1.0的位置 * * * 定向不一定是相邻指令 * 访存时间长是实际情况。 * * 全部定向通路? * * * * 反馈导致了大部分初始化间隔时间。 * 表3.7 各种减少分支损失方法的效果 调度方法 每条分支指令的 平均分支损失 暂停流水线 预测分支成功 每条条件分支指 令的分支损失 预测分支失败 1.00 延迟分支 每条无条 件分支指 令的损失 具有分支暂停 的有效 CPI 浮点 平均 整型 平均 整型 平均 整型 平均 浮点 平均 浮点 平均 1.00 1.00 0.62 0.25 1.00 1.00 1.00 1.00 1.00 0.69 0.21 1.00 1.17 1.15 1.00 1.17 1.15 0.74 1.12 1.11 0.70 1.00 0.35 0.00 0.30 1.04 1.04 Earle锁存器 1965年由J.G.Earle发明 优点 对时钟扭曲不敏感(相对而言),一般是两级门延迟,避免了数据通过锁存器时可能产生的时钟扭曲 在锁存器中可以执行两级逻辑运算,而不会增加锁存器的延迟时间,可以隐藏锁存器产生的额外开销 表3.9 R4000浮点流水线中8个流水段 流水段 功能部件 描述 A 浮点加法器 尾数加 D 浮点除法器 除法 E 浮点乘法器 例外测试 M 浮点乘法器 乘法第一阶段 N 浮点乘法器 乘法第二阶段 R 浮点加法器 舍入 S 浮点加法器 操作数移位 U 展开浮点数 表3.10 双精度浮点操作指令延迟、初始化间隔和流水段的使用情况 浮点指令 延迟 初始化间隔 使用的流水段 加、减 4 3 U,S+A,A+R,R+S 乘 8 4 U,E+M,M,M,M,N,N+A,R 除 36 35 U,A,R,D28,D+A,D+R,D+A,D+R,A,R 求平方根 112 111 U,E,(A+R)108,A,R 取反 2 1 U,S 求绝对值 2 1 U,S 浮点比较 3 2 U,A,R 表3.11 暂停对R4000流水线CPI的影响 整数平均: 流水线CPI 1.54 载入暂停时钟周期数 0.16 分支暂停时钟周期数 0.38 浮点结果暂停时钟周期数 0.00 浮点结构性暂停时钟周期数 0.00 浮点平均: 流水线CPI 2.48 载入暂停时钟周期数 0.10 分支暂停时钟周期数 0.33 浮点结果暂停时钟周期数 0.95 浮点结构性暂停时钟周期数 0.18 谢谢! * 重点:3.2 3.3 * 引起更大暂停的另一类相关。 没有控制流指令的指令集机器是很不好用的。 在事务处理应用中,分支跳转等指令占有相当大的比重。 * 两步改进!注意与书上结构的对应,每步改进都有优缺点。 * 为什么要分析这样的概率? 定夺条件分支指令的重要性; 向前和向后?成功或不成功?有什么启示? * 寻求不同的减少流水线分支损失的方法。 实际发生的成功分支多,就应该在硬件上预测成功,反之则预测失败。 所谓预测,就是在硬件执行时把分支当作全部成功或全部失败。 * 延迟分支则涉及软件的调度。 * 详细区分三种调度方法。 注意这三种方法中编译器的作用何在? 硬件需要怎样的配合? * 简单的分支开销评测方法。 * 一个示例。MIPS系列结构的介绍。 * 结构不同,定向和暂停机制所对应的硬件结构也不同。 * 这里请不要注意分支结构的细节,而是关注延迟槽。 * 主要了解部件流水线的构成 * 实际的流水线性能分析结果与理想的MIPS有何不同? * * * 第一种改进,注意分支结果在EX段有效。 * 比例悬殊很大? * 成功的概率也很大。 计算机体系结构 * 计算机体系结构 * 国家精品资源共享课程:计算机体系结构 第三章:流水线技术 国防科技大学计算机学院 主讲人: 教授 第三章 流水线技术 3.1 流水线基本概念 3.2 MIPS基本流水线 3.3 流水线中的相关 3.4 实例分析:MIPS R4000 3.5 向量处理机 本章内容 1. 分支指令的实现 一旦分支转移成功,正确的地址要在Mem段的末尾才会被写入PC 一旦ID段检测到分支指令,就暂停执行其后的指令,直到分支指令达到Mem段,确定新的PC为止 分支转移成功将导致MIPS流水线暂停3个周期 3.3.3 流水线的控制相关 2. 减少分支开销的途径 两个基本途径:同时采用,缺一不可! 在流水线中尽早判断分支转移是否成功 转移成功时,尽早计算出转移目标地址 经改

您可能关注的文档

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档