网站大量收购独家精品文档,联系QQ:2885784924

chp5-4_流水线1讲述.ppt

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 5.8 RISC CPU 几个问题: 怎样判断能否发射呢? 可以采用计分牌的方法 如何保证按序完成? FIFO指令队列 如何对待控制相关(转移指令)? 采用延迟转移法和目标指令cache法 * 5.8 RISC CPU 计分牌: 计分牌是一个位向量、每一位对应寄存器堆中的一个寄存器。 指令发射时,目的寄存器在计分牌中相应位为1;写回后清0 判断指令可否发射的条件是: 该指令的所有目的寄存器、源寄存器在向量位中对应的位都为0 否则,等待这些位清除 * 5.8 RISC CPU FIFO队列 FIFO队列称为历史缓冲器,每当一条指令发射后,副本传入FIFO队列队尾 只有当前面的指令执行完毕,才到达队首, 执行完毕后,离开队列 * 5.8 RISC CPU 延迟转移法 可选 如果采用延迟转移选项,则转移指令后的转移延迟时间内指令被发射 否则,指令照常发送 指令Cache(TIC)法 是一个32位的全相联Cache,用来保存转移路径的前两条指令 * 5.8 RISC CPU 例5 超标量流水线结构如下 * 5.8 RISC CPU I1 LDA R1, A I2 ADD R2, R1 I3 ADD R3, R4 I4 MUL R4, R5 I5 LDA R6, B I6 MUL R6, R7 画出按序完成各段推进情况图 画出按序完成流水线时空图 RAW WAR WAW * 5.8 RISC CPU I6 * 5.8 RISC CPU * 5.9 多媒体 CPU 多媒体概念 指利用计算机来综合、集成地处理文字、图形、图象、声音、视频、动画等媒体,从而形成的一种全新的信息传播和处理的计算机技术。主要特征: 信息表示的数字化 处理的集成性 系统的交互性 * 5.9 多媒体 CPU 主要技术问题 压缩和解压缩技术 静态 640*480的256色图象约占640*480*1B=307200B=300K 640*480的24Bit彩色图象约占640*480B*3=921600B=900K 动态 每秒钟30桢(播放256色) 则每秒钟处理300K*30=9M,而ISA总线的传输率只有5MBPS 结论:多媒体信息量大,给信息处理和传输带来了困难 * 5.9 多媒体 CPU 解决方法: 压缩技术 JPEG(Joint Photographic Experts Group MPEG(Moving Picture group) 软件技术 多媒体OS 多媒体处理软件 硬件技术 MMX(多媒体扩展技术) 动态执行技术 * 5.9 多媒体 CPU MMX(多媒体扩展技术) MMX是Intel为增强处理器的多媒体能力而提出的解决方案,它是57个多媒体指令集合。这些指令是为高效地处理视频、声音和图形数据而专门设计的 Intel使用SIMD(单指令流,多数据流)过程来实现这些多媒体指令。 * 5.9 多媒体 CPU 多媒体和通信应用中经常使用重复运行的循环,这些循环只占程序代码的10%或更少,却要占用多达90%的执行时间。 SIMD允许一条指令在多个数据上进行相同的操作。由于循环是打乱CPU内部流水线,降低CPU执行效率的一个重要因素, MMX指令,减少了循环,能大大提高原来存在大量计算性循环的视频、声音和图象等多媒体应用的性能。 * 5.9 多媒体 CPU MMX指令处理的数据类型称作分组数据(packet data),每个分组数据总是64位的。 8个字节 4个16位字 2个32位双字 一个64位数据 * 5.9 多媒体 CPU MMX一次可以计算64位数据,而Intel处理器上的通用寄存器是32位的,因此它借用浮点运算器80位的寄存器来存放数据。 虽然借用了浮运算器的寄存器,但数据的处理或运算并不是在浮点运算器中进行,而是在专门的整数处理单元中进行。 8个80位的浮点数据寄存器,在进行浮点运算的时候ST0~ST7 在进行MMX运算的时候,MM0~MM1 从总体上说,MMX指令属于整数指令。(但是这个整数指令可以处理图像、图形、音频、通讯、信号处理等其他功能) * 5.9 多媒体 CPU MMX指令的先进性体现在以下五个方 SIMD结构  饱和运算方式 积和运算方式 比较指令 转换指令 * 5.9 多媒体 CPU SIMD结构: 利用CPU64的带宽,一次可以并行处理8个8位数据,或4个16位数据等 饱和运算: 在运算结果最大值,按最大值计算 运算结果最小值,按最小值计算 不用处理溢出,提高了处理能力 适合于象素数据的处理 * 5.9 多媒体 CPU 在图像处理里经常有(比如说增加亮度)两种灰度值运算后要判断只是否大于255或小于0,根据结果再取255或0,现在只要一条指令。   这几条指令分别是:   PAD

文档评论(0)

5500046 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档