- 1、本文档共73页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
微处理器第二章体系结构
* * / 32 超标量CPU的体系结构 超标量技术:可在一个时钟周期内对多条指令进行并行处理,使CPI小于1; 特点:处理器中有两个或两个以上的相同的功能部件; 要求操作数之间必须没有相关性; 整数指令 浮点指令 * * 超标量处理机一般概念性结构 instruction fetching 多个流水线读取及转移预测逻辑 instruction decoding 并行译码器,预译码技术 instruction dispatching 动态规划 instruction execution 多个流水线功能单元 instruction completion 暂存结果数据 instruction retiring 真正更新Reg和Mem中的结果数据 * * * / 32 超标量结构机器的例子 两条输入流水线 三条执行流水线 每个时钟周期可从存储器中获取两条指令 用于执行不需要访问存储器的指令 可处理所有需要或不需要访问存储器的指令 可用于进行乘、除类较复杂的算术运算 决定应使用哪一条执行流水线 * * / 32 VLIW处理机 和超标量处理机不同,超长指令字VLIW(Very Long Instruction Word)依靠编译器在编译时找出指令之间潜在的并行性,并通过指令调度把可能出现的数据冲突减少到最小,最后把能并行执行的多条指令组装成一条很长的指令,然后由处理机中多个相互独立的执行部件分别执行长指令中的一个操作,即相当于同时执行多条指令。 VLIW处理机能否成功,很大程度上取决于代码压缩的效率,其编译程序和体系结构的 关系非常密切,缺乏对传 统软件和硬件的兼容,因 而不大适用一般应用领域。 * * * / 32 多机并行系统 大规模并行处理机(MPP)是一种价格昂贵的超级计算机,它由许多CPU通过高速专用互联网络连接。 机群(cluster)由多台同构或异构的独立计算机通过高性能网络或局域网连在一起协同完成特定的并行计算任务。 刀片(blade)通常指包含一个或多个CPU、内存以及网络接口的服务器主板。通常一个刀片柜共享其它外部I/O和电源,而辅助存储器则有距离刀片柜较近的存储服务器提供。 网格(Network)是一组由高速网络连接的不同的计算机系统,可以相互合作也可独立工作。网格计算机将接受中央服务器分配的任务,然后在不忙的时候(如晚上或周末)执行这些任务。 * * / 32 多核处理器 * * / 32 片上网络(NOC) 技术 P处理器 M存储器 C缓存 rni网络接口 S交换开关 Dsp核 re可重构逻辑 L专用逻辑 * * / 32 多线程技术 单片多处理器(Chip MulitProcessor,CMP)问题:晶体管数量、芯片面积及芯片发热量 多线程处理器(Multithreaded Processor) * 计算机体系结构的分类 Flynn分类:根据指令流和数据流的多少进行分类 单指令单数据SISD 单指令多数据SIMD 多指令单数据MISD 多指令多数据MIMD CU控制部件 PU处理部件 MM存储单元 CS为控制流 DS为数据流 IS为指令流 传统的顺序处理机、标量流水线处理机、超标量流水线处理机 阵列处理机、向量处理机 无实际机型对应 多处理机系统 * 计算机系统的性能测定 计算机系统的性能由硬件性能和程序特性决定,通常可利用标准测试程序来测定性能。 用MIPS (Million Instructions Per Second,每秒百万条指令)或MFLOPS(每秒百万次浮点操作)的数值来衡量计算机系统的硬件速度。 用 CPU执行时间T来量化硬软件结合系统的有效速度。 MIPS = f(MHz)/CPI T(s) = (IC × CPI)/f(Hz) f(时钟频率): CPU的基本工作频率 IC(指令数目):运行程序的指令总数 CPI(Cycles Per Instruction):指令执行的平均周期数,可从运行大量测试程序或实际程序产生的统计数据中计算出来 CPI数越小 CPU速度越快 * * / 32 计算机系统性能量度值计算 假设一台计算机的时钟频率是100 MHz(每秒百万周期),具有4种类型的指令,它们的使用率和CPI分别如下表所示。求该计算机的MIPS值以及运行一个具有107条指令的程序所需的CPU时间。 * * / 32 程序的执行过程 取指令、分析指令、执行指令 AB DB ALU 累加器ACC 暂存器 标志寄存器FR 寄存器组 操作控制器OC 指令译码器ID 指令寄存器IR 操作码, 地址码 内部总线 地址缓冲器 数据缓冲器 程序计数器PC 地址译码 读控制 B0H 5CH 04H 2EH 地址 1001H 10
文档评论(0)