- 1、本文档共125页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]流水线技术_v20
* * * * * * * * * * * * * 载入延迟为两个时钟周期 充分开发指令之间存在的并行性,找出不相关的指令序列,让它们在流水线上重叠并行执行。 增加指令间并行性最简单和最常用的方法 开发循环级并行性——循环的不同迭代之间存在的并行性。 在把循环展开后,通过重命名和指令调度来开发更多的并行性。 4.5 循环展开和指令调度 4.5.1 循环展开和指令调度的基本方法 Title 版本: 编号: 日期:2003年 中国信息安全产品测评认证中心(CNITSEC) * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 3. 超长指令字 VLIW (Very Long Instruction Word) 一种显式指令级并行指令系统 二维程序结构 指令级并行度高 指令级并行技术 VLIW的主要特点 VLIW处理机 目标代码兼容问题 什么是VLIW 1. VLIW (Very Long Instruction Word)的背景 由美国J. A. Fisher教授于1981年首先提出,最初来源于水平微程序 由J. A. Fisher创建的Mutiflow公司研制了的世界上第一台VLIW处理机TRACE28/300。 一条指令中包含有多个能够同时执行的操作,TRACE28/300处理机的一条超长指令中最多有28条可以同时执行的指令。 算法和编译技术是关键 2. 什么是VLIW指令系统 一种显式指令级并行指令系统。 在一条VLIW指令中包含有多个相同或不同的操作字段(每个操作字段的功能相当于一般处理机中的一条指令)。 每个操作字段能够分别独立控制各自的功能部件同时工作。 二维程序结构 指令级并行度高 指令级并行 提出VLIW指令系统的主要目的是要开发程序中的指令级并行性(Instruction Level Parallelism) 1. 超标量(Superscalar)处理机依靠设置多条指令流水线,并通过同时发射多条指令来提高处理机的运算速度 2. 超流水线(Superpipelining)处理机通过分时使用同一条指令流水线的不同部分来提高处理机的运算速度 3. VLIW处理机 VLIW的主要特点 1. 采用显式并行指令计算(EPIC:Explicitly Parallel Instruction Computing)方式。 在VLIW处理机上运行的程序是一个二维指令矩阵,每一行上的所有操作组成一条超长指令,他们之间没有数据相关、控制相关和功能部件冲突,这些指令可以在VLIW处理机上同时执行 超标量处理机和超流水线处理机通常采用隐式并行指令方式。程序是一维线性的指令序列,每条指令中一般只包含一个操作。 2 指令级并行度高 超标量处理机和超流水线处理机的指令级并行度一般为2左右,通常不超过4, 目前多数VLIW处理机的指令级并行度在4至8之间,有的已经达到几十。 由于在VLIW中通过并行编译器来开发程序中的指令级并行性,可以在一个循环、一个函数、甚至整个程序中寻找指令级并行性,而且,可以采用软件流水、循环展开等指令级并行度很高的方法充分开发程序中的多种并行性 3. 硬件结构规整、简单 VLIW处理机主要由很规则的寄存器、存储器、运算部件和数据通路等组成,不规则的控制器很简单,而且,不需要复杂的指令并行调度窗口及多发射机制等。 4. 编译器的实现难度大 VLIW并行编译器主要依靠指令级并行算法、数据相关性分析算法、寄存器分配算法及并行编译技术等来显式开发程序中的指令级并行性,从而提高处理机的运行速度。要研制指令级并行度高的编译器难度很大。 VLIW处理机 1. 安腾(Intanium)处理机 Intel公司与HP公司联合研制 在Intel公司称为IA-64处理机 安腾(Intanium)处理机有自己独立的系统软件和应用软件 2. DAISY (Dynamically Architected Instruction Set from Yorktown) 处理机 由IBM公司研制 采用动态二进制转换技术实现与X86处理机兼容 3. Crusoe处理机 由Transmeta公司研制 已经大量应用于笔记本计算机中,一个重要特点是功耗很低。 采用动态二进制转换技术把X86通用处理机的程序直接映射到Crusoe处理机的VLIW结构中执行。 4. 嵌入式、DSP、JAVA虚拟机 很多专用处理机采用VLIW体系结构 多指令流出—CPI1 —高级流水线 4.4 多指令流出技术 4.4.1 基于静态调度的多流出技术(*) 4.4.2 基于动态调度的多流出技术 4.4.3 超长指令字技术(VLIW)(*) 4.4.4 多流出处理器受到的限制 4.4.5 超流水线处理机(*)
您可能关注的文档
- [工学]模电实验.doc
- [工学]模电实验指导书.doc
- [工学]模拟集成电路系统第1、2章.ppt
- [工学]模电教案2-31.ppt
- [工学]模电知识复习ppt.ppt
- [工学]模电第七章 功率放大器.ppt
- [工学]橡胶生产实习报告.doc
- [工学]模电五版第09章习题.pdf
- [工学]模电第七章演示文稿.ppt
- [工学]模电4版华成英课件8-复习与考试.ppt
- 2023-2024学年江苏省南京一中九年级(上)月考化学试卷(10月份).doc
- 回归课本应用文写作专项任务单(必修第一_三册)-2024届高三英语一轮复习牛津译林版(2020).docx
- 2023-2024学年江苏省南京市鼓楼区金陵中学仙林分校九年级(上)月考化学试卷(10月份).doc
- 2025届长沙一中高三第一次月考数学试卷.docx
- Unit+1错题2024-2025学年牛津译林版七年级英语上册.docx
- 立体几何中的建系求角题型难点分类练习解析版.docx
- 立体几何中的建系求角题型难点分类练习原卷版.docx
- 浙江杭州市第二中学+高考考纲3500词汇练习(语法填空练习)(下).docx
- 江苏省南京二十九中学2023-2024学年九年级上学期月考物理试卷(10月份).docx
- 牛津译林版八上第一次月考考点讲解(教师版).pdf
文档评论(0)