将向量数据表示和流水线技术结合起来,构成向量流水处理.ppt

将向量数据表示和流水线技术结合起来,构成向量流水处理.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
将向量数据表示和流水线技术结合起来,构成向量流水处理

将向量数据表示和流水线技术结合起来,构成向量流水处理机,简称向量处理机(Vector Processor) 向量的流水处理 向量流水处理机 向量的流水处理 提高流水性能方法: 增加流水线段数,以减少Δt 每个时钟同时启动多条指令 减少相关,减少功能变换次数,增加处理指令条数。 向量的流水处理(续) 向量操作特点 向量元素间操作相互独立,且为相同操作 相当于标量循环,对指令带宽的访问要求不高 可采用多体交叉存储器,减少访存延迟。 向量操作很适合于流水处理或并行处理。 向量的流水处理(续) 向量处理过程 置VL、VM、A 取向量到V 运算。 向量的分量间采取的是流水方式。 并行处理机(SIMD)处理向量时采取的是并行方式。 向量的流水处理(续) 向量处理工作方式 如:D=A×(B+C) 横向加工:bi+ci-k, k*ai-di 产生N次相关,2N次功能切换,适合标量循环 纵向加工:bi+ci-ki, ki*ai-di 产生1次相关,1次功能切换,可流水处理 纵横处理:对向量分组,组内纵向、组间横向处理 向量流水处理机 向量流水处理机的指令系统 向量流水处理机的结构 超级向量流水处理机举例 向量流水处理机的指令系统 包含有向量型和标量型两类指令 向量型运算类指令 向量V1运算得向量V2,如V2=SIN(V1) 向量V运算得标量S,如 向量V1与向量V2运算得向量V3,V3=V1^V2 向量V1与标量S运算得向量V2,V2=S*V1 特殊操作指令 向量比较指令 向量压缩指令 归并指令 向量传送指令 向量流水处理机的结构 1972年首次交付使用CRAY-1向量流水处理机 分布异构型多处理机系统,由中央处理机、诊断维护控制处理机、大容量磁盘存储子系统、前端处理机组成 6个流水线单功能部件:整数加、逻辑运算、移位、浮点加、浮点乘和浮点迭代求倒数 向量寄存器由512个64位寄存器组成,分成8组 超级向量流水处理机举例 1972年成立CRAY公司,至今生产了400台以上的超级计算机 1979年CRAY-1S,CRAY-1改进型,有10条流水线 1983年CRAY X-MP,用4台CRAY-1 1985年CRAY-2S 1988年CRAY Y-MP,8台处理机 1991年CRAY Y-MP C-90 1996年12月,克雷研究公司也被SGI公司以7.5亿美元收购 2000年,被Tera公司合并,同年更名Cray 目前产品:MTA、SV1、SX_6、T3E 2002年Cray X1。运算速度最高为每秒52万亿次,支持65.5TB存储器。 宣布了在2010年以前实现能够连续地处理每秒1000万亿次 Cray公司称,他们将在2008年使用四核心的AMD Opteron处理器建造XT4超级计算机,并将在2009年接近1Pflops(每秒1000万亿次浮点运算)能力。 网址: 超级向量流水处理机举例(续) CDC公司1973年推出第一台超级计算机STAR-100 1964年CDC-6600 RISC特征 1982年 CYBER 205 1999年 被Syntegra收购 ETA10:8个CPU 网址: §3 指令级高度并行的超级处理机 超标量处理机 超流水线处理机 超标量超流水线处理机 超长指令字处理机 超标量处理机 采用多指令流水线(度=m) 配置多套功能部件、指令译码电路和多组总线,并且寄存器也备有多个端口和多组总线。 适合于求解稀疏向量、矩阵 IBM RS/6000、DEC 21064、Intel i960CA、Tandem Cyclone(飓风)等 超标量处理机(续) 超标量处理机基本结构 一般流水线处理机: 一条指令流水线 一个多功能操作部件,每个时钟周期平均执行指令的条数小于1。 多操作部件处理机: 一条指令流水线 多个独立的操作部件,操作部件可以采用流水线,也可以不流水 多操作部件处理机的指令级并行度小于1 超标量处理机典型结构: 多条指令流水线 进的超标量处理机有:定点处理部件CPU,浮点处理部件FPU,图形加速部件GPU 大量的通用寄存器,两个一级高速Cache 超标量处理机的指令级并行度大于1 举例: Motorola公司的MC88110 10个操作部件 两个寄存器堆:整数部件通用寄存器堆,32个32位寄存器;浮点部件扩展寄存器堆,32个80位寄存器。每个寄存器堆有8个端口,分别与8条内部总线相连接,有一个缓冲深度为4的先行读数栈和一个缓冲深度为3的后行写数栈。 两个独立的高速Cache中,各为8KB,采用两路组相联方式。 转移目标指令Cache,在有两路分支时,存放其中一路分支上的指令 超标量处理机MC88110的结构 单发射与多发射 单发射处理机: 每个周期只取一条指令、只译码

文档评论(0)

5201314118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065201001000004

1亿VIP精品文档

相关文档