- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
发表在2004 年11 月期微机发展 Imagine 流处理器 王湘
发表在 2004 年 11 月期微机发展
Imagine 流处理器
1
王湘新 文梅 伍楠 李海燕 李礼 张春元
摘 要 Imagine 流处理器以其在媒体处理上的优势和良好的扩展性,已经成为研究热点。本文着重从不同
角度详细分析了介绍 Imagine 芯片的特点。
关键词 流处理器,流,带宽层次,Imagine
Imagine Stream Processor
Wang xiangxin, Wen Mei, Wu Nan, Li Haiyan, Li Li, Zhang Chunyuan
Abstract With high performance in media processing and good scalability, the Imagine stream processor became
hotspot in research. This paper analyzes characters of the Imagine stream processor from different angles.
key words Stream processor ,Stream, Bandwidth hierarchy, Imagine
0 介绍
传统的微处理器如Iiantium,其运算单元只占芯片面积的6.5%,大部分芯片面积被用于
实现cache、支持分支预测、乱序执行、通讯调度等。关于这一点图形处理器和DSP做得比
较好,一个现代的高端图形加速芯片拥有超过64个浮点ALU和1000个整数ALU ,运算密度
将近是传统微处理器的100倍。在面对密集型运算任务时,运算单元的低占有率带来了运算
速度上的巨大差别。(1GOPS CPU vs. 1TOPS Graphics chip)因此我们面临的问题是如何发
展新的体系结构有效利用这些丰富而廉价的资源,为芯片提供更大规模计算的能力。而如何
有效利用芯片集成能力的提高,换言之就是如何充分利用技术发展带来的丰富而廉价的运算
资源,有效利用芯片面积来计算,是新型微体系结构研究的重要课题。
Imagine 流处理器是 Stanford 大学于2002 年 4 月投片成功的原型芯片,本文分存储层次、
并行性开发、VLSI 工艺特征、芯片性能指标、局限性等几个部分详细剖析 Imagine 流处理
器。
1 Imagine 特点分析[2,3]
图 1 Imagine 处理器及带宽层次
1文梅,女,博士生;研究方向:高性能微处理器体系结构;联系人 e-mail: wxxwm@263.
Imagine 可以看作专门负责流处理的协处理器,其体系结构如图 1 所示,包括以下几大
部件:主机接口、流控制器、流存储系统、微控制器、流寄存器文件(SRF)、8 个运算簇、
[1]
本地寄存器文件(LRF )、网络接口。体系结构和流处理器过程参见文献 。
1.1 三级存储带宽层次
流应用模型对带宽有很高要求,但其数据有量大、持续流入且较少重用等特点。Imagine
提供了 3 级带宽层次来开发流应用模型的带宽特点:片外存储器带宽(2.1GB/s ),SRF 带宽
(25.6GB/s ),运算簇内 LRF 在运算单元间传输带宽(435GB/s )。三级存储带宽层次是流处
理器关键的创新之一,它充分开发了流数据的局域性和并行性,使得体系结构可以提供必要
的指令和数据带宽来有效并行操作多个ALU 。
Imagine的带宽层次在三个层面上开发了数据局域性:
核内数据局域性:对应于LRF。在一个核内,对流中某1个记录的所有操作都在1个ALU
簇内完成,只在操作数读入和最终结果写回时访问SRF。即当流中的某个记录流入ALU
簇后,将对其执行微控制器中的VLIW对应的所有操作,其间所有的操作数和中间结果都
通过簇的内连开关传递并缓存在LRF中,无需访问SRF。由于LRF的带宽远高于SRF,开发
核内数据并行大大减少了对SRF的访问次数,加快了访问速度,缓解了SR
您可能关注的文档
- 技巧班讲义五:作文论证有技巧.pdf
- MDA,CGA,EGA,VGA显示器信号线检测识别.pdf
- 二战GMAT780经验分享(五)之数学、作文、IR复习经验-智课教育.pdf
- 核安全峰会落幕发表公报和工作计划.pdf
- 论文发表经验之如何面对审稿人的建议.pdf
- 2015年北京语言大学翻译硕士汉语写作与百科知识考研真题,考研参考书,考研经验分享.pdf
- 纪念DNA双螺旋结构发表50周年.pdf
- 郭铁成-写作与发表-山东150704.pdf
- GMAT如何拿高分经验分享-智课教育.pdf
- 台大医图公告SCI论文发表荣誉榜说明.pdf
- 第九章 销售与收款循环审计 .pdf
- 1.9《体积单位间的进率》说课(课件)-2024-2025学年六年级上册数学苏教版.pptx
- 长方体和正方体的体积计算(课件)-2023-2024学年人教版五年级数学下册.pptx
- 第二次月考素养提升卷(5~6单元)(试题)-2024-2025学年五年级数学上册人教版.docx
- 4.表内乘法(一)(乘加、乘减)(课件)-2024-2025学年二年级上册数学人教版.pptx
- 表内乘法(7的乘法口诀)(课件)-2024-2025学年二年级上册数学人教版.pptx
- 吨的认识(课件)-2024-2025学年三年级上册数学人教版.pptx
- 期中检测卷(试题)-2024-2025学年五年级上册语文统编版.docx
- 第七单元《扇形统计图》思维拓展练习(课件)-2024-2025学年六年级上册数学人教版.pptx
- 本文中来自ASME BPE标准委员会的现任委员将一一为您答疑解惑 .pdf
文档评论(0)