2009多核计算29-32多核GPU.ppt

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2009多核计算29-32多核GPU

多核计算 29-32课 GPU 陈天洲,施青松,胡威 {tzchen, zjsqs, ehu}@ 2010年1月13日,玉泉校区曹西101 agenda GPU架构 典型GPU架构 NviDIA GPU AMD GPU GPGPU技术 GPU编程环境 CUDA OpenCL 高性能计算中的GPU 天河一号案例分析 GPU概念 Graphic Processing Unit 早年ATI称为VPU(Visual Processing Unit) 作为图形加速单元被集成到显卡中 完成浮点操作,协同其他定制的芯片完成图形渲染中特殊的算法和操作 实现了许多图形操作中的基本操作,并且能够直接输出到显示器中 能够从硬件上支持TL(Transform and Lighting,多边形转换与光源处理)的显示芯片 TL是3D渲染中的一个重要部分,其作用是计算多边形的3D位置和处理动态光线效果,也可以称为“几何处理”。 TL是GPU的标志 软加速 2D显示芯片在处理3D图像和特效时依赖CPU处理能力 硬件加速 3D显示芯片将三维图像和特效处理功能集中在显示芯片内 GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时 GPU历史 20世纪70年代,ANTIC芯片,用硬件直接控制图形和文本。 20世纪80年代,Commodore Amiga在视频硬件嵌入了blitter(BLock Image Transger) 1991年,S3 Graphics发布了第一个单芯片2D加速器——S3 86C911 1995年,所有的PC图形芯片都集成了2D加速 20世纪90年代中期,S3 ViRGE、ATI Rage和Matrox Mystique的3D图形芯片 图形API:OpenGL,90年代初期;DirectX,90年代末期 Direct3D 7.0版本中开始支持硬件TL 1999年的GeForce 256是第一块GPU芯片 2000年以后,GPU开始增加可编程的像素渲染引擎 GeForce 3,ATI Radeon 9700 2000年,Hopf在GPU上实现小波变换 2001年,Larsen利用GPU的多纹理技术做矩阵运算 2002年,Harris在GPU上用细胞自动机(CA)仿真各种物理现象,Purcell第一次使用GPU加速光线跟踪算法 2003年,是GPU领域具有里程碑意义的一年,Kruger实现了线性代数操作;Li实现了Lattice Boltzmann的流体仿真;Lefohn实现了Level Set方法等一大批成果 2004年,Govindaraju在数据库领域应用GPU加速取得进展;商业领域,Apple推出支持GPU的视频工具 2006年,首颗DX10 GPU(GeForce 8800)诞生,GPU代替CPU进行更高效的Geometry Shader(几何着色)运算 2007年,主流DX10 GPU全面上市,CPU可不用再承担高清视频解码运算的压力,如今整合GPU都完美支持硬解码 2008年,CUDA架构初露锋芒:PhysX引擎发布,GPU代替CPU和PPU进行物理加速运算;Badaboom、TMPGEnc等软件开始利用GPU的并行计算能力来加速视频编码 2009年,CUDA、OpenCL、DX11 Compute Shader百花齐放,大批应用软件改投GPU门下,GPU已具备取代CPU进行并行计算的能力 形态 独立显卡 集成显卡/主板集成芯片 一般不能很好处理3D图形 GPU和CPU共用系统RAM,两者存在一定的竞争,但一般GPU的访问带宽会根据系统配置自动调节 混合方式 共享系统的RAM,但同时也具有一个较小的专有RAM,它能够弥补系统RAM的延时问题 集成到CPU中 2009年1月AMD公司 “Yukon” ,微处理器“Athlon Neo”和图形处理器“ATI Radeon X1250”集成在一个芯片中 AMD fasion,intel Clarkdale GPGPU/流处理器 异军突起的Clarkdale 2010年1月8日,英特尔发布32纳米westmere,集成32nm双核+45nm图形核心在一个处理器中 英特尔可切换显卡技术 集显性能逼近NVIDIA的低端独显 DX10 DX9以及之前的时代 衡量显卡性能最重要的两个指标就是顶点单元(Vertex shader)和像素单元(pixel shader)的运算能力 通常VS和PS单元更多的显卡性能也越强 DX10规范 微软将VS和PS(还有一个Geometry shader几何渲染器,GS)的功能合并,统一为Unified shader,也称为Stream proceser(流处理器) 统一渲染单元的好处是显而易见的,设计人员不需要再考虑

文档评论(0)

xy88118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档