- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GPU通用计算研究.kdh
信 息 科 学
GPU 通用计算研究
倪 炜
(南充市第十三中学,四川 南充 637000)
摘 要:由于图形硬件的快速发展,GPU 的通用计算已经成为了一个新的研究领域。分析了GPU 编程模型,介绍了使用图形硬件进行通用计算的方
法,并把一些常用的算法映射到了GPU 上。通过这些算法与CPU 上对应的算法进行比较,分析了使用GPU 进行通用计算的优势和劣势。
关键词:
GPU ;通用计算;图形硬件
1 概述
GPU 的全称是Graphic Process Unit,即图形
处理器。它的主要功能就是进行浮点运算生成三
角形,进行定点处理和着色处理。得益于游戏业的
高速发展,显卡技术的发展达到了前所未有的速
度,它的更新换代的时间明显小于CPU 的更新换
代时间。GPU 的功能更新非常迅速,平均半年便有
新一代的GPU 诞生,运算速度也越来越快。
图2 GPU/CPU 加法计算时间
NVIDIA 必威体育精装版的G80 核心的GPU 拥有128 个标
量浮点运算单元,能以它能够以每秒1 万亿次的
速度执行运算。在计算速度方面GPU 已经远远走
在了CPU 的前面,并且GPU 的价格也相对低廉,
使得运用GPU 进行科学运算具有很高的性价比。
同时可以使用SLI 技术使用多个显卡同时进行科
学运算,计算能力得到成倍提高。
2 GPU 编程模型
图形硬件是专为三维图形设计的,对于类似 图3 GPU 乘法运算时间
于三维图形的应用可以获得较高的性能,比如密
集计算、物理模拟、并行计算等应用。必威体育精装版的研究
表明,GPU 对于数据库类应用也有明显的加速作
用。从NVIDIA 的NV30 核心开始,GPU 开始支持
32 位定点浮点数计算。它和标准的32 位浮点数极
为相似。许多研究机构开始进行GPU 通用计算方
面的研究。 图1 GPU 计算流程
图 4 GPU 最大值运算示意图
3 GPU 计算模型
在计算的时候,使用纹理作为数据的存储的
[2]
空间。在图形硬件中,纹理的大小受到一定的限
制,每一个维度上的宽度最大为4096,一个二维的
纹理能存储数据的最大值为 [4096][4096]。在
OpenGL 中,通常情况下的纹理存在一个二次幂限
制,也就是说纹理的大小必须是,即4*4、8*8、
16*16、32*32 等等。使用ARB_texture_rectangle 图5 GPU 最大值运算示意图 图6 GPU/CPU 排序运算时间
[3]
扩展可以生成任意大小的纹理 ,不受二次幂的限
制。在设置完纹理大小后,还需要设置纹理的其它 以下是几种常用算法在图形硬件上的实现, 乘法在GPU 中的实现就是通过片断着色程序的
几个属性: 测试环境是联想商务台式扬天A6000C,处理器为 并行性来减少外围的两重循环,但它并没有减少
1.重复方式:使用GL_NEAREST 设置纹理, Intel(R).Pentium(R) D.CPU 3.0GHZ 3.0GHZ,512M 实际的运算量,由于矩阵乘法需要大量的计算时
在渲染的时候不进行插值计算。 内存,测试图形卡为NVIDIA Geforce6800GS 和 间,因此数据的传输与计算可以同步进行。具有较
2. 纹理的通道:使用GL_LUMINANCE、
您可能关注的文档
- Dynamical Transition in Sliding Chargedensity Waves with Quenched Disorder.pdf
- Dynamics and Rheology of a Supercooled Polymer Melt in Shear Flow.pdf
- Dynamics and Structural Loading in Wind Turbines.pdf
- Dynamics of a single vortex line in a BoseEinstein condensate.pdf
- Dynamics of cascade threelevel system interacting with the classical and quantized field.pdf
- Dynamics of entanglement between two trapped atoms.pdf
- Dynamics of excitations in a onedimensional Bose liquid.pdf
- Dynamics of FD networks the role of bound states.pdf
- Dynamics Of Hadronization From Nuclear Semi Inclusive Deep Inelastic Scattering.pdf
- Dynamics of interacting neural networks.pdf
- 2024_2025学年高中英语Unit1GrowingupSectionCDevelopingide.docx
- 2024_2025学年高中生物专题1传统发酵技术的应用课题3制作泡菜并检测亚硝酸盐含量教案1新人教版.doc
- 企业创新思维与方法论.pptx
- 2024_2025学年高中物理第五章抛体运动第四节抛体运动的规律教案新人教版必修第二册.doc
- 2024_2025学年高中英语Module6OldandNew单元素能自测课时作业含解析外研版必修3.doc
- 2024_2025学年高中生物模块综合测评含解析苏教版必修3.doc
- 2024_2025学年高中生物专题三胚胎工程学业质量标准检测含解析新人教版选修3.doc
- 2024_2025学年高中生物专题十七生物学实验测评含解析.doc
- 2024_2025学年高中生物第3章植物的激素调节3其他植物激素课后检测含解析新人教版必修3.doc
- 2024_2025学年高中生物课后分层检测案4微生物的实验室培养含解析新人教版选修1.doc
文档评论(0)