基于opencl和计算着色器的异构系统通用计算对比.docVIP

基于opencl和计算着色器的异构系统通用计算对比.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于opencl和计算着色器的异构系统通用计算对比

基于和计算着色器异构系统 摘要:图形处理单元GPU的高性价比吸引了越来越多的学者对其在通用计算方面的研究。OpenGL中的计算着色器和开放式计算语言OpenCL架构都可以实现通用计算性能优化策略分别进行离散卷积算法的测试对比 关键词Comparison on parallel?calculation of heterogeneous?systems between OpenCL and?compute shaders Li Weibin, Wang Yunqiao, Chen shaoqiang (School of Mechanical Engineering and Automation, Beihang University, Beijing 100191,china) Abstract: The perfect performance of GPU attracts more and more research of general calculation, both OpenGL compute shaders and the open computing language OpenCL can achieve general calculation. There is huge difference in design and performance between them. Through the analysis of the characteristics of OpenCL model and computer shaders,?discrete?convolution?algorithm?tests?on different images have been?compared. The comparison results show that the advantages of OpenCL parallel computing ability can be more obvious while the image data more complicated. Key words:OpenCL;eneral calculation;Compute shaders;Discrete?convolution 0 引言 通用计算即为用图形处理单元GPU来处理一些原本CPU可以处理的计算,早在20世纪60年代初它就引起了开发人员的关注,特别是现代图形处理器(GPU),凭借其强大的计算能力和卓越的性价比,吸引了越来越多的对通用计算(GPGPU)的研究[1],涉及到的领域广泛,有流体模拟[2]、视频检测[3]、序列比对[4]、蛋白质分子场、地质模型、神经网络训练等等。然而传统的通用计算主要依靠图形API,这给不熟悉图形应用的用户带来极大的不方便,为此5],给编程带来了很好的灵活性开放标准组织[6]。 图形处理器潜在的计算能力可用于处理与图形无关的任务,为此,OpenGL引入了一种特殊的着色器:计算着色器,这种基于图形的API同样可以像OpenCL一样实现通用程序设计计算,但它对开发人员技能要求比较苛刻,不仅要熟知图形流水线和计算机图形学知识,而且实现通用算法设计时需要大量的技巧,本文主要以的优越性 1 OpenCL框架 在计算机视觉和图像处理中,卷积算法有着至关重要的作用,它经常被用于模板匹配、边缘检测、图像滤波和图像定位等多方面领域。因此,本文通过对均值离散卷积的实现,比较OpenCL和计算着色器的性能。 作为面向异构系统通用目的并行编程的开放免费标准7]。 其完成并行任务流程如图1所示: 图1 OpenCL框架模型 1.1 平台模型 OpenCL通过平台实现主机与设备间的交互操作一个host)可以选择连接一个或几个设备用于负责接收其分发的任务和数据这些设备可以是 1.2 运行模型 N3)的索引空间NDRange,从软件角度看,运行在PE上的内核实例称为工作项,全局ID唯一标识某个工作项,处理相同资源的工作项可以看做是一个工作组,局部ID则标识工作项在工作组中的位置,一个给定工作组中的工作项被分配到单个CU的多个PE并发执行,本文采用处理不同像素大小的图像,对图像采用灰度处理,因此为了充分利用内存资源并达到最优计算效果,将维度数划分为2、工作组数为1,工作项数为图像宽和高的像素大小 。 1.3 设备模型 设备模型指定了执行内核的工作项和工作组可以访问的4块不同的内存区域,如图2所示,全局内存存储容量大,保存着整个设备的数据,主机和工作项都可以读写其中数据,但访问延迟较高;局部内存存储容量有限,保存着工作项的数据,但访问速度快,因此,工作项一般把内核执行结果放入其中,合理地利用局部存储器,对于程序性能的

文档评论(0)

kfcel5460 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档