基于CUDA架构的并行运算技术.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于CUDA架构的并行运算技术,gpu高性能运算之cuda,cuda并行程序设计pdf,cuda并行程序设计,cuda并行计算举例,cuda并行,cuda并行计算,cuda动态并行,cuda并行计算原则,cuda流并行

全国抗恶劣环境计算机第十九届学术年会论文集 基于CUDA架构的并行运算技术 王岩海俞利叶旭呜 摘要:现代社会与经济的发展对运算密集型的应用程序执行速度有着越来越高的要求。而单核CPU的 运算频率由于受硅材料的物理限制,主频已不可能大幅提高:尽管近年来一些多核CPU的出现提升了运 算能力,但是受于CPU通用性的要求,并不能使之适合于大规模的并行数据计算,即无法使全部CPU内 核阵列同步并且协调运算。以前传统的解决方法是采用服务器集群运算,但是存在的缺点是价格昂贵, 体积巨大。因此,一些公司借鉴GPU(图形处理器)的强大浮点处理能力,更新了GPU的架构,使之能 够适应通用编程操作,必威体育精装版的解决方案以NVIDIA公司提出的CUDA架构为代表,本文简单介绍并探讨了 CUDA并行运算的架构与特点。 关键词;并行处理多核 图像匹配CUDA 1概述 领域…。标准CPU架构的特长是管理多个离散的任 UnifiedDeviceArchi— 务,但是有些任务能够被细分为多个更小的单位 CUDA是Compute tecture(统一计算架构)的简称,是NVIDIA公并且可以被并行化,CPU在处理这些任务的时候并 司提出的建立在GPU(图形处理单元)基础之上的没有突出的性能优势,但这恰恰就正好是适合GPU 通用计算开发平台,它是一个全新的软硬件架构, 解决的问题类型。对于快速、廉价的解决这一类 可以将GPU视为一个并行数据计算的设备,对所 问题,GPU有着相当大的潜力可以发挥。GPU计算 进行的计算进行分配和管理,计算难题。利用CUDA可以使得PC和工作站具有超级计算的能力。以 200 能够充分的将GPU的高计算能力开发出来,并使 NvIDIA公司主流产品GeForceGTX GPU为例, 得GPU的计算能力获得更多的应用。 处理器核心数量为240,核心频率为1242MHz。如 图1所示。GPU计算的目标是充分利用GPU先天的 2 GPU资源 巨大计算能力,以解决在高性能计算领域内许多 相当困难但很重要的问题。 CPU和操作系统是现代PC的动力提供者,并 为用户解决了数值计算这个有时困难到令人无法 相信的问题。在你使用电脑,一边听音乐、浏览 3 GPU计算解决方案 网站、一边阅读电子邮件的同时,操作系统会跟 3.1硬件平台 踪记录你的所有活动,并与后台交流信息、将你 NVIDIA提供了TeslaGPU计算系统,具有工 使用到的信息组织起来,尽管CPU一次只能执行 作站以及灵活的架式服务器解决方案。作为一个 多个独立任务中的一个,但是由于其运行速度足 工作站的附属,具有PCIExpress总线,同时支 够快,所以这一系列任务看上去是同时执行。而 持桌面式和架装式配置。以TeslaS1070为例, 对新一代多核CPU来说,每个核心都可以真正同 时的执行更多的任务。 个计算核心共计960个计算核心,单精度浮点性 另外一种不同类型的计算问题一一并行计 能可达4.14TFlops。 算,却一直局限在大型服务器集群和超型计算机 收稿日期:2009—07-02 全周抗g劣g境“算机第十九Ⅻ学来年☆论立集 图l4棱CPU与GPU白匀对№ 3.2CUDA GPU计算软件 此处需要解决的问题为6P(}PU要求使用图形编 图形芯片是初用作固定功能图形流水处理。 程语言来对GPU(图形处理器)进行编程.如 随着时问的推移,这些图形芯片的町编程性日益

文档评论(0)

tianma2015 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档