基于TBB和CUDA的MeanShift图像分割技术分析-计算软件与理论专业论文.docxVIP

下载本文档

5
0
约4.82万字
约 55页
2018-12-18 发布于上海
举报
版权申诉

基于TBB和CUDA的MeanShift图像分割技术分析-计算软件与理论专业论文.docx

1、本文档共55页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于TBB和CUDA的MeanShift图像分割技术分析-计算软件与理论专业论文

第一章绪论 1.1 图像处理并行化研究的背景 1.1.1 并行计算机发展的历史沿革串行计算机，是指数据的处理过程是串行的，处理器中只有一个处理单元。并行计算机是指数据的处理过程是并行的，因此有多个数据处理单元同时对数据进行操作，这些处理单元之间通过相互协作和通信来完成处理任务。所以，这些处理器单元之间的协作与通信机制是并行计算机的主要组成部分，长期以来，并行计算机硬件的发展也是围绕着这两方面展开[1]。六十年代初期，出现了磁芯存储器和晶体管，直接导致了存储单元和处理单元变得越来越小，其价格也越来越低，最终导致并行计算机的出现，主要代表有 IBM360 机器。到了六十年代末期，开始出现了同一个处理器上集成多个处理器单元，并且还出现了流水线技术，和仅仅提高处理器的主频相比，极大地提高了并行计算机系统的运算处理能力。到了七十年代中期，自从 CRAY-1 问世以来，向量计算机占据了整个并行计算机市场长达 15 年，CRAY-1 采用精简指令系统，还引入了向量寄存器等技术，主频也有了显著的提高，达到了 80MHZ。到八十年代开始，微处理器技术的高速发展和 SMP（对称多处理技术，Symmetrical Multi-Processing）技术的出现以及 Cache 一致性问题得到解决，使共享存储多处理器得到空前发展。从八十年代中期开始，基于消息传递的并行计算机开始大量出现。八十年代末至九十年代初期，基于共享存储方式的并行计算机开始向着可扩展性方向发展。九十年代以来，当时主流的并行计算机体系结构开始走向融合，属于数据并行类型的 CM-5 机器除大量采用商品化的微处理器以外，还容许用户层的程序相互之间传递一些简单的消息；CRAY T3D 是一台 NUMA(非一致性存储访问结构，Non Uniform Memory Access Achitecture)结构的共享存储体系的并行计算机，同时还具备了全局同步能力、消息队列、并使用了一些技术来减少消息传递的延迟。随着微处理器的商品化、网络设备的发展，以及 MPI（消息传递接口，Message Passing Interface）/PVM(并行虚拟机，Parallel Virtual Machine)/OpenMP(开放多处理，Open Multiple Processing)等并行编程标准的发布，开始出现了机群架构的并行计算机。 IBM SP2 就是机群系统并行机的典型代表，他们采用的是标准商用微处理器，处理器之间通过高速互联网络连接[1]。机群系统降低了利用并行计算机进行并行计算研究的准入门槛，使得并行计算的研究变得越来越流行和普及。 2005 年中期随着 Intel 发布面向个人应用的多核微处理器以来，并行计算机已经进入到了千家万户，并行计算研究的领域开始瞄准多核微处理器，瞄准成千上万的个人电脑和用户。对于运行在其上的计算机软件进行并行化改造以充分利用多核计算机的资源是现实的迫切需求。多核微处理器原则上可以看成是 SMP，是把多个独立的 CPU 芯片集成在一块系统主板上，通过系统总线或者是交叉开关实现处理器芯片间互连以及芯片之间的存储器共享 [2]。由于多核微处理器的成本低，价格只有原来的 SMP 的几十甚至几百分之一，所以使得基于多核微处理器的并行计算研究开始变得异常活跃。 2006 年 11 月，在 NVIDIA 公司推出 Geforce 8800GT 图形处理器后，于 2007 年推出了统一计算设备架构 CUDA (Compute Unified Device Architecture)。由于图形处理器(GPU)从一开始就是为视频处理设计的，因此在高性能计算中具有很大的优势，并且与多核 CPU 的相比不同的是，他们的核心数量众多，一般有上百个运算核心，并且在组织方式上更容易发挥多个核心的并行性，甚至可同时运行上千个线程[3]。CUDA 的提出，使我们可以利用 GPU 的高并行性以及更方便快捷编程的方式，可以最大限度和最好地利用 CUDA[4]。此外，由于 GPU 的低功耗和低价格，使得基于 CUDA 的并行计算的研究近年来也是异军突起。 1.1.2 并行计算机的现实需求人类社会的现实需求对计算机的性能提出了更高要求，在航空航天、遥感图像处理、核爆模拟、工程设计和自动化、油藏模拟等等领域都出了极具挑战性的要求。例如在数值模拟大气运动在进行气象预报时，如果要提高全球气象预报的准确性，就需要在经度、维度和大气层方向的取尽可能地多的采样点，如果在经度方向取 200，纬度方向取 100，大气层方向取 20，就是 200 *100 * 20 ??400000 个网格点。但是目前中期的天气预报就需要取 635 万个采样点，内