- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北京大学 二零零八年春季 *致谢:感谢Intel对本课程项目的资助 本讲主要内容 OpenMP编程简介 OpenMP多线程应用程序编程技术 OpenMP多线程应用程序性能分析 OpenMP编程简介 OpenMP多线程编程发展概况 OpenMP是一种面向共享内存以及分布式共享内存的多处理器多线程并行编程语言 OpenMP是一种能够被用于显示指导多线程、共享内存并行的应用程序编程接口(API) OpenMP具有良好的可移植性 支持多种编程语言 支持多种平台 OpenMP多线程编程基础 OpenMP的编程模型以线程为基础 通过编译指导语句来显示地指导并行化 OpenMP的执行模型采用Fork-Join的形式 在开始时,只有一个叫做主线程的运行线程存在 在运行过程中,当遇到需要进行并行计算的时候,派生出(Fork)线程来执行并行任务 在并行代码结束执行,派生线程退出或挂起,控制流程回到单独的主线程中(Join) 编译指导语句 在编译器编译程序的时候,会识别特定的注释,而这些注释就包含着OpenMP程序的一些语义 在一个无法识别OpenMP语意的普通编译器中,这些注释会被当作普通的注释而被忽略 在C/C++程序中,OpenMP所有编译指导语句以#pragma omp开始,后面跟具体功能指令 运行时库函数 OpenMP运行时函数库主要用以设置和获取执行环境相关的信息 它们当中也包含一系列用以同步的API 使用VS 2005编写OpenMP程序 当前的Visual Studio .Net 2005完全支持OpenMP 2.0标准 通过新的编译器选项 /openmp来支持OpenMP程序的编译和链接 建立一个新的项目 配置项目属性 设置环境变量 OpenMP多线程应用程序编程技术 循环并行化 循环并行化是使用OpenMP来并行化程序的最重要的部分 在C/C++语言中,循环并行化语句的编译指导语句格式如下: #pragma omp parallel for [clause[clause…]] for( index = first ; test_expr ; increment_expr) { body of the loop; } 循环并行化语句的限制 并不是所有的循环语句都能够在其前面加上#pragma omp parallel来实现并行化 并行化的语句必须是for循环语句并具有规范格式 能够推测出循环的次数 for (index = start ; index end ; increment_expr) 在循环过程中不能使用break语句 不能使用goto和return语句从循环中跳出 可以使用continue语句 循环并行化编译指导语句的子句 循环并行化子句可以包含一个或者多个子句来控制循环并行化的实际执行 常见子句有: 作用域子句 控制线程的调度(schedule )子句 动态控制是否并行化(if )子句 进行同步的子句(ordered )子句 控制变量在串行部分与并行部分传递(copyin )子句 循环嵌套 可以将嵌套循环的任意一个循环体进行并行化 循环并行化编译指导语句可以加在任意一个循环之前 对应的最近的循环语句被并行化,其它部分保持不变 控制数据的共享属性 OpenMP程序在同一个共享内存空间上执行 可以任意使用这个共享内存空间上的变量进行线程间的数据传递 OpenMP还允许线程保留自己的私有变量不能让其它线程访问到 使用作用域子句的一些规则 作用域子句作用的变量是已经申明的有名变量 作用域子句在作用到类或者结构的时候,只能作用到类或者结构的整体,而不能只作用域类或者结构的一个部分 一个编译指导语句能够包含多个数据作用域子句 作用域子句只能作用在出现在编译指导语句起作用的语句变量部分 规约操作的并行化 在规约操作中,会反复将一个二元运算符应用在一个变量和另外一个值上,并把结果保存在原变量中 在使用规约操作时,只需在变量前指明规约操作的类型以及规约的变量 # pragma omp parallel for private(arx,ary,n) reduction(+:a,b) for(i=0;in;i++){ a=a+arx[i]; b=b+ary[i]; } 规约操作并行化的限制 并不是所有的操作都能够使用规约操作 所有能够在OpenMP的C/C++语言中出现的规约操作 数据相关性与并行化操作 并不是所有的循环都能够使用#pragma omp parallel for来进行并行化 必须要保证数据两次循环之间不存在数据相关性 数据相关性又被称为数据竞争(Data Race) 当两个线程对同一个变量进
文档评论(0)