高性能计算课件.ppt

下载文档 降价啦

310
1
约1万字
约 46页
2018-01-13 发布于河南
举报
版权申诉
保障服务

高性能计算课件.ppt

1、本文档共46页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

高性能计算课件

高性能计算第2讲引论课程安排并行算法设计过程举例并行程序设计 MPI (Message Passing Interface) 并行计算性能分析并行算法研究方法学并行算法的研究学科体系：理论－设计－实现－应用并行算法理论并行算法设计分析并行算法实现并行算法应用研究方法：结构－算法－编程并行计算机体系结构并行算法的设计并行程序设计高性能计算课程目标高性能计算研究现状学习如何面向高性能计算机设计和运行并行程序研究分析影响并行效率的相关问题并行算法研究与实现课程特点并行化技术理论与实践相结合自主学习加强实践授课方式通过课程讲授、课程论文、课堂报告和课堂讨论的方式课程论文：针对所选择的应用问题，基于并行思想和技术进行求解和实现，对计算结果进行总结分析完成论文；在阅读必威体育精装版文献的基础上，分析、总结和完成某个研究领域的综述; 课程论文严格按照论文版面格式，上大学报中文版。课堂报告与课堂讨论要求：每人至少精读论文6篇以上，参考文献不少于20篇；要有自己的评论和见解，不要简单翻译或引用原文的摘要和运行结果；报告内容积极参加讨论要求：结合自己的研究领域，深入查阅必威体育精装版资料，确定选题；认真阅读论文；组织课堂报告，参与课堂讨论；培养严谨的科研作风，严禁抄袭。参考文献并行算法研究方法学陈国良等计算机学报 Vol31No.9 2008 陈国良《并行计算：结构，算法，编程》高等教育出版社，2001.5 高性能计算并行编程技术——MPI并行程序设计都志辉等，清华大学出版社并行程序设计（Designing and Building Parallel Programs) Ian Foster 人民邮电出版社 2002 并行程序设计陆鑫达等译机械工业出版社 Parallel Programming:Techniques and Applications Using Networked Workstation and Parallel Computers Web References Levels of Abstraction 并行算法的一般概念: 定义和分类并行算法一组可同时执行且可互相协作的诸进程的集合。分类并行算法的一般设计过程划分域分解和功能分解通讯任务间的数据交换组合任务的合并使得算法更有效映射将任务分配到处理器，并保持负载平衡并行算法的一般概念: 并行算法的复杂度并行算法复杂性的度量运行时间t(n)：计算时间tc和选路(路由)时间tr 处理器数目p(n) 成本c(n)：c(n)=t(n)×p(n) 成本最优性：若c(n)等于在最坏情形下串行算法所需要的时间，则并行算法是成本最优的。加速比Sp(n)：Sp(n)=ts(n)/tp(n)，其中ts(n)为求解问题的最快的串行算法在最坏情形下所需的运行时间，tp(n)为求解同一问题的并行算法在最坏情形下的运行时间。注：(1)加速比Sp(n)反映算法的并行性对运行时间的改进程度。 (2)若Sp(n)=p(n)，则达到线性加速；若Sp(n)p(n)，则为超线性加速(一般出现在某些特殊的应用中，如并行有哪些信誉好的足球投注网站等)。并行效率Ep(n)：Ep(n)=Sp(n)/p(n)， 0Ep(n)=1 注：反映了并行系统中处理器的利用程度。工作量(或运算量) W(n)：并行算法所执行的总操作步数。(与处理器的数目无关) 均匀划分技术划分方法 n个元素A[1..n]分成p组，每组A[(i-1)n/p+1..in/p]，i=1~p 示例：MIMD-SM模型上的PSRS排序 begin (1)均匀划分：将n个元素A[1..n]均匀划分成p段，每个pi处理 A[(i-1)n/p+1..in/p] (2)局部排序：pi调用串行排序算法对A[(i-1)n/p+1..in/p]排序 (3)选取样本：pi从其有序子序列A[(i-1)n/p+1..in/p]中选取p个样本元素 (4)样本排序：用一台处理器对p2个样本元素进行串行排序 (5)选择主元：用一台处理器从排好序的样本序列中选取p-1个主元，并播送给其他pi (6)主元划分：pi按主元将有序段A[(i-1)n/p+1..in/p]划分成p段 (7)全局交换：各