- 1、本文档共67页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
现代密码学理论和实践之五
Overview;;矩阵乘法并行实现方法;简单并行分块乘法;Cannon乘法;Cannon乘法;Cannon乘法;Fox乘法;Fox乘法;DNS乘法;;示例
C00=1×(-5)+2×7=9
C01=1×(-6)+2×8=10
C10=3×(-5)+4×7=13
C11=3×(-6)+4×8=14
;算法描述:
//令r(m)表示r的第m位取反;
//{p, rm=d}表示r(0≤r≤p-1)的集合, 这里r的二
//进制第m位为d;
//输入: An×n, Bn×n; 输出: Cn×n
Begin //以n=2, p=8=23举例, q=1, r=(r2r1r0)2
(1)for m=3q-1 to 2q do //按i维复制A,B, m=2
for all r in {p, rm=0} par-do //r2=0的r
(1.1) Ar(m) ? Ar //A(100)?A(000)等
(1.2) Br(m) ? Br //B(100)?B(000)等
endfor
endfor
(2)for m=q-1 to 0 do //按k维复制A, m=0
for all r in {p, rm= r2q+m} par-do //r0=r2的r
Ar(m) ? Ar //A(001)?A(000),A(100)?A(101)
endfor //A(011)?A(010),A(110)?A(111)
endfor;Overview;十二、并行程序设计基础;教学和考核要点;并行程序设计基础;并行程序设计概述;1 并行程序设计难的原因;并行程序开发策略;2 并行语言的构造方法;;3 并行性问题;并行块
parbegin S1 S2 S3 …….Sn parend
S1 S2 S3 …….Sn可以是不同的代码
并行循环: 当并行块中所有进程共享相同代码时
parbegin S1 S2 S3 …….Sn parend
S1 S2 S3 …….Sn是相同代码
简化为
parfor (i=1; i=n, i++) S(i);用单代码方法说明SPMD
要说明以下SPMD程序:
parfor (i=0; i=N, i++) foo(i)
用户需写一个以下程序:
pid=my_process_id();
numproc=number_of _processes();
parfor (i=pid; i=N, i=i+numproc) foo(i)
此程序经编译后生成可执行程序A, 用shell脚本将它加载到N个处理结点上:
run A –numnodes N;用SPMD伪造MPMD
要说明以下MPMD程序:
parbegin S1 S2 S3 parend
可以用以下SPMD程序:
parfor (i=0; i3, i++) {
if (i=0) S1
if (i=1) S2
if (i=2) S3
}
因此, 对于可扩展并行机来说, 只要支持SPMD就足够了;3.2 静态和动态并行性
程序的结构: 由它的组成部分构成程序的方法;Process A:
begin
Z:=1
fork(B);
T:=foo(3);
end;3.3 进程编组
目的:支持进程间的交互,常把需要交互的进程调度在同一组中
一个进程组成员由:组标识符+ 成员序号 唯一确定.
3.4 划???与分配
原则: 使系统大部分时间忙于计算, 而不是闲置或忙于交互; 同时不牺牲并行性(度).
划分: 切割数据和工作负载
分配:将划分好的数据和工作负载映射到计算结点(处理器)上
分配方式
显式分配: 由用户指定数据和负载如何加载
隐式分配:由编译器和运行时支持系统决定
就近分配原则:进程所需的数据靠近使用它的进程代码;并行度(Degree of Parallelism, DOP):同时执行的分进程数.
并行粒度(Granularity): 两次并行或交互操作之间所执行的计算负载.
指令级并行
块级并行
进程级并行
任务级并行
并行度与并行粒度大小常互为倒数: 增大粒度会减小并行度.
增加并行度会增加系统(同步)开销 ;并行层次与代码粒度;并行层次;4 交互/通信问题;同步:导致进程间相互
您可能关注的文档
最近下载
- DB4403_T 77-2024 电动汽车充电安全监控平台数据采集规范.docx
- 基层网络舆情监测工作的实践与思考.docx VIP
- 加强政治机关建设提升机关工作质量.pptx VIP
- 作业3:《windows服务器基础配置与局域网组建》工学一体化课程学习任务设计.docx VIP
- 某小区供配电系统设计本科生毕业设计论文.doc VIP
- DG_TJ 08-2242-2023 民用建筑外窗应用技术标准.docx
- 胶带简介介绍.ppt
- 文化创意产品设计开发合同.doc VIP
- 瓦工:高级瓦工(强化练习).docx VIP
- 作业11:《windows服务器基础配置与局域网组建》工学一体化课程教学进度计划表.docx VIP
文档评论(0)