第章当代并行机系统并行计算的基础并行计算共章.ppt

第章当代并行机系统并行计算的基础并行计算共章.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第章当代并行机系统并行计算的基础并行计算共章

现代密码学理论与实践之五 第二章 当代并行机系统 2.1 共享存储多处理机系统 2.1.1 对称多处理机SMP结构特性 2.2 分布存储多计算机系统 2.2.1 大规模并行机MPP结构特性 2.3 机群系统 2.3.1 大规模并行处理系统MPP机群SP2 2.3.2 工作站机群COW 对称多处理机SMP(1) SMP: 采用商用微处理器,通常有片上和片外Cache,基于总线连接,集中式共享存储,UMA结构 例子:SGI Power Challenge, DEC Alpha Server,Dawning 1 对称多处理机SMP(2) 优点 对称性 单地址空间,易编程性,动态负载平衡,无需显示数据分配 高速缓存及其一致性,数据局部性,硬件维持一致性 低通信延迟,Load/Store完成 问题 欠可靠,BUS,OS,SM 通信延迟(相对于CPU),竞争加剧 慢速增加的带宽(MB double/3年,IOB更慢) 不可扩放性---〉CC-NUMA 大规模并行机MPP 成百上千个处理器组成的大规模计算机系统,规模是变化的。 NORMA结构,高带宽低延迟定制互连。 可扩放性:Mem, I/O,平衡设计 系统成本:商用处理器,相对稳定的结构,SMP,分布 通用性和可用性:不同的应用,PVM,MPI,交互,批处理,互连对用户透明,单一系统映象,故障 通信要求 存储器和I/O能力 例子:Intel Option Red IBM SP2 Dawning 1000 典型MPP系统特性比较 MPP所用的高性能CPU特性比较 机群型大规模并行机SP2 设计策略: 机群体系结构 标准环境 标准编程模型 系统可用性 精选的单一系统映像 系统结构: 高性能开关 HPS 多级Ω网络 宽节点、窄节点和窄节点2 工作站机群COW 分布式存储,MIMD,工作站+商用互连网络,每个节点是一个完整的计算机,有自己的磁盘和操作系统,而MPP中只有微内核 优点: 投资风险小 系统结构灵活 性能/价格比高 能充分利用分散的计算资源 可扩放性好 问题 通信性能 并行编程环境 例子:Berkeley NOW,Alpha Farm, FXCOW 典型的机群系统 SMP\MPP\机群比较 国家高性能计算中心(合肥) MPP模型 Intel/Sandia ASCI Option Red IBM SP2 SGI/Cray Origin2000 一个大型样机的配置 9072个处理器,1.8Tflop/s(NSL) 400个处理器,100Gflop/s(MHPCC) 128个处理器,51Gflop/s(NCSA) 问世日期 1996年12月 1994年9月 1996年10月 处理器类型 200MHz, 200Mflop/s Pentium Pro 67MHz,267Mflop/s POWER2 200MHz,400Mflop/s MIPS R10000 节点体系结构 和数据存储器 2个处理器,32到256MB主存,共享磁盘 1个处理器,64MB到2GB本地主存,1GB到14.5GB本地磁盘 2个处理器,64MB到256MB分布共享主存和共享磁盘 互连网络和主存模型 分离两维网孔,NORMA 多级网络,NORMA 胖超立方体网络,CC-NUMA 节点操作系统 轻量级内核(LWK) 完全AIX(IBM UNIX) 微内核Cellular IRIX 自然编程机制 基于PUMA Portals的MPI MPI和PVM Power C, Power Fortran 其他编程模型 Nx,PVM,HPF HPF,Linda MPI,PVM 属性 Pentium Pro PowerPC 602 Alpha 21164A Ultra SPARC II MIPS R10000 工艺 BiCMOS CMOS CMOS CMOS CMOS 晶体管数 5.5M/15.5M 7M 9.6M 5.4M 6.8M 时钟频率 150MHz 133MHz 417MHz 200MHz 200MHz 电压 2.9V 3.3V 2.2V 2.5V 3.3V 功率 20W 30W 20W 28W 30W 字长 32位 64位 64位 64位 64位 I/O 高速缓存 8KB/8KB 32KB/32KB 8KB/8KB 16KB/16KB 32KB/32KB 2级 高速缓存 256KB (多芯片模块) 1~128MB (片外) 96KB (片上) 16MB (片外) 16MB (片外) 执行单元 5个单元 6个单元 4个

您可能关注的文档

文档评论(0)

linsspace + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档