高性能计算机和开源软件.pptVIP

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高性能计算机和开源软件

高性能计算机和开源软件 霍志刚 高性能计算机研究中心 中国科学院计算技术研究所 2009年1月13日 内容提纲 讲演目的 曙光系列高性能计算机简介 高性能计算与开源软件 1990.03 建立 曙光一号 1990.05 准备 四个大组建立 总体方案确立 1992.03 攻坚 人生能有几回搏 “洋五七干校” 1993.11 应用 应用试算 推广 援外 产业化 1994年3月 曙光一号并行计算机作为代表性科技成就被李鹏总理写入政府工作报告 中国第一台对称式共享存储多处理机 获得 电子部“93‘电子十大科技成果”奖 中国科学院科技进步特等奖 国家科技进步二等奖 自主研发中断控制器 中国第一个细粒度并行UNIX操作系统 曙光1000 1992春,开始准备曙光1000(东方一号)的研究工作 1993夏,Wormwhole芯片 挫折 1994初,龙山会议 1995.05,顺利通过鉴定 开创我国采用大规模并行体系结构构造超级计算机的技术路线 达到国内当时最高运算速度 获得 中国科学院科技进步特等奖 国家科技进步一等奖 自主研发消息传递编程环境 WRC2008是中国第一个Wormhole互连芯片 1995年6月 曙光公司 曙光2000 第一台出口的高性能计算机,陆续出口到喀麦隆、埃及、尼日利亚、巴基斯坦、伊朗等 获得 中国科学院科技进步一等奖 国家科技进步二等奖 Why cluster? 曙光3000 获得 国家科技进步二等奖 2001年“中国十大科技新闻” 五年来科技的“十大瞬间” 曙光4000 获得 2004年6月TOP500中排名第10位 2003年“中国十大科技新闻” 中国科学院科杰出科技成就奖 国家科技进步二等奖 曙光5000A-系统指标 体系结构:采用星群结构; 处理器:采用低功耗AMD CPU,总CPU核数超过30000个; 系统规模:1920个节点,节点为四路四核SMP; 内存:大于122TB 存储:采用500TB FC盘列,50GB/s I/O性能; 峰值速度:浮点运算能力达到233.5TF; Linpack值:180.6TFlops ; Linpack效率:77.35 % 互连网络:系统通过Infiniband、千兆以太网互连; 通信性能:单向单链路持续带宽 ≥ 2GB/s,消息延迟 1.6us 2008年11月TOP500的TOP10,前十中唯一的一个非美国生产和应用的计算机,前十中有7台用于美国国家安全应用 曙光5000A配置简表 曙光5000A现场照片 IB交换机 IB网互连 曙光5000A的刀片 曙光5000A的CPU Opteron 8347 HE 原生四核 共享2MB L3 TDP: 68W (High-Efficiency), ACP: 55W 大页面支持 特点-高密度 具有自主知识产权的4路4核高密度刀片主板,和世界上第一款7U的10片4路4核64位CPU的工业标准刀片服务器。 刀片服务器采用全内置的ConnectX DDR IB二层交换模块,全内置的管理Ethernet网交换模块。 单机箱40CPU,160核的超高计算密度并实现了单节点内部的并行计算。 特点-高效能 四路刀片和八路胖节点设计,大幅度提升并行应用的并行效率; 单CPU核可直接寻址64GB(刀片)/128GB(胖节点)内存,满足大内存应用的需求; 基于ConnectX的DDR Infiniband互联,胖树无阻塞设计,MPI实测延迟1.6us; 高效并行文件系统提供 50GB/s的IO访问带宽; 特点-高效冷却 采用了机柜水冷系统,既降低对主机机房的要求,降低了机房噪音,又提高冷却系统的效率。 水冷+风冷的设计实现了水电分离,保证了系统的安全性 备份的被动散热系统可以在水冷失效的情况下保证系统的正常运行,提高了系统的稳定性 特点-低功耗 采用低功耗AMD Barcelona处理器,比常规CPU节约30%耗电,全系统因此节电超过200KW; 采用标准DDR2内存设计,比采用FBD内存节电约60%,全系统因此节电超过300KW; 全系统刀片设计,比常规机架式节电约10%,全系统因此节电约60KW; 液冷系统散热技术,比常规空调风冷节约30%的空调耗电,全系统因此节电约60KW; 节能软件的利用,采用节能软件和作业调度相结合,系统全年预计可节约20%的耗电。 机群面临的挑战 HPC开源软件栈 典型开源软件项目 Linux操作系统 典型开源软件项目 OFED Mission of OpenFabrics Alliance (OFA) to develop, distribute and promote a unified, transport-independent, open-source software stack for R

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档