网站大量收购闲置独家精品文档,联系QQ:2885784924

集群作业理系统简介.ppt

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* ASIPP 集群作业管理系统简介 报告人:罗正平 导 师:肖炳甲研究员 报告主要内容 1、集群简介 2、作业管理系统PBS简介 3、作业脚本示例 1 集群简介 集群是一组独立的计算机(节点)的集合体,节点间通过高性能的互连网络连接;各节点除了可以作为一个单一的计算资源供交互式用户使用外,还可以协同工作并表现为一个单一的、集中的计算资源供并行计算任务使用。 机群的各节点都是一个完整的系统:工作站,PC机或SMP机器; 互连网络通常使用商品化网络,如以太网、FDDI、ATM等; 网络接口与节点的I/O总线松耦合相连; 各节点通常有一个本地磁盘; 各节点有自己的完整的操作系统。 各节点除了可以作为一个单一的计算资源供交互式用户使用外,还可以 协同工作并表现为一个单一的、集中的计算资源供并行计算任务使用。 特征: Internet 1 集群简介—Ctrldata Cluster(.8) 管理节点配置: CPU:Intel(R) Xeon(R) 1.6G 内存:4G(4?1.0G) 系统:Linux AS4.0 计算节点配置: CPU: Intel(R) Xeon(R) 3.0G 内存: 4G(4?1.0G) 系统:Linux AS4.0 2 作业管理系统---PBS 最初由NASA在20世纪90年代早期开发 面向集群系统提供有效的作业管理服务 目前有两个版本:OpenPBS(开源)和PBSPro(商业) CHESS集群管理系统集成了PBS系列管理软件TORQUE。 PBS: Portable Batch System TORQUE:Tera-scale Open-source Resource and QUEue manager 2 作业管理系统---PBS特点 易用性:PBS为所有资源提供统一的借口,易于配置,作业调度灵活 移植性:用于shell和批处理等各种环境 适配性:适配与各种管理策略,提供可扩展的认证和安全模型 灵活性:支持交互、批处理、串行及并行作业 扩展性:标准PBS支持约300个节点,满足集群需要 TORQUE: 基于PBS项目的开源软件,可以认为是开源的OpenPBS的改进版。其优点有: 扩展性强:TORQUE可以支持超过1500个节点 容错性好:修正了大量的bug,提供更多故障支持 2 作业管理系统---PBS结构 PBS Server:运行于集群的管理节点。创建并接受作业、修改作业、激活调度器(PBS Scheduler)以及通知PBS执行器(PBS Moms)执行作业 PBS Scheduler:根据资源管理器获知各个节点的资源状况和系统的作业信息生成相应的作业优先级列表 PBS Moms:每个节点均有一个后台进程,该进程真正启动和停止提交到该节点的作业 2 作业管理系统---PBS作业会话实现 client server scheduler 1 7 2 3 4 5 6 mom mom mom mom mom mom mom mom mom qsub 2 作业管理系统---PBS常用命令 作业提交命令---qsub 命令格式: qsub my_script 返回信息: 作业ID号 2 作业管理系统---PBS常用命令 作业状态检查命令—qstat 命令格式:qstat -f 2 作业管理系统---PBS常用命令 作业挂起命令---qhold 命令格式: qsub job_id 作业删除命令---qdel 命令格式: dsel job_id 详细信息请查询PBS使用指南 3 作业脚本示例—runefit.pbs #PBS -S /bin/bash #PBS -o out_runefit #PBS -e err_runefit #PBS -l nodes=4:ppn=2 echo ------------------------------------------------- echo -n Job is running on node ; cat $PBS_NODEFILE echo -------------------------------------------------- echo PBS: qsub is running on $PBS_O_HOST echo PBS: originating queue is $PBS_O_QUEUE echo PBS: executing queue is $PBS_QUEUE echo PBS: working directory is $PBS_O_WORKDIR echo PBS: execution mode is $PBS_ENVIRONMENT echo PBS: job identi

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档