tsjm20作业提交及管理说明文档 - 北京师范大学信息科学与技术学院.PPT

tsjm20作业提交及管理说明文档 - 北京师范大学信息科学与技术学院.PPT

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
tsjm20作业提交及管理说明文档 - 北京师范大学信息科学与技术学院

* 北京师范大学并行计算实验室 作业调度 主要内容 一、作业提交流程 二、WEB作业提交及管理 三、命令行作业提交及管理 四、常见问题及错误 作业提交流程 作业提交一览 Ssh至登录节点(0) 新建工作目录(mkdir test) 进入工作目录(cd test 编辑作业提交脚本(vi) 提交作业脚本(qsub) 查看作业运行状态(qstat) WEB作业提交-基本属性 1. 作业提交基本属性:0:8080/TSJM WEB作业提交-基本属性 作业提交基本属性介绍 作业名称 自定义作业名称,用于区分该作业与其他作业(必填,英文) 2. 队列 选择作业所要提交的队列(必选) 资源(必填,串行作业为1:1) 作业运行所需要的资源。以节点数:核数形式列出 如2:4,即需要2个节点,每个节点4个核心 注意:节点数不要超过5,每节点核心不要超过10 工作目录 指定作业运行的工作目录。作业运行产生的中间数据将存放在此目录 作业提交脚本(必填) 指定作业提交脚本(也可以在线编辑) WEB作业提交-高级属性 1. 作业提交高级属性 删除线表示不常用 WEB作业管理 作业列表:当前登录用户所有已提交作业 删除线表示不常用 WEB作业管理 作业管理右键操作 WEB作业管理 查看作业详细信息 WEB作业管理 查看作业输出 WEB作业管理 查看作业调度日志 命令行作业提交准备 一、注意先要申请帐号,获得帐号后,通过远程登录,执行以下操作,完成无密码访问配置: 1:”cp /opt/ssh/ssh-configure/hostfile .” 2:” /opt/ssh/ssh-configure/step1.exp username” 3:” /opt/ssh/ssh-configure/step2.exp username password” 二、服务器集群节点信息: 刀片节点 cu01~cu05 胖节点:fat GPU节点:gpu 管理节点:mu01(禁止在管理节点上运行自己的任务) 命令行作业提交 qsub xx.sh -l nodes=2:ppn=4 需要2个节点,每个节点上4核 -e path 错误信息输出的路径 -o path 正常输出信息输出的路径 -q batch 作业提交队列(目前有batch和gpu两个队列) 作业提交 串行脚本编写 -N 作业名 -l nodes=2:ppn=4 需要2个节点,每个节点4个核 -l nodes=cu01 指定具体计算节点cu01 -l nodes=cu01+cu02 指定具体节点cu01,cu02 注意:提交作业时,1个作业不要占用集群所有资源。如当前6个节点每个节点12个核,不要使用nodes= 作业脚本xx.sh编写如下: #PBS –N job_name #PBS –l nodes=2:ppn=4 #PBS –P zhangsan sleep 1000 作业提交 并行脚本编写(拷贝下面粗体脚本内容,存储为xx.sh) #/bin/bash EXEC=“/home/【你的用户名】/【可执行文件】 ARGS= echo $PBS_NODEFILE cat $PBS_NODEFILE ~/nodefile NP=`cat $PBS_NODEFILE | wc -l` /opt/intel/impi/08/intel64/bin/mpirun -hostfile ~/nodefile -np $NP $EXEC $ARGS cat ~/nodefile 注意:一般情况只要复制上面的脚本,修改红色部分就可以了。不要用中文 作业提交 查询 qstat 无参数 查询所有作业信息 -B 查询服务器状态 -Q 查询队列状态 -n 查询每个作业的基本信息 -f jobid 查询指定作业的详细信息 作业管理 查看作业输出 qpeek jobid 作业管理 删除作业(自己提交的任务) qdel jobid 作业管理 查看所有节点信息 pbsnodes *

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档