IBM_P系列小型机日常维护故障定位故障排除手册.doc

IBM_P系列小型机日常维护故障定位故障排除手册.doc

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
IBM_P系列小型机日常维护故障定位故障排除手册概要1

IBM P系列小型机日常维护/故障定位/故障排除 电源接驳: 用符合电流要求的空气开关或其他设备和主机电源线接驳,保证计算机系统的可靠工作应使用稳压电源和UPS,并建议配备发电机组;对于冗于电源的接入,建议采用两路单独输入. 硬件检查 检查服务器、磁阵的安装、电源线、7133和主机接线符合要求。 服务器状态检查及其相关命令 外观状态检查: 1. 当服务器处于启动和正常工作状态时,其前面板上的液晶显示屏上应无信息显示。 2. 当液晶显示器上出现带数字和字母的信息时,说明有硬件告警。可以通过查询相关机型的Service Guide查到相应告警原因,情况严重的,则要立即通知IBM技术专家进行问题排查。 命令状态检查 1、运行lsdev 命令配以各种参数,所列各种设备状态都应为Available。 #lsdev –C –H –S a 列出系统中可用设备。 #lsdev –Cc processor 列出系统中的所有CPU。 #lsdev –Cc memory 列出系统中的所有内存。 #lsdev –Cc disk 列出系统中的所有硬盘。 #lsdev -Cc adapter | grep ent 列出系统中的所有网卡 #lsdev -Cc adapter | grep scsi 列出系统中的所有SCSI卡。 #lsdev -Cc adapter | grep ssa 列出系统中的所有SSA卡。 2、lspv命令 #lspv 显示系统中可用的PV。 #lspv hdiskn 显示hdiskn的具体信息。 #lsdev –Cc pdisk 显示磁盘阵列的硬盘的具体信息。 对SSA硬盘的检测:在对主机进行工作之前可以先把磁盘阵列上电,等主机完全启动后,登录到主机上,运行以下命令“ lsdev –Cc pdisk “,应该可以看到所有SSA硬盘,并且状态应为Available.。 3、 lsattr命令 # lsattr –E –l mem0 列出系统中内存mem0的大小,本项目中内存有4GB。 4 、lsvg命令 #lsvg 列出系统中所有的vg。 #lsvg rootvg 列出rootvg的详细信息。 #lsvg –o 列出激活的vg 5、 oslevel命令 #oslevel 显示操作系统版本信息。 6、 netstat命令 #netstat –in 显示系统中各网卡的配置。可查看网卡的IP配置好了没有。 7、 # diag 命令 通过运行# diag 命令运行硬件诊断程序检测主机内所有硬件,检测结果为 “No trouble found ”显示各部分工作正常。 8、 使用#diag命令 (选择:Task Selection- SSA Service Aids)对SSA硬盘链路连接的校验,可以通过SSA 工具里的Link Verification 来检测。如有必要,可以用 Certify Disk运行硬盘诊断部分进行硬盘的表面分析测试 ,由1% 至100%,检测结果显示主机内置硬盘的所有扇区均读写正常。 9、 lsps –a 查看PAGING SPACE的使用情况 如果使用率超过70%,就需要采取措施。 10、 lsvg –o | lsvg –il | grep –i stale 查看有无stale的lv,如果输入该命令之后有输出结果,就需要采取措施 11、 有否发给root用户的错误报告(mail)。 12、 检查双机状态 lssrc –g cluster 检查ha三个工作进程是否激活,/usr/sbin/cluster/clstat –a检查双机状态是否up,并检查hacmp.out日志,看是否有异常信息。 13、 用vmstat, topas,sar 命令检查系统性能 检查cpu\memoyr\IO ,是否存在性能瓶颈。 14、 检查能否顺利进入CDE界面 如果不能进入的话,要检查/etc/hosts表中有否错误的项目。 15、 用smitty ssaraid 查看磁盘阵列RAID盘的状态是否是Good。 如果是degrade或其他状态表示RAID盘出现问题了 16、 用sysdumpdev –l 查看系统的DUMP设置是否正常。 17、 用instfix –ik | grep ML 当前操作系统补丁版本补丁程序(PTF)是否满足稳定运行的需要。一般要求433操作系统补丁要打到10以上,5.1操作系统补丁要打到5以上 18 、使用df –kP查看磁盘空间占用率 请确保以下文件系统的占用率高于80%立即上

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档