- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3SUN小型机错误日志收集-ZTECorporation.doc
IT外购件日志信息收集指南
中兴通讯股份有限公司
ZTE CORPORATION
版本号 提交时间 制作人/审核 内容概述 第一版 2009-4-12 胡文飞 文档讲述了如何收集各品牌小型机及磁阵的报错日志 第二版 2009-9-3 余海、林挺 删除ASMI窗口冗余部分,增加些SUN收集命令,删除冗余图片
1. IBM小型机错误日志收集 3
2. HP小型机错误日志收集 18
3. SUN小型机错误日志收集 24
4. 各品牌存储日志收集(IBM、EMC、HDS) 29
IBM小型机错误日志收集
收集日志分为两种情况,一种是可以进操作系统,一种是不能进操作系统或者未进操作系统时的日志收集。
进入操作系统的日志收集
用snap收集系统信息
Snap是用来收集小型机信息的工具,包括小型机的配置信息,各种IO部件的状态,逻辑卷的信息,报错日志等等。IBM有一个自己的网页分析工具,当我们的机器出问题向IBM报修后,IBM会让我们收集日志后将日志做分析,得出故障的定位。具体方法如下:
AIX系统发生网络问题问题: # snap -r
# snap -gbc
完成后,通过ftp到主机上的生成的路径下 (用binary方式,在命令行下执行:bin) 然后用GET命令或者ftp工具取得/tmp/ibmsupt/snap.pax.Z 文件
将这个snap.pax.Z发送给负责的工程师;
另外,如果是Hacmp有问题则需要收集hacmp的cluster.log文件和hacmp.out文件
1、more /tmp/hacmp.out;
2、more /var/tmp/hacmp/log/hacmp.out;
3、more /var/tmp/hacmp/log/hacmp.out*(*代表数字);
做snap收集日志的时候/tmp文件系统需要一定空间做为临时数据的存放,如果提示空间不够了,则建议将/tmp文件系统扩大。
errpt收集机器的报错日志
IBM AIX操作系统的错误日志绝大多数情况下都体现在errpt命令中,包括硬件故障,面板报警,链路故障及软件报警等。
errpt 命令的使用(普通用户权限也可使用):
#errpt |more 列出简短出错信息
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
F3931284 0428101209 I H ent2 ETHERNET NETWORK RECOVERY MODE
EC0BCCD4 0423113309 T H ent2 ETHERNET DOWN
F3931284 0420163609 I H ent2 ETHERNET NETWORK RECOVERY MODE
EC0BCCD4 0420144309 T H ent2 ETHERNET DOWN
其中:
TIMESTAMP: MMDDHHMMYY (月日时分年)
T 为类型: P 永久; T 临时; U 未知永久性的错误应引起重视
C 为分类: H 硬件; S 软件; O 用户; U未知
用一下命令收集具体信息:
#errpt -d H 列出所有硬件出错信息
#errpt -d S 列出所有软件出错信息
#errpt -aj ERROR_ID 列出详细出错信息
#errpt -aj 0502f666 --- ERROR_ID用大小写均可
这里面的有很详细的报错记录,以及故障产生的可能原因及定位,比如Failure Cause,SRC参考码,描述,还有可能的部件等。
注意:通常现场工程师如需要将错误日志收集发给相关远程技术支持人员,所以在系统中需要执行errpt命令,将输出保存。具体方法如下:
errpt /tmp/errpt.log
errpt –a /tmp/errptdetail.log
使用ftp工具登录主机将日志download到本地发给技术支持人员。
无法进系统的日志收集
一般操作系统无法启动液晶面板会有提示的错误代码(reference code),查询对应机型的服务手册就可以找到问题的可能所在,进了系统后的一些硬件报错也会显示在液晶面板上,观察液晶面板也是很重要的收集信息手段。
串口的使用
串口一般是连到机器的Service Porcessor里面查看信息的,也可以在没有显卡的机器上装系统,RS/6000及Power4的机器波特率要设置为9600,而P5的机器波特率要设置为19200,而且P5的机器在进入系统后,自带的串口不能登录,也不能做心跳。使用了HMC口的同时串口也不能用。而P5可以有更加高级的SP管理界面,可以取代用串口进SP的界面。
一般我
文档评论(0)