暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
AIX 部分故障的判断、定位、解决方法及10个故障案例分享
802
13页
0次
2020-07-16
5墨值下载
由于 AIX 故障种类多,不能一一列举,这里简单介绍部分故障判断,定位,解决方法。
一. 故障的定义
弄清楚系统发生了什么问题?
系统现在能做什么?不能做什么?
故障什么时候发生的?
有没有做平时不同的操作?
故障有没有规律?定时还是不定时?发生的频率有多高?
是一台机器出现故障还是多台机器故障?故障现象是否相同?
最近有没有做改动?如安装了新的硬件、软件,改变了系统的一些设置。
检查机器是否存在故障
一般情况下,可以通过以下几种方法来收集错误信息
1、查看机器各种指示灯状态
机器上有许多指示灯即时说明机器运行的状态,这些指示灯的状态可以作为判断机器是否有故障的一
个依据。当指示灯的状态不正常时,需要引起注意。比如,当机器警告灯亮的时候,一般都是机器的
硬件出现问题,需要查看系统报错日志来查看具体的错误信息。
2、查看系统故障记录收集信息
errdemon 进程在系统启动时自动运行,记录包括硬件、软件及其他操作信息。故障记录文件为
/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析。
也可以使用 errpt 命令来查看(普通用户权限也可使用)
#errpt |more 列出简短出错信息
ERROR_ID TIMESTAMP T C RESOURCE_NAME ERROR_DEION
192AC071 0723100300 T 0 errdemon Error logging turned off
0E017ED1 0720131000 P H mem2 Memory failure
9DBCFDEE 0701000000 T 0 errdemon Error logging turned on
038F2580 0624131000 U H scdisk0 UNDETERMINED ERROR
AA8AB241 0405130900 T O OPERATOR OPERATOR NOTIFICATION
TIMESTAMP: MMDDHHMMYY (月日时分年)
T(类型): P 永久;T 临时; U 未知(永久性的错误应引起重视)
PPermanentTTemporaryUUnknow
C(分类):H 硬件;S 软件;O 用户; U 未知
HHardwareSSoftwareO:;UUnknow
#errpt -d H 列出所有硬件出错信息
#errpt -d S 列出所有软件出错信息
#errpt -aj ERROR_ID 列出详细出错信息
# errpt -aj 0502f666 <--- ERROR_ID 用大小写均可
例:
LABEL: SCSI_ERR1
ID: 0502F666
Date/Time: Jun 19 22:29:51
Sequence Number: 95
Machine ID: 123456789012
Node ID: host1
of 13
5墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜