
由于 AIX 故障种类多,不能一一列举,这里简单介绍部分故障判断,定位,解决方法。
一. 故障的定义
弄清楚系统发生了什么问题?
系统现在能做什么?不能做什么?
故障什么时候发生的?
有没有做平时不同的操作?
故障有没有规律?定时还是不定时?发生的频率有多高?
是一台机器出现故障还是多台机器故障?故障现象是否相同?
最近有没有做改动?如安装了新的硬件、软件,改变了系统的一些设置。
检查机器是否存在故障
一般情况下,可以通过以下几种方法来收集错误信息
1、查看机器各种指示灯状态
机器上有许多指示灯即时说明机器运行的状态,这些指示灯的状态可以作为判断机器是否有故障的一
个依据。当指示灯的状态不正常时,需要引起注意。比如,当机器警告灯亮的时候,一般都是机器的
硬件出现问题,需要查看系统报错日志来查看具体的错误信息。
2、查看系统故障记录收集信息
errdemon 进程在系统启动时自动运行,记录包括硬件、软件及其他操作信息。故障记录文件为
/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析。
也可以使用 errpt 命令来查看(普通用户权限也可使用)
#errpt |more 列出简短出错信息
ERROR_ID TIMESTAMP T C RESOURCE_NAME ERROR_DEION
192AC071 0723100300 T 0 errdemon Error logging turned off
评论