hp unix rac 11.2.0.4 重启之后,rac节点循环重启。附件是tfa获取的日志,麻烦分析一下原因,谢谢。
从数据库日志看是ASM问题,ASM日志没有看到明显报错,请手工启停asm判断其正常与否。
同时检查另外一个节点的信息。
评论
有用 0DATA和FRA正常mount,说明crsd此时是正常的,那么也就说明ocss和ohasd都是正常工作的,而且,ASM一定是正常启动了的,因为数据库也已经开始正常启动了,但是后面突然data和fra与crsd/ohasd失去通信,导致ASM实例挂掉。所以需要把17日上午8点以后的集群日志,最好是所有,至少是ocrsd、ocssd、ohasd的日志提供出来。最开始对crs、css的工作状态正常的判断也是基于asm日志进行推断的。你做的tfa的收集中,集群日志的信息太少了。建议你直接去grid用户下的$ORACLE_HOME/log/把集取日志手动截取打包。另外,最好把1节点的也提供一下,从asm实例的实例恢复过程中能看出,2节点是先启动的,1节点始终未启动,1节点是什么原因挂的(需要日志支持),还是本来早就已经人为停掉了
评论
有用 0
评论
有用 0
评论
有用 0各位专家,我重新采集了日志,麻烦分析一下,多谢,现在集群启动了,但是不知道昨天8点之后,节点进行了多次重启,不知道原因,麻烦分析一下,多谢.
评论
有用 018:06 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f9d190 IFA:0x6000000001a52f60
18:39 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f9ac20 IFA:0xe0000005e031c158
19:15 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f99f10 IFA:0x20000000677d7cf4
19:46 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f9ac30 IFA:0xe008001846af1000
20:08 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f9a050 IFA:0xe0080022e7a5b000
20:35 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f9a1d0 IFA:0x4000000002440bc0
21:13 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000001065430 IFA:0xe00000097c951098
昨天 18点之后,也进行了多次自动重启.
评论
有用 0
墨值悬赏

