RAC 重启之后循环重启

luz

2019-06-17

RAC 重启之后循环重启

oracle

hp unix rac 11.2.0.4 重启之后，rac节点循环重启。附件是tfa获取的日志，麻烦分析一下原因，谢谢。

9条回答

默认

最新

luz

上传附件：his2.zip

有用 0

盖国强

从数据库日志看是ASM问题，ASM日志没有看到明显报错，请手工启停asm判断其正常与否。

同时检查另外一个节点的信息。

有用 0

燕鑫

DATA和FRA正常mount，说明crsd此时是正常的，那么也就说明ocss和ohasd都是正常工作的，而且，ASM一定是正常启动了的，因为数据库也已经开始正常启动了，但是后面突然data和fra与crsd/ohasd失去通信，导致ASM实例挂掉。所以需要把17日上午8点以后的集群日志，最好是所有，至少是ocrsd、ocssd、ohasd的日志提供出来。最开始对crs、css的工作状态正常的判断也是基于asm日志进行推断的。你做的tfa的收集中，集群日志的信息太少了。建议你直接去grid用户下的$ORACLE_HOME/log/把集取日志手动截取打包。另外，最好把1节点的也提供一下，从asm实例的实例恢复过程中能看出，2节点是先启动的，1节点始终未启动，1节点是什么原因挂的（需要日志支持），还是本来早就已经人为停掉了

有用 0

luz

上传附件：his1.tfa_Tue_Jun_18_20_25_52_EAT_2019.rar

有用 0

luz

上传附件：his2.tfa_Tue_Jun_18_20_25_52_EAT_2019.rar

有用 0

luz

各位专家,我重新采集了日志,麻烦分析一下,多谢,现在集群启动了,但是不知道昨天8点之后,节点进行了多次重启,不知道原因,麻烦分析一下,多谢.

有用 0

luz

18:06 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f9d190 IFA:0x6000000001a52f60

18:39 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f9ac20 IFA:0xe0000005e031c158

19:15 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f99f10 IFA:0x20000000677d7cf4

19:46 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f9ac30 IFA:0xe008001846af1000

20:08 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f9a050 IFA:0xe0080022e7a5b000

20:35 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000000f9a1d0 IFA:0x4000000002440bc0

21:13 Mon Jun 17 2019. Reboot after panic: INIT, IIP:0xe000000001065430 IFA:0xe00000097c951098

昨天 18点之后,也进行了多次自动重启.

有用 0

luz

初步断定是存储的线有问题.还请各位专家指正.多谢.

有用 0

luz

问题已关闭: 问题已经得到解决

有用 0

回答交流

提交

问题信息

请登录之后查看

附件列表

请登录之后查看

邀请回答

暂无人订阅该标签，敬请期待~~

墨值悬赏