暂无图片
分享
luz
2019-06-17
RAC 重启之后循环重启

hp unix rac  11.2.0.4 重启之后,rac节点循环重启。附件是tfa获取的日志,麻烦分析一下原因,谢谢。

收藏
分享
9条回答
默认
最新
luz
上传附件:his2.zip
暂无图片 评论
暂无图片 有用 0
盖国强

从数据库日志看是ASM问题,ASM日志没有看到明显报错,请手工启停asm判断其正常与否。


同时检查另外一个节点的信息。

暂无图片 评论
暂无图片 有用 0
燕鑫

DATA和FRA正常mount,说明crsd此时是正常的,那么也就说明ocss和ohasd都是正常工作的,而且,ASM一定是正常启动了的,因为数据库也已经开始正常启动了,但是后面突然data和fra与crsd/ohasd失去通信,导致ASM实例挂掉。所以需要把17日上午8点以后的集群日志,最好是所有,至少是ocrsd、ocssd、ohasd的日志提供出来。最开始对crs、css的工作状态正常的判断也是基于asm日志进行推断的。你做的tfa的收集中,集群日志的信息太少了。建议你直接去grid用户下的$ORACLE_HOME/log/把集取日志手动截取打包。另外,最好把1节点的也提供一下,从asm实例的实例恢复过程中能看出,2节点是先启动的,1节点始终未启动,1节点是什么原因挂的(需要日志支持),还是本来早就已经人为停掉了

暂无图片 评论
暂无图片 有用 0
luz
暂无图片 评论
暂无图片 有用 0
luz
暂无图片 评论
暂无图片 有用 0
luz

各位专家,我重新采集了日志,麻烦分析一下,多谢,现在集群启动了,但是不知道昨天8点之后,节点进行了多次重启,不知道原因,麻烦分析一下,多谢.

暂无图片 评论
暂无图片 有用 0
luz

18:06  Mon Jun 17 2019.  Reboot after panic: INIT, IIP:0xe000000000f9d190 IFA:0x6000000001a52f60

18:39  Mon Jun 17 2019.  Reboot after panic: INIT, IIP:0xe000000000f9ac20 IFA:0xe0000005e031c158

19:15  Mon Jun 17 2019.  Reboot after panic: INIT, IIP:0xe000000000f99f10 IFA:0x20000000677d7cf4

19:46  Mon Jun 17 2019.  Reboot after panic: INIT, IIP:0xe000000000f9ac30 IFA:0xe008001846af1000

20:08  Mon Jun 17 2019.  Reboot after panic: INIT, IIP:0xe000000000f9a050 IFA:0xe0080022e7a5b000

20:35  Mon Jun 17 2019.  Reboot after panic: INIT, IIP:0xe000000000f9a1d0 IFA:0x4000000002440bc0

21:13  Mon Jun 17 2019.  Reboot after panic: INIT, IIP:0xe000000001065430 IFA:0xe00000097c951098


昨天 18点之后,也进行了多次自动重启.

暂无图片 评论
暂无图片 有用 0
luz

初步断定是存储的线有问题.还请各位专家指正.多谢.

暂无图片 评论
暂无图片 有用 0
luz
问题已关闭: 问题已经得到解决
暂无图片 评论
暂无图片 有用 0
回答交流
提交
问题信息
请登录之后查看
附件列表
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~
暂无图片墨值悬赏