暂无图片
aix 6.1 oracle 11.2.0.3 rac 节点2异常重启,求原因
我来答
分享
四九年入国军
2020-07-31
aix 6.1 oracle 11.2.0.3 rac 节点2异常重启,求原因
暂无图片 25M

2020-07-30 22:35 node 1 检测到node 2心跳异常,然后节点2就重启了。通过查找资料发现从11.2.0.2开始心跳异常只会重启grid服务而不会直接关闭节点。从节点2只能看到crs启动后的日志(23点主机起来),并没有发现节点2有重启crs服务操作。

1、从节点1日志看出心跳异常后就把节点2驱逐了,再后来就是节点2起来重新加入集群
2、节点2 没看到停的日志,只看到启动时候的日志。

我来答
添加附件
收藏
分享
问题补充
2条回答
默认
最新
周伟

这个问题,2号节点确实有很大可能看不到它为什么被重启,因为一般是2号节点失去响应了,才会由1号节点去重启2号节点的。此时因为2号节点要么就是主机呈现卡死的状态,要么CRS卡死,crs根本就没法记录任何日志的。
诊断这种故障看2号节点的crs日志有时候就很难找到有用的线索,一般是看2号节点的主机日志什么的,或者有提前部署OSWatcher可以看看当时2号节点的各种资源状态,还有就是看2号节点会不会也记录一些无法和1号节点通信的信息。
我们生产库也发生过这种情况,是1号节点莫名其妙的就自动重启了,完全找不到任何有用的日志信息,甚至1号节点部署的OSWatcher当时来看,各种资源都属于正常情况。后来干脆停掉1号节点,就让他空着跑,一直到再次出现自动重启,我们才最终判断1号节点服务器确实有问题了,而且诡异的是至今仍然不知道他到底哪个地方坏掉了。。。

暂无图片 评论
暂无图片 有用 0
暂无图片
四九年入国军
上传附件:oracle_log.zip
暂无图片 评论
暂无图片 有用 0
回答交流
提交
问题信息
请登录之后查看
附件列表
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~
暂无图片墨值悬赏