暂无图片
生产环境oracle 三节点RAC出现节点宕机情况
我来答
分享
暂无图片 匿名用户
生产环境oracle 三节点RAC出现节点宕机情况

新上线19.20 版本三节点RAC库,操作系统 rhel 8.4,部署完毕后,在大批量导入数据后,重启当前节点集群,会引发其他正常节点的异常关机,很奇怪的问题。
库报错日志:
caa515ab534c6fdef28c50af8cfa5b9.png

集群报错日志:
4ec515c5897c45887d19e0228ab47fc.png
能初步确认是心跳网络超时后被踢出集群了,但是检查了心跳交换机本身无异常,心跳网络检测无异常,为什么会在1节点手动重启时会带动2节点自动重启呢?

我来答
添加附件
收藏
分享
问题补充
4条回答
默认
最新
zone

OSW的netstat和private两个监控日志发出来看看

暂无图片 评论
暂无图片 有用 0
天马行空

每个节点的私有网络mtu可以检查下。

暂无图片 评论
暂无图片 有用 0
一般

ifconfig看看

暂无图片 评论
暂无图片 有用 0
周伟

操作的整个过程命令贴出来看看,另外RHEL的一些东西有没有提前关闭,比如NUMA之类的。

日志里面看到的节点剔除,看起来像网络问题但以我的经验,并非一定就是,因为只要节点因为某种原因无法正常通信,它就会报这个内容的。

暂无图片 评论
暂无图片 有用 0
回答交流
提交
问题信息
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~
暂无图片墨值悬赏