问题描述:
xxx 生产数据库 RAC 集群节点实例出现了反复重启,故障期间出现私网不通,CPU 内存爆满
的情况。
问题分析:
通过集群 alert 日志发现心跳超时错误并重启节点。
dc1 节点 crs 日志显示:09-09 10:30 分集群重启
dc2 集群 crs 日志显示 09-09 10:23 分开始心跳超时,dc1 被驱逐
dc2 集群 crs 日志显示 dc1 主机集群重启后 10:31 重新注册到集群
并且故障期间发现私网网络不通。
TOP 发现主机负载超高,CPU 主要在 sys 78.5%,ocssd.bin 进程 CPU 1112%,系统空闲内存
低,并且有大量换页内存使用的情况:
文档被以下合辑收录
评论