有一个厂商的的一套oracle19c-rac环境突然宕机了,重新启动时启动不了,时隔一年多了,临时找到让协助排查一下,特此记录
一、环境信息
| 节点 | 系统类型 | 系统版本 |
| rac1 | linux | redhat7 |
| rac2 | linux | redhat7 |
数据库连接不上了,查看集群状态不对,重新启动集群启动不了

二、异常处理
让现场查看日志报错alert日志提示ocr磁盘组,只有一个成员可用,两个不可用
The number of voting files available, 1, is legs than the minimum number of voting files reguired, 2, resultcrs/p19c01/cr3/trace/ocssd.trc

查看ocssd.trc有大量磁盘超时的报错

结合上面报错基本可以确定是磁盘出问题了,导致集群异常,让厂商联系存储,存储厂商排查后确实存储因网络波动导致磁盘掉线异常了,现在已经恢复正常
先停掉残余进程,大约有10分钟,一直卡住不动,因为连接不上cssd

建议直接重启下服务器,存储已经好了,重启后会直接把集群拉起来,但是这台服务器上有别的环境,相对这套rac比较重要,不可以重启,采取kill残余进程

kill所有残余进程后重新启动集群恢复

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




