暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

oracle-rac集群存储异常处理

原创 forever 2025-05-16
317

有一个厂商的的一套oracle19c-rac环境突然宕机了,重新启动时启动不了,时隔一年多了,临时找到让协助排查一下,特此记录

一、环境信息

节点 系统类型 系统版本
rac1 linux redhat7
rac2 linux redhat7

数据库连接不上了,查看集群状态不对,重新启动集群启动不了

二、异常处理

让现场查看日志报错alert日志提示ocr磁盘组,只有一个成员可用,两个不可用

 The number of voting files available, 1, is legs than the minimum number of voting files reguired, 2, resultcrs/p19c01/cr3/trace/ocssd.trc

查看ocssd.trc有大量磁盘超时的报错

结合上面报错基本可以确定是磁盘出问题了,导致集群异常,让厂商联系存储,存储厂商排查后确实存储因网络波动导致磁盘掉线异常了,现在已经恢复正常

先停掉残余进程,大约有10分钟,一直卡住不动,因为连接不上cssd

建议直接重启下服务器,存储已经好了,重启后会直接把集群拉起来,但是这台服务器上有别的环境,相对这套rac比较重要,不可以重启,采取kill残余进程

kill所有残余进程后重新启动集群恢复

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论