暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

记一次rac的小错误

老张的技术博客 2017-10-30
154

RAC一直以来都是我们oracle玩家的基本功。因为之前有段时间没玩rac了,今天就打算来温习一下。安装gi和数据库软件都非常顺利,一步步按照流程走下去就行。毕竟之前rac也装过不少遍了,部署之类的也都算是非常娴熟了,感觉不应该出现什么问题。带着这样的心态,我泡了一杯茶,坐在椅子上舒舒服服地等着进度条。

然而当进度条快跑完的时候问题出现了!吓得我一口老茶差点没喷出去。报错内容如下:


不能打开我节点二的实例?!这时师傅的一句话突然在我脑海中响起:遇到报错,不管三七二十一先找日志,根据日志信息提出疑点进行分析。那就先打开日志看看有没有什么有用的信息吧。

在看日志前,我留意到了它给我的日志路径,这个是crsd的日志,说明问题处在集群管理器上,底层的数据库应该是没有问题的。其次我认为不可能是由于网络故障引发的问题,因为在之前安装gi的时候是没有问题的。接着看日志。


日志中报了不少错误,但根据经验我排除了一部分。其中有个报错比较吸引我的注意:

不能连接?可是我的网络是正常啊!难道遇到bug?

遇到问题冷静思考才是一个合格的dba。之前分析出这个问题出在crs上,而这里又报了连接问题,到底是为什么呢?

突然间我的脑海中浮现起了一个可能的答案。rac是通过/u01/app/11.2.0/grid/bin/oracle这个文件来进行实例与集群的通信的。我这里提示连接异常,是不是跟这个问题有关?

话不多说,先去检查下我故障节点(rac2)的oracle文件是否正常。然后再根据正常节点(rac1)建立一个对比。一对比,果然发现问题了

rac1的oracle文件如下


rac2的oracle文件如下


看颜色就知道这两个文件的权限不对,可能是因为权限问题导致实例无法连接到集群

那就改权限吧,chmod6751 oracle,

 

改完之后故障就解决了

 

oracle很多时候的故障都是由于一些微不足道的小问题导致的,但就是这些小问题却有可能导致一场重大的灾难。因此,以后在玩oracle的时候一定要慎重又慎重!

 

p.s:之前因为忙着ocm的一些事,已经有好多天没有写什么文章了。期间也遇到了很多比较难忘的事情,但是很可惜没有将其记录下来。以后我尽量每天写一篇文章,将自己一天里的所见、所感分享出来,也欢迎大家共同交流。


文章转载自老张的技术博客,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论