老师您好,我安装完11g rac后开始还是正常,但我重启几次后,数据库plsql就连不上了,运行srvctl status listener就报
PRCR-1035 : Failed to look up CRS resource for ora.listener.type.
PRCR-1068 : Failed to query resources
Cannot communicate with crsd
其它相关命令也运行不成功,查了应该是crs没启动,但用网上的方法修改oracle-ohasd.conf文件和运行试了下均不成功,不知问题出在哪里,请指点一下,谢谢!
你这个是listener服务已经宕掉了,请按如下思路排查下:
1、 crsctl check cluster检查集群服务是否正常
2、检查crsd root agent log file看看有关报错信息
3、看看listener.log文件
评论
有用 0谢谢回复!
1,运行crsctl check cluster报如下
CRS-4535: Cannot communicate with Cluster Ready Services
CRS-4530: Communications failure contacting Cluster Synchronization Services daemon
CRS-4533: Event Manager is online
不知如何处理
2,crsd root agent log日志文件位置是/home/ORCL/u01/app/11.2.0/grid/log/racnode1/agent/crsd/orarootagent_root这个吗?
3,listener.log文件位置是/home/ORCL/u01/app/11.2.0/grid/log/diag/tnslsnr/racnode1/listener_scan1/trace/这个吗?
日志都看不太懂,后面两个发附件帮看看
评论
有用 0你这个是crsd都没有起来呢:
1、crsctl stat res -t -init的结果
2、提供下日志:
$GRID_HOME/log/<node>/alert<sid>.log
$GRID_HOME/log/<node>/crsd/crsd.log
$GRID_HOME/log/<node>/ohasd/ohasd.log
$GRID_HOME/log/<node>/agent/crsd/oraagent_grid/oraagent_grid.log
评论
有用 0
评论
有用 0crsctl stat res -t -init结果
--------------------------------------------------------------------------------
NAME TARGET STATE SERVER STATE_DETAILS
--------------------------------------------------------------------------------
Cluster Resources
--------------------------------------------------------------------------------
ora.asm
1 ONLINE OFFLINE
ora.crsd
1 ONLINE INTERMEDIATE racnode1
ora.cssd
1 ONLINE OFFLINE
ora.cssdmonitor
1 ONLINE ONLINE racnode1
ora.ctssd
1 ONLINE OFFLINE
ora.diskmon
1 OFFLINE OFFLINE
ora.evmd
1 ONLINE ONLINE racnode1
ora.gipcd
1 ONLINE ONLINE racnode1
ora.gpnpd
1 ONLINE ONLINE racnode1
ora.mdnsd
1 ONLINE ONLINE racnode1
评论
有用 0crsd日志看是vip地址无法启动导致的:
请检查对应eth1的网络配置,对应的vip在crs启动前是否没有被占用。
1、提供2节点ifconfig -a配置
2、提供ifcfg-eth1配置

评论
有用 0老师还在吗?像这些日志要怎么看懂,我发现日志里面一些字眼都不知含义,哪里有说明这些字段的?oracle官网有吗
评论
有用 01、ping 192.168.1.251/252,确认没有被占用
2、修改成其他比较小点的IP,怀疑这些高位ip被用于特殊用途了。
日志解析官网没有,MOS可能有一部分,网上也可以找到一些,需要总结实践。
评论
有用 0现在两个节点ping 251和252都是Destination Host Unreachable
251和252都是vip吧,我现在发现ifconfig里都不显示类似于eth1:1这个vip名称,之前正常时是有eth1:1 eth1:2这样的名字
所以不明白到底是网络接口配置引起crs不启动,还是crs不启动了所以vip这样的名称就没有了?
另mos上面的日志分析的文档方便发我参考学习下吗?对看日志真是一头雾水
评论
有用 0
2个节点:
1、删除DEFROUTE=YES
2、改成NAME=eth1
3、关闭NetworkManager服务
service NetworkManager stop
chkconfig NetworkManager off
--vip是启动crs配置的,没启动前是看不到的
评论
有用 0现在已经修改并重启了电脑,运行srvctl status listener还是报一样的错
评论
有用 0首先,不需要管srvctl status listener了,在crs没有启动之前,所有的资源都没办法启动的,无论是ASM还是数据库实例还是监听。
所以,目前要确认的问题是,为什么crs之前能够正常启动,但是现在不能启动了。
根据Moone之前的回复,是网络层有了一些问题。
那么:
你配置的priv, public分别是什么网卡?
现在ifconfig是什么结果
评论
有用 0priv是eth2,public是eth1
racnode1 ifconfig
[root@racnode1 ~]# ifconfig
eth1 Link encap:Ethernet HWaddr 00:0C:29:DE:A2:1D
inet addr:192.168.1.151 Bcast:192.168.1.255 Mask:255.255.255.0
inet6 addr: fe80::20c:29ff:fede:a21d/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:1157 errors:0 dropped:0 overruns:0 frame:0
TX packets:1810 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:155203 (151.5 KiB) TX bytes:140996 (137.6 KiB)
eth2 Link encap:Ethernet HWaddr 00:0C:29:DE:A2:27
inet addr:192.168.2.151 Bcast:192.168.2.255 Mask:255.255.255.0
inet6 addr: fe80::20c:29ff:fede:a227/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:56809 errors:0 dropped:0 overruns:0 frame:0
TX packets:106111 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:12833917 (12.2 MiB) TX bytes:9554493 (9.1 MiB)
eth3 Link encap:Ethernet HWaddr 00:0C:29:DE:A2:31
UP BROADCAST MULTICAST MTU:1500 Metric:1
RX packets:0 errors:0 dropped:0 overruns:0 frame:0
TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:0 (0.0 b) TX bytes:0 (0.0 b)
eth4 Link encap:Ethernet HWaddr 00:0C:29:DE:A2:3B
UP BROADCAST MULTICAST MTU:1500 Metric:1
RX packets:0 errors:0 dropped:0 overruns:0 frame:0
TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:0 (0.0 b) TX bytes:0 (0.0 b)
lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:588 errors:0 dropped:0 overruns:0 frame:0
TX packets:588 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:40428 (39.4 KiB) TX bytes:40428 (39.4 KiB)
racnode2 ifconfig
[root@racnode2 ~]# ifconfig
eth1 Link encap:Ethernet HWaddr 00:0C:29:53:43:69
inet addr:192.168.1.152 Bcast:192.168.1.255 Mask:255.255.255.0
inet6 addr: fe80::20c:29ff:fe53:4369/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:1002 errors:0 dropped:0 overruns:0 frame:0
TX packets:1831 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:127954 (124.9 KiB) TX bytes:143528 (140.1 KiB)
eth2 Link encap:Ethernet HWaddr 00:0C:29:53:43:73
inet addr:192.168.2.152 Bcast:192.168.2.255 Mask:255.255.255.0
inet6 addr: fe80::20c:29ff:fe53:4373/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:56989 errors:0 dropped:0 overruns:0 frame:0
TX packets:106613 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:13182892 (12.5 MiB) TX bytes:9599873 (9.1 MiB)
lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:590 errors:0 dropped:0 overruns:0 frame:0
TX packets:590 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:40566 (39.6 KiB) TX bytes:40566 (39.6 KiB)
评论
有用 0如果是重启后集群无法启动,那就根据日志排查下重启后可能会变化的地方:
1、防火墙
2、如Moone所说检查两个节点的网卡配置,关闭网卡自动管理
3、两个节点网卡的MTU值是否一致
评论
有用 0防火墙和selinux都是关闭的
网卡配置看了找不出问题,按照moone的改了还是不行
两节点网卡的mtu值下面不是列了是1500一样的吧
又折腾了几天,不停的上网搜资料,学分析日志,日志只看得懂很少的几个字眼,因为英文懂但是很多字段不知表示得是什么意思,我想了可能我rac的几个功能模块相互之间的原理,常用命令的作用都不是很清楚,看日志也不知道要抓什么,也不知道对应日志表示的要去检查哪方面。也没有mos查文档的权限,如可以能否推荐详细讲述各功能模块相互作用原理,及常用检查命令作用的资料。
评论
有用 0贴一个官博的文章,参考下吧。也是用的openfiler
https://www.oracle.com/technetwork/cn/articles/hunter-rac11gr2-iscsi-083834-zhs.html
评论
有用 0
墨值悬赏

