暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

What's Mean "reliable message"?

原创 eygle 2008-02-22
748
今天客户的一套RAC环境出现问题

双节点RAC环境中,一个节点因为锁竞争而挂起,shutdown之后无法启动。




故障出现时我正在路上,匆匆回到家中,处理故障。

解决之后查找故障原因。


检查当时的AWR信息发现Top 5 Timed Events显示如下信息:




Top 5 Timed Events                                        Avg %Total

~~~~~~~~~~~~~~~~~~                                        wait  Call

Event                                Waits    Time (s)  (ms)  Time Wait Class

------------------------------ ------------ ----------- ------ ------ ----------

reliable message                        354          89    251  219.4      Other

CPU time                                            32          78.3

db file sequential read              2,223          12      6  30.3  User I/O

control file sequential read        29,151          8      0  20.9 System I/O

db file scattered read                  36          2    62    5.5  User I/O

          -------------------------------------------------------------

这里最显著的事件是reliable message,这个事件Metalink的解释为:

    When you send a message using the 'KSR' intra-instance broadcast

    service, the message publisher waits on this wait-event until

    all subscribers have consumed the 'reliable message' just sent.

    The publisher waits on this wait-event for three seconds and

    then re-tests if all subscribers have consumed the message, or

    until posted.

也就是说当跨实例发送消息时,发送者期望收到订阅者的回复信息,如果得不到可信回复,就会一直处于等待。等待以3秒为周期进行反复尝试,知道收到所有订阅者的回复或者被唤醒。



那么在这个环境中,也就是说两个节点的通讯已经出现问题,一个节点得不到另外一个节点的回复。

这是一个可怕的故障,reliable message也是一个让人头疼的事件。

As rocx123 describe:

Althoug this is an old issue it just happened to in a test RAC.
"reliable message" is really not to worry for but if some sessions are waiting and the wait time (secs) is increasing you may look at parameter aq_tm_processes: it should not be ZERO. If it is, set it to at least 2.



-The End-





「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论