暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

突发WAS7故障排查(Not all candidates are connected ConnectedSetMissing)

神奇的DBA 2021-04-21
1989

    

    下午突然websphere下某核心应用启动不了,运维人员通过console停止java sever后,启动java server一直hang在那里,通过简单询问被告知没有改动什么配置,遂介入查看。发现问题有点蹊跷,应该不止是这一个server不能启动,感觉该cluster上所有的server应该在停下来后,都不能启动了。

    登陆不能启动的server,查看systemout.log发现不停的在报:

[16-5-30 13:55:55:139 CST] 0000001f RoleViewLeade I   DCSV8030I: 在成员 feichedmCell01\core01\core01 处的 DCS 堆栈 DefaultCoreGroup:无法加入或建立具有成员 [feichedmCell01\cas01\cas01] 的视图。原因是 Not all candidates are connected ConnectedSetMissing=   [ ] ConnectedSetAdditional [ feichedmCell01\doc01\doc01 ]。


    查看DMGR上相关log,server上log,nodeagent上log后排除了集群时间差、host表解析问题等可能性,初步判定是由于某节点跟dmgr同步出现问题, 导致dce信息不一致,集群管理处在不一致状态,处理方法是停下问题节点所有服务,并手工同步DM与nodeagent.


处理方法很简单:

登陆服务器

执行 ./syncNode.sh DMGR 8879

文章转载自神奇的DBA,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论