背景:
某省侧业务反馈cm状态不正常
环境:
版本:panweidb v2.0
架构:集中式,一主两备
问题现象:
- 在主节点和备1节点查看cm_server状态,备2节点的cm_server状态为down
2、在备2节点查看cm_server状态,备2节点的cm_server状态正常,为standby。
问题分析:
怀疑cm_server组件出现了脑裂现象。使用telnet命令检查三台主机之间的端口互通情况。
检查结果:主节点、备1节点到备2节点的端口不通。备2节点到其他两个节点的端口是通的。
本地环境复现:
环境信息:
主机名 | ip | 节点角色 | 简称 |
pwdbs1 | *.*.*.132 | Primary | 主节点 |
pwdbs2 | *.*.*.133 | Standby | 备1 |
pwdbs3 | *.*.*.134 | Standby | 备2 |
- 查看集群状态:
- 打开备2节点的防火墙(开启firewalld之后,默认拒绝所有流量)
3、在主节点、备1节点查看集群状态,可以看到备2节点的cm_server状态为down
主节点执行:
备1节点执行:
4、在备2节点查看集群状态,看到备2节点的cm_server状态为Standby
4、测试网络互通情况
4.1 从主节点、备1节点到备2节点的网络不通
4.2 从备2节点到主节点、备1节点的网络是通的
问题结论:
集群三个节点之间网络出现故障,cm_server组件产生了脑裂。
解决方法:
- 关闭防火墙:systemctl stop firewalld
- 如果主机有额外的策略配置,请联系主机管理员开放网络策略。
问题总结:
如果出现了在不同节点查询到的集群状态不一致的情况,那么极大可能网络出现了问题,应优先排查主机之间的网络互通情况,检查防火墙策略配置。
最后修改时间:2025-07-11 18:08:30
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




