暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

磐维集中式库2.0版本_cm_server脑裂问题排查_避坑指引

原创 Hao 2025-07-04
150

背景:

某省侧业务反馈cm状态不正常

环境:

版本:panweidb v2.0

架构:集中式,一主两备

问题现象:

  1. 在主节点和备1节点查看cm_server状态,备2节点的cm_server状态为down

2、在备2节点查看cm_server状态,备2节点的cm_server状态正常,为standby。

问题分析:

怀疑cm_server组件出现了脑裂现象。使用telnet命令检查三台主机之间的端口互通情况。

检查结果:主节点、备1节点到备2节点的端口不通。备2节点到其他两个节点的端口是通的。

本地环境复现:

环境信息:

主机名

ip

节点角色

简称

pwdbs1

*.*.*.132

Primary

主节点

pwdbs2

*.*.*.133

Standby

备1

pwdbs3

*.*.*.134

Standby

备2

  1. 查看集群状态:

  1. 打开备2节点的防火墙(开启firewalld之后,默认拒绝所有流量)

3、在主节点、备1节点查看集群状态,可以看到备2节点的cm_server状态为down

主节点执行:

备1节点执行:

4、在备2节点查看集群状态,看到备2节点的cm_server状态为Standby

4、测试网络互通情况

4.1 从主节点、备1节点到备2节点的网络不通

4.2 从备2节点到主节点、备1节点的网络是通的

问题结论:

集群三个节点之间网络出现故障,cm_server组件产生了脑裂。

解决方法:

  1. 关闭防火墙:systemctl stop firewalld
  2. 如果主机有额外的策略配置,请联系主机管理员开放网络策略。

问题总结:

如果出现了在不同节点查询到的集群状态不一致的情况,那么极大可能网络出现了问题,应优先排查主机之间的网络互通情况,检查防火墙策略配置。

最后修改时间:2025-07-11 18:08:30
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论