暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

解决人大金仓数据库KingbaseES集群“双主”的问题

原创 数据猿 2024-04-19
1076


关键字:

备库无法启动KingbaseES集群、双主、人大金仓

问题描述

在KingbaseES集群运行中,由于主备网络故障或者备库promote操作等原因,可能会造成集群出现“双主”故障。

排查思路

1. 查看集群及数据库服务状态;

2. 通过业务信息确认新主;

3. 将备节点rejoin到集群;

4. 重新查看集群及数据库服务状态。

处理方法

  1. 查看集群及数据库服务状态;

在节点执行repmgr cluster show命令查看集群状态

node1显示如下:

node2显示如下

在节点执行repmgr service status命令查看服务状态

2. 通过业务信息确认新主,在不清楚业务的情况,可以通过查看控制文件信息中进行辅助确认;

在节点执行sys_controldata -D ${DATA}(数据目录) 命令查看控制文件信息

node1显示如下:

node2显示如下:

选主原则:TimeLineID大的节点选为新主节点;TimeLineID相同,oldestActiveXID越大的节点选为新主节点。

从上面控制文件信息获悉,node2的TimeLineID(2)大于node1的TimeLineID(1),并且node2的oldestActiveXID(0:1086)大于node1的oldestActiveXID(0:1084),故选择node2位新主。

3. 将备节点rejoin到集群

在node1节点执行sys_ctl stop -D ${DATA}[数据目录]命令,关闭数据库服务

在node1节点执行rejoin命令:

repmgr node rejoin -h 10.12.11.193 -U esrep -d esrep --force-rewind

4. 重新查看集群及数据库服务状态。

在节点执行repmgr cluster show命令查看集群状态

node1显示如下:

node2显示如下

在节点执行repmgr service status命令查看服务状态

node1显示如下:

node2显示如下

集群状态恢复正常,双主问题解决。

参考资料

《KingbaseES数据守护和读写分离集群使用手册》

最后修改时间:2024-04-25 11:05:00
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论