多数节点同时故障的问题-3
因为组复制本身设计实现存在的一些问题,这里需要特别注意如下一些问题:
- 可能出现
STOP GROUP_REPLICATION无法退出上一次组复制集群的问题,此时可能需要重启节点。 - 可以设置参数
group_replication_unreachable_majority_timeout,比如 30s,或者 60s 之类,如果节点没有重启,在 node-A 重新初始化集群后,且该节点已经处于 ERROR 状态时,可以自动加入到新的组复制集群中 - 由于执行
START GROUP_REPLICATION命令时,会先应用 relaylog 日志,可能导致其它节点比 node-A 多执行了事务,此时该节点无法加入集群中。这是组复制的bug,如果出现上述问题,只能先将该节点数据恢复后再加入集群。
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




