删除Coordinator实例
操作场景
GaussDB 200系统有将故障Coordinator实例自动从集群中剔除的机制,剔除后会触发“ALM-37006 Coordinator进程异常”告警,请按告警指示操作。本章节介绍手动删除Coordinator实例场景。
当某个Coordinator实例发生故障时,GaussDB 200集群可能无法执行DDL操作。为了服务快速恢复正常,需要将故障的Coordinator实例从GaussDB 200集群中删掉,即将“mppdb.coo.number”的值设置为0。
GaussDB 200也提供了添加Coordinator实例的功能,具体操作请参见添加Coordinator实例。
前提条件
删除Coordinator实例前,GaussDB 200集群需处以下状态之一:
- “Normal”状态
说明:
GaussDB 200集群状态可通过执行gs_om -t status --detail查询。系统反馈信息中,“cluster_state”值为““Normal””。
- 仅由CN损坏造成的“Degraded”状态
说明:
GaussDB 200集群状态可通过执行gs_om -t status --detail查询。“cluster_state”状态处于“Degraded”,且[ Coordinator State ]中有CN实例处于“Deleted”状态,DN和其他实例均处于“Normal”状态。
- 某个含有CN的节点损坏,短时间内无法修复(如网络无法连接、硬件故障造成操作系统无法登录等)
注意事项
- 删除Coordinator前不能锁定GaussDB 200集群。
- 一次仅允许删除一个Coordinator实例。
- 如果因某CN故障造成集群处于“Degraded”状态,此时如果执行删除CN操作,只能删除该损坏的CN。
- 删除Coordinator实例需要在一个状态正常的物理节点上操作。
- 删除Coordinator实例操作不能与其它运维操作交叉执行。
- 在删除完成后,GaussDB 200集群中至少剩余一个正常的Coordinator实例。
- 删除Coordinator实例过程中,请勿进行数据增删改等DML操作以及DDL操作,以免数据的丢失。
- 删除Coordinator后,其上报的告警将无法自动恢复,需要手动清除此实例上报的告警。
处理步骤
- 登录FusionInsight Manager系统,选择“集群 > 待操作的集群名称 > 服务 > MPPDB”。
- 单击“实例”,在实例列表中选择故障节点对应的MPPDBServer。
- 单击“实例配置 > 全部配置”,在搜索框中输入参数名称“mppdb.coo.number”进行搜索。
- 将“mppdb.coo.number”的值设置为0,单击“保存”。
- 在弹出窗口中,单击“确定”。界面提示“操作成功。”,单击“完成”,删除Coordinator实例成功。
- 选择“更多 > 重启”,执行相应操作重启实例。
查看更多:华为GaussDB 200 实例故障处理
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。