温备替换
操作场景
集群节点MPPDBServer实例故障后,通过温备替换将MPPDBServer实例安装到集群中的温备节点,以达到快速恢复MPPDBServer实例的目的。
温备节点是集群中已经存在的不包含MPPDBServer实例且运行状态正常的节点。
- 本操作可能导致服务异常,属高危操作。
- 配置了容灾的集群,不支持本操作。
- 本操作过程不可回退。如果操作失败,请根据系统提示排除故障后继续执行直到操作成功。
- 执行本操作后,用本操作前创建的备份任务去执行备份恢复操作会失败。
- 可通过添加主机操作向待操作集群添加温备节点。
前提条件
- 已以系统管理员身份登录FusionInsight Manager。
- MPPDBServer实例故障的节点仅安装了MPPDBServer实例,且该节点不为主、备管理节点。
- 温备节点的硬件条件(CPU,内存,磁盘个数,磁盘分区等)必须满足GaussDB 200安装的基本要求,等同或者优于MPPDBServer实例故障节点的配置。
- 集群中只能有一个故障的实例。
- FusionInsight Manager主、备管理节点运行状态正常。
- GaussDB 200集群内如下实例至少存在一个正常运行的:
- CMServer
- CMAgent
- GTM
- Coordinator
- 集群中不存在正在运行的备份任务。
操作步骤
- 对MPPDBServer实例故障的节点执行隔离主机操作,请参见隔离主机。
- 使用PuTTY以omm用户登录集群中任一MPPDBServer实例状态正常的节点。
- 执行如下命令确认MPPDBServer实例故障的节点上CMS/GTM/DN实例状态为“Down”、CN的状态为“Down”或“Deleted”:
source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile
cm_ctl query -Cv
- 是,执行4。
- 否,对MPPDBServer实例故障的节点执行下电操作,再执行3。
[ CMServer State ] node instance state ----------------------------------- 1 szvphicprb15791 1 Down 2 szvphicprb15788 2 Primary [ Cluster State ] cluster_state : Degraded redistributing : No balanced : No [ Coordinator State ] node instance state ----------------------------------- 1 szvphicprb15791 5001 Down 2 szvphicprb15788 5002 Normal 3 szvphicprb15789 5003 Normal [ Central Coordinator State ] node instance state ----------------------------------- 2 szvphicprb15788 5002 Normal [ GTM State ] node instance state sync_state ------------------------------------------------------------------- 2 szvphicprb15788 1001 P Primary Connection bad Most available 1 szvphicprb15791 1002 S Down Unknown Sync [ Datanode State ] node instance state | node instance state | node instance state -------------------------------------------------------------------------------------------------------------------------------------------- 1 szvphicprb15791 6001 P Down Unknown | 2 szvphicprb15788 6002 S Primary Normal | 3 szvphicprb15789 3002 R Secondary Normal 1 szvphicprb15791 6003 P Down Unknown | 3 szvphicprb15789 6004 S Primary Normal | 2 szvphicprb15788 3003 R Secondary Normal 2 szvphicprb15788 6005 P Primary Normal | 3 szvphicprb15789 6006 S Standby Normal | 1 szvphicprb15791 3004 R Down Unknown 2 szvphicprb15788 6007 P Primary Normal | 1 szvphicprb15791 6008 S Down Unknown | 3 szvphicprb15789 3005 R Secondary Normal 3 szvphicprb15789 6009 P Primary Normal | 1 szvphicprb15791 6010 S Down Unknown | 2 szvphicprb15788 3006 R Secondary Normal 3 szvphicprb15789 6011 P Primary Normal | 2 szvphicprb15788 6012 S Standby Normal | 1 szvphicprb15791 3007 R Down Unknown
- 在FusionInsight Manager页面,选择“集群 > 待操作集群的名称 > 服务 > 服务名称”,查看除了MPPDBServer实例故障的节点之外其他节点上实例的“运行状态”是否为“良好”。
- 是,执行5。
- 否,修复故障,执行4。
- 选择“运维 > 备份恢复 > 备份管理”,在任务列表中备份类型是“周期备份”任务的“操作”列,选择“更多 > 挂起”,挂起周期备份任务。
- 选择“集群 > 待操作集群的名称 > 服务 > MPPDB > 实例”。
- 在实例列表中勾选MPPDBServer实例故障的节点,选择“更多 > 温备替换”。
- 在弹出的对话框输入当前登录FusionInsight Manager用户的密码,单击“确定”。
- 在“温备替换”对话框上勾选温备节点,勾选“我确定要进行温备替换,并接受温备替换可能导致的数据丢失的后果。”,单击“确定”。
- 等待系统提示“操作成功。”后单击“完成”。
- 选择“运维 > 备份恢复 > 备份管理”,在任务列表中备份类型是“周期备份”任务的“操作”列,选择“更多 > 重新执行”,恢复周期备份任务。
查看更多:华为GaussDB 200 管理实例
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。