暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

百度分布式数据库GaiaDB-X高可用:故障自愈

原创 小小亮 2021-04-11
663

计算节点故障自愈

百度分布式数据库GAIADB-X 计算层由多个 GAIADB-X 计算节点构成,通过负载均衡设备统一对外提供服务。当一个计算节点出现故障时,流量以秒级切换到其他计算节点上。整个切换过程对用户透明,应用代码无需变更,应用进程无需重启。

计算节点自愈分为“故障感知”和“故障处理”两部分,如图所示

image.png
图 2-4-1 计算节点故障自愈

  • 故障感知:通过“节点代理”的定时任务定期执行自愈监控项采集,对计算节点的监控项进行采集,并上报至“服务自愈”模块,该模块对节点的监控数据进行分析,对可能的故障信息进行定位和二次检测,若确定为故障则发起故障处理任务。

  • 故障处理:服务自愈模块向任务调度模块发送自愈任务,任务系统拉起任务
    处理进程对自愈任务进行处理,处理完成后同步服务自愈模块任务完成状态,自
    愈处理闭环完成。

存储节点故障切换

百度分布式数据库GAIADB-X 存储节点由 1 个主库 1 个以上的从库构成,主库承担读写服务,从库提供读服务,当主库故障时,系统会自动发现并尝试恢复主库,如果主库无法恢复则发起主从切换,如下图

image.png
图 2-4-2 存储节点故障切换

  • 切换协调:切换协调模块为切换最核心的模块,负责存储节点健康诊断,切换仲裁与协调,并变更位于决策集群中的集群拓扑信息。上图中,数据库实例的 3 个节点代理构成了切换的协调者。节点代理通过与决策集群通信获取其托管的集群的元信息,并借助决策集群来取得集群中其他节点代理的通讯方式。
最后修改时间:2021-04-11 16:13:05
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论