
目 录
目 录
第 1 章 前言 1
1.1 适用读者 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 相关文档 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 术语 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.4 手册约定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
第 2 章 故障恢复概述 5
2.1 什么是故障恢复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 故障恢复的重要性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 故障恢复的类别 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
第 3 章 读写分离集群故障恢复 6
3.1 简介 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2 服务器状态要素 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3 自动故障恢复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3.1 配置方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3.2 可自动恢复的故障场景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.4 手动故障恢复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.4.1 故障排查 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.4.1.1 集群异常状态场景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.4.1.2 故障确认操作指令 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.4.2 故障恢复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4.2.1 集群恢复思路 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4.2.2 集群典型异常场景恢复 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4.2.3 集群恢复操作指令 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.4.2.3.1 FR-1: 出现多主时,判断谁是新主 . . . . . . . . . . . . . . . . . . . . . . . . 17
3.4.2.3.2 FR-2: 一键启动集群 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.4.2.3.3 FR-3: 使用 repmgr node rejoin 恢复成集群备机 . . . . . . . . . . . . . . . . 18
3.4.2.3.4 FR-4: 重做备机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.4.2.3.5 FR-5: 查询集群状态 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
I
评论