7.3注意事项
节点替换过程需要注意以下问题:
节点状态转换为 UNAVAILABLE 后,只有在节点替换成功的时候,节点
状态才能转换为 ONLINE。用户不能对 corosync 中的节点状态持久化
文件进行手工操作,如果手工修改持久化文件中的节点状态
(UNAVAILABLE -> ONLINE),会导致数据丢失。
设置节点为 UNAVAILABLE 时,若集群中有大量 ddl event,dml event
或 dmlstorage event 时,程序需要检查所有的 event,判断被设置状
态的节点的备份节点是否正常,有大量 event 时,该过程可能需要较
长时间。
开始节点替换时,若被替换节点有大量 ddl event,dml event 或
dmlstorage event 时,节点替换程序要将被替换节点的所有 event 删
除,该过程可能会需要较长时间。
损坏的节点上有 nocopy 表,数据无法恢复,必须用户手工进行恢
复。
损坏的节点上存在不通过集群命令创建的数据,这些数据无法恢复,
必须用户手工进行恢复。
在节点替换过程中,如果出现 replace.py 命令被强杀或者执行
replace.py 命令的机器掉电等现象,可能会导致集群状态处于
READONLY状态无法自行恢复正常。此时可以使用gcadmin switchmode
normal 恢复集群状态然后继续使用集群。或者再一次执行
replace.py 命令替换节点,节点替换成功后集群状态就恢复正常。
节点替换时,需保证 gbase 用户拥有 GCWare 配置文件
(/etc/corosync/corosync.conf)的访问权限,即该文件的权限属性
应为 644。
用户在执行节点替换前,必须保证执行替换的用户拥有安装程序目录
的读写权限,即可以在该目录下创建文件和子目录。
执行节点替换时,若出现宕机或掉电等情况,将导致替换失败,替换
节点和源节点上可能会有残留数据。此时需要再次执行节点替换,进
行残留数据清理,完成清理后方可重新进行节点替换操作。
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




