更换硬盘必读
节点磁盘故障时,请用户确认该节点上除OS盘外,是否存在多种RAID类型(如同时存在元数据的RAID1和数据NonRAID),并按照相应的处理方式进行操作。
不存在多种RAID类型
GaussDB 200集群节点硬盘出现故障时,首先需要按照以下步骤进行排查。
如果节点使用的硬盘做了RAID1,单硬盘故障对进程来说并不感知,只需更换新的硬盘后两块硬盘间同步数据即可。
- 使用PuTTY工具以root用户登录故障节点。
- 执行ps -ef | grep -v "grep" | grep "diskmgt"命令,查看系统中是否存在diskmgt进程。
- 是,执行3。
- 否,执行8。
- 联系硬件工程师将故障磁盘在线拔出。
如果主管理节点LocalBackup分区故障,需要先手动主备倒换,再进行故障节点磁盘插拔。磁盘更换后,主备数据同步需要3小时左右完成。
- 登录FusionInsight Manager,检查系统上报“ALM-12014 分区丢失”告警后,检查故障节点的“/etc/fstab”文件中该硬盘的mount记录是否已经删除。
- 是,执行6。
- 否,执行5。
- 编辑“/etc/fstab”文件,手动删除该硬盘的mount记录。
- 参考硬件厂商相关指导,完成磁盘更换及RAID配置。
启动操作系统后,diskmgt进程会自动进行磁盘分区、格式化、挂载等处理,约需要30分钟(视磁盘容量,处理时间会不同)。
- 执行mount命令,检查硬盘是否已挂载目录。
- 是,登录FusionInsight Manager,手动清除该硬盘对应的告警(“ALM-12014 分区丢失”、“ALM-12015 设备分区文件系统只读”),操作结束。
- 否,联系技术支持。
- 系统中不存在diskmgt进程时,需要更换硬盘。对于各分区硬盘故障场景,请参考以下章节进行处理。
- OM DB分区目录挂载硬盘故障
- LocalBackup分区目录挂载硬盘故障
存在多种RAID类型
- 以root用户身份登录磁盘故障节点。
- 执行以下命令,停止diskmgt进程:
/usr/local/diskmgt/script/diskmgt.sh -k
- 对于各分区硬盘故障场景,请参考以下章节进行处理。
- OM DB分区目录挂载硬盘故障
- LocalBackup分区目录挂载硬盘故障
- 执行以下命令,启动diskmgt进程:
/usr/local/diskmgt/script/diskmgt.sh -s
查看更多:华为GaussDB 200 硬盘故障处理
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。