暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

华为GaussDB A 更换硬盘必读

墨天轮 2019-10-12
1636

更换硬盘必读

节点磁盘故障时,请用户确认该节点上除OS盘外,是否存在多种RAID类型(如同时存在元数据的RAID1和数据NonRAID),并按照相应的处理方式进行操作。

不存在多种RAID类型

GaussDB 200集群节点硬盘出现故障时,首先需要按照以下步骤进行排查。

说明:

如果节点使用的硬盘做了RAID1,单硬盘故障对进程来说并不感知,只需更换新的硬盘后两块硬盘间同步数据即可。

  • 使用PuTTY工具以root用户登录故障节点。
  • 执行ps -ef | grep -v "grep" | grep "diskmgt"命令,查看系统中是否存在diskmgt进程。

    • 是,执行3。
    • 否,执行8。

  • 联系硬件工程师将故障磁盘在线拔出。

    如果主管理节点LocalBackup分区故障,需要先手动主备倒换,再进行故障节点磁盘插拔。磁盘更换后,主备数据同步需要3小时左右完成。

  • 登录FusionInsight Manager,检查系统上报“ALM-12014 分区丢失”告警后,检查故障节点的“/etc/fstab”文件中该硬盘的mount记录是否已经删除。

    • 是,执行6。
    • 否,执行5。

  • 编辑“/etc/fstab”文件,手动删除该硬盘的mount记录。
  • 参考硬件厂商相关指导,完成磁盘更换及RAID配置。

    启动操作系统后,diskmgt进程会自动进行磁盘分区、格式化、挂载等处理,约需要30分钟(视磁盘容量,处理时间会不同)。

  • 执行mount命令,检查硬盘是否已挂载目录。

    • 是,登录FusionInsight Manager,手动清除该硬盘对应的告警(“ALM-12014 分区丢失”“ALM-12015 设备分区文件系统只读”),操作结束。
    • 否,联系技术支持。

  • 系统中不存在diskmgt进程时,需要更换硬盘。

    对于各分区硬盘故障场景,请参考以下章节进行处理。
    • OM DB分区目录挂载硬盘故障
    • LocalBackup分区目录挂载硬盘故障

存在多种RAID类型

  • root用户身份登录磁盘故障节点。
  • 执行以下命令,停止diskmgt进程:

    /usr/local/diskmgt/script/diskmgt.sh -k

  • 对于各分区硬盘故障场景,请参考以下章节进行处理。

    • OM DB分区目录挂载硬盘故障
    • LocalBackup分区目录挂载硬盘故障

  • 执行以下命令,启动diskmgt进程:

    /usr/local/diskmgt/script/diskmgt.sh -s


查看更多:华为GaussDB 200 硬盘故障处理
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论