详细步骤
1、检查坏盘被哪些服务使用,将使用该磁盘的服务对应的角色停掉
先检查磁盘是否作为集群hdfs、inceptor、yarn组件的数据盘或者元数据盘在使用,相关的服务以及配置项:
hdfs:dfs.datanode.data.dir、dfs.namenode.name.dir
inceptor:ngmr.fastdisk.dir、ngmr.localdir
yarn:yarn.nodemanager.local-dirs、yarn.nodemanager.log-dirs
例如检查 hdfs 服务数据路径或者元数据路径是否使用了坏盘,依次检查inceptor、yarn 等服务的。
如果需要更换的节点磁盘在 hdfs 和 inceptor 、yarn 的这几个参数均有配置,请先停止该节点上的 datanode 角色、
NameNode 角色、inceptor server 角色、nodemanager、resourcemagaer;
2、将该坏盘从角色配置中删除,并配置服务
在以上几个参数的配置项中移除挂载该磁盘的目录,具体根据集群实际环境而定。
如果只作为数据盘在使用 (只有参数 dfs.datanode.data.dir 包含节点坏盘挂载的目录),只需要停 datanode 角色
即可,移除 dfs.datanode.data.dir 参数中关于磁盘配置。
修改完参数后,配置页面 “保存更改”,“更多操作”,“配置服务”使其生效;
然后到对应节点卸载磁盘: umount /dev/sdx /mnt/diskx ,清除故障盘完成
评论