1. 概述
本文主要介绍在专有云 V3 环境中,盘古 TiantengId 为 1210*以下版本,NAS 集群高水
位的应急处理方法。
1.1. 适用范围
专有云 V3 企业版,NAS
说明:适用于专有云 V3.5.2 及以上版本,盘古 TiantengId 为 1210*以下版本。
1.2. 用户告知
适用平台:x86
授权级别:L2(二线技术支持工程师)
临时或固化方案:临时
操作复杂度:高
预估执行时长:1.5 小时
业务影响:否
说明:此方案仅对盘古和 NAS 侧的最大可用容量限制值调高,不影响客户业务。
风险等级:高
说明:在执行方案操作前,需确保集群终态。
2. 问题描述
NAS 集群的盘古如果被写满,将会造成服务停止,如需要通过删除操作释放部分资源,则
需要额外的空间才能进行删除操作。由于需要先扩容,再删除,因此恢复服务的时间非常
长。可在盘古和 NAS 侧进行容量限制调整,以恢复服务的正常使用。
说明:问题发生的原因是使用过程中,未合理评估可用容量,导致水位过高。
盘古侧:专有云 V3.8.1 之后环境默认的盘古预留空间为 8%,当水位达到 92%则
触发禁写,避免写满盘古。当出现无法写入的情况时,可以通过修改预留空间值的 Flag,
让数据能继续写入,从而优化集群写满时的恢复速度。
NAS 侧:
o 通过限制 youchao_storage_BackupDirMaxSize 的大小,减少 KV 回收站
的数据量。
o 通过 nas_disk_usage_limit 参数设置 NAS 存储限制的上限为集群容量的
94%。
3. 解决方案
评论