暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
盘古TiantengId为1210以下版本NAS集群高水位的应急处理方法.docx
390
17页
0次
2021-10-14
25墨值下载
1. 概述
本文主要介绍在专有云 V3 环境中,盘古 TiantengId 1210*以下版本,NAS 集群高水
位的应急处理方法。
1.1. 适用范围
专有云 V3 企业版,NAS
说明:适用于专有云 V3.5.2 及以上版本,盘古 TiantengId 1210*以下版本。
1.2. 用户告知
x86
L2线
1.5
NAS
2. 问题描述
NAS 集群的盘古如果被写满,将会造成服务停止,如需要通过删除操作释放部分资源,则
需要额外的空间才能进行删除操作。由于需要先扩容,再删除,因此恢复服务的时间非常
长。可在盘古和 NAS 侧进行容量限制调整,以恢复服务的正常使用。
说明:问题发生的原因是使用过程中,未合理评估可用容量,导致水位过高。
盘古侧:专有云 V3.8.1 之后环境默认的盘古预留空间为 8%,当水位达到 92%
触发禁写,避免写满盘古。当出现无法写入的情况时,可以通过修改预留空间值的 Flag
让数据能继续写入,从而优化集群写满时的恢复速度。
NAS 侧:
o 通过限制 youchao_storage_BackupDirMaxSize 的大小,减少 KV 回收站
的数据量。
o 通过 nas_disk_usage_limit 参数设置 NAS 存储限制的上限为集群容量的
94%
3. 解决方案
3.1. 环境检查
3.1.1. 水位检查
1. 登录天基控制台,在 Project 框中搜索 nas,单击 StandarNasCluster-A-XXX
群右侧的集群运维中心,选择 nas-recycle 服务与 RecycleJob#服务角色,单击机器右边
Terminal,登录对应的机器。
2. 切换为 admin 用户,执行以下命令,查看 Disk Space Free 的百分比。
puadmin summ
系统显示类似如下,若 Free 百分比低于 20%,则需按照此方案对水位进行控制。
3.1.2. 收集 NAS 集群的数据占用信息
收集 NAS 集群的水位占用信息,供阿里云技术支持进行分析。
1. 通过以下地址登录 Pangu Portal 控制台。
http://[$IP]:8620/
说明:[$IP] OPS1 IP 地址
of 17
25墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜