暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

故障处理:华为云平台HCS云硬盘发放失败

IT那活儿 2023-12-18
1009

点击上方“IT那活儿”公众号--专注于企业全栈运维技术分享,不管IT什么活儿,干就完了!!!  

产品版本:华为云stack6.5.1

背     景:当并发创建虚拟机时,出现大范围创建失败,经初步定位发现是创建系统盘失败且存储容量富余。




问题描述




并发创建虚拟机时,创建系统盘需要下载镜像,若系统盘镜像较大,下载时间长,则cinder-volume进程将消耗大量资源进行镜像的读写,此时,如果请求创建虚拟机的并发量大,则可能出现大范围创建系统盘失败的情况。

可能原因:

当前FusionSphere OpenStack系统内存资源隔离中,为cinder-volume进程对应角色blockstorage-driver-kvm00X隔离的内存资源为2G,当并发创建虚拟机时,创建系统盘需要下载镜像,若系统盘镜像比较大,则cinder-volume进程将消耗大量内存进行镜像下载,当并发量高时,超过资源隔离限定的2G内存,会导致cinder-volume进程因资源不足被cgroup重启。




处理步骤



首先确认创建失败的系统盘所在的资源池cinder-kvm00X,然后检查存储池容量富余,当FusionSphere OpenStack节点与对应存储设备间链路通畅时,查看cinder-volume00XControl日志可看到cinder-volume进程在不断被重启。此时可确认该问题由cinder-volume资源不足引起,需要增加cinder-volume进程节点数量以增加对应内存资源。

2.1 通过反向代理IP地址登录FusionSphere OpenStack的安装部署界面
FusionSphere OpenStack安装部署界面:
  • Type1场景登录地址
    级联层FusionSphere OpenStack反向代理IP地址,URL格式为:https://级联层FusionSphere OpenStack反向代理IP地址:8890,例如:"https://192.168.211.90:8890"。
  • Type2&Type3场景登录地址
    FusionSphere OpenStack反向代理IP地址,URL格式为https://FusionSphere OpenStack反向代理IP地址:8890,例如:"https://192.168.211.90:8890"。
2.2 进入“配置 > 资源池管理”
在“存储集群”中找到相应的资源池cinder-kvm00X,其对应的AZ为目标AZ,单击,进入资源池详情页面。
2.3 选择主机部署服务模块
在资源池详情页面下方的“选择主机部署服务”模块中,先在可用分区搜索框中选择目标AZ进行过滤,然后在下方主机列表中勾选未被勾选的1-2个主机进行部署blockstorage-driver-kvm00X角色,使整体部署blockstorage-driver-kvm00X角色的主机数量在4-5个之间。

单击“提交”。
END



本文作者:王 飞(上海新炬中北团队)

本文来源:“IT那活儿”公众号

文章转载自IT那活儿,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论