ALM-37028 网卡多队列未配置
告警解释
当出现如下情况时,产生该告警:
当前节点业务IP对应网卡未设置网卡中断或未将网卡中断绑定在不同的CPU核心上。
告警属性
告警ID |
告警级别 |
是否自动清除 |
---|---|---|
37028 |
重要 |
否 |
告警参数
参数名称 |
参数含义 |
---|---|
Source |
产生告警的集群名称 |
ServiceName |
上报告警的服务名 |
RoleName |
上报告警的角色名 |
HostName |
上报告警的主机名 |
对系统的影响
当未绑定网卡多队列时,数据库仍然可以正常使用,但是数据库集群的可靠性和性能将会降低。
可能原因
未停止irqbalance服务,导致在高负载下中断绑定被irqbalance服务动态调整,引起绑定漂移。
处理步骤
- 在FusionInsight Manager界面,选择“运维 > 告警 > 告警”,在告警列表中单击此告警所在行的
。从“定位信息”中获取产生该告警的集群名称、节点主机名称以及实例名称。
- 选择“集群 > 产生告警的集群名称 > 服务 > MPPDB > 实例”,获取安装了MPPDB服务的节点。
- 使用omm用户登录MPPDB服务所在的任意节点。
- 初始化环境变量。
source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile
- 使用gs_check工具在后台检查网卡队列绑定值,找出网卡队列绑定值不合格的节点。
gs_check -i CheckMultiQueue
需要输入root用户名和密码。
系统反馈类似如下信息。
Check root password connection successfully Distribute the context file to remote hosts successfully Start to health check for the cluster. Total Items:1 Nodes:3 Checking... [=========================] 1/1 Start to analysis the check result CheckMultiQueue.............................NG The item run on 3 nodes. success: 2 ng: 1 The ng[host1] value: Network card [eth0] multi-queue support is not enabled. Analysis the check result successfully Failed. All check items run completed. Total:1 NG:1 For more information please refer to /opt/huawei/Bigdata/mppdb/wisequery/script/gspylib/inspection/output/CheckReport_20190225363008708.tar.gz
示例中显示检查节点中host1节点上的网卡队列绑定值报NG即不合格。
- 使用omm用户登录到网卡队列绑定值不一致的任意节点。
- 初始化环境变量。
source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile
- 执行如下命令对所有不合格检查结果进行修复。
gs_check -i CheckMultiQueue --set
需要输入root用户名和密码。
系统反馈类似如下信息。
Check root password connection successfully Distribute the context file to remote hosts successfully Start to health check for the cluster. Total Items:1 Nodes:3 Checking... [=========================] 1/1 Start to analysis the check result CheckMultiQueue.............................OK The item run on 3 nodes. success: 3 Analysis the check result successfully Success. All check items run completed. Total:1 Success:1 For more information please refer to /opt/huawei/Bigdata/mppdb/wisequery/script/gspylib/inspection/output/CheckReport_201902253655522339.tar.gz
- 修改完成后重新执行5。
- 所有节点检查网卡队列绑定值合格,则手动清除告警。
- 检查结果仍有不合格项,请联系系统管理员,仍不能恢复请联系技术支持。
告警清除
此告警修复后,系统不会自动清除此告警,需手工清除。
参考信息
无。
- 修改完成后重新执行5。
- 使用omm用户登录到网卡队列绑定值不一致的任意节点。
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。