暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

华为GaussDB A ALM-37028 网卡多队列未配置

墨天轮 2019-10-12
775

ALM-37028 网卡多队列未配置

告警解释

当出现如下情况时,产生该告警:

当前节点业务IP对应网卡未设置网卡中断或未将网卡中断绑定在不同的CPU核心上。

告警属性

告警ID

告警级别

是否自动清除

37028

重要

告警参数

参数名称

参数含义

Source

产生告警的集群名称

ServiceName

上报告警的服务名

RoleName

上报告警的角色名

HostName

上报告警的主机名

对系统的影响

当未绑定网卡多队列时,数据库仍然可以正常使用,但是数据库集群的可靠性和性能将会降低。

可能原因

未停止irqbalance服务,导致在高负载下中断绑定被irqbalance服务动态调整,引起绑定漂移。

处理步骤

  • 在FusionInsight Manager界面,选择“运维 > 告警 > 告警”,在告警列表中单击此告警所在行的。从“定位信息”中获取产生该告警的集群名称、节点主机名称以及实例名称。
  • 选择“集群 > 产生告警的集群名称 > 服务 > MPPDB > 实例”,获取安装了MPPDB服务的节点。
  • 使用omm用户登录MPPDB服务所在的任意节点。

  • 初始化环境变量。

    source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile

  • 使用gs_check工具在后台检查网卡队列绑定值,找出网卡队列绑定值不合格的节点。

    gs_check -i CheckMultiQueue

    需要输入root用户名和密码。

    系统反馈类似如下信息。

    Check root password connection successfully Distribute the context file to remote hosts successfully Start to health check for the cluster. Total Items:1 Nodes:3 Checking... [=========================] 1/1 Start to analysis the check result CheckMultiQueue.............................NG The item run on 3 nodes. success: 2 ng: 1 The ng[host1] value: Network card [eth0] multi-queue support is not enabled. Analysis the check result successfully Failed. All check items run completed. Total:1 NG:1 For more information please refer to /opt/huawei/Bigdata/mppdb/wisequery/script/gspylib/inspection/output/CheckReport_20190225363008708.tar.gz

    示例中显示检查节点中host1节点上的网卡队列绑定值报NG即不合格。

  • 使用omm用户登录到网卡队列绑定值不一致的任意节点。

  • 初始化环境变量。

    source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile

  • 执行如下命令对所有不合格检查结果进行修复。

    gs_check -i CheckMultiQueue --set

    需要输入root用户名和密码。

    系统反馈类似如下信息。

    Check root password connection successfully Distribute the context file to remote hosts successfully Start to health check for the cluster. Total Items:1 Nodes:3 Checking... [=========================] 1/1 Start to analysis the check result CheckMultiQueue.............................OK The item run on 3 nodes. success: 3 Analysis the check result successfully Success. All check items run completed. Total:1 Success:1 For more information please refer to /opt/huawei/Bigdata/mppdb/wisequery/script/gspylib/inspection/output/CheckReport_201902253655522339.tar.gz

  • 修改完成后重新执行5。

    • 所有节点检查网卡队列绑定值合格,则手动清除告警。
    • 检查结果仍有不合格项,请联系系统管理员,仍不能恢复请联系技术支持。

告警清除

此告警修复后,系统不会自动清除此告警,需手工清除。

参考信息

无。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论