暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

华为GaussDB A ALM-25004 LdapServer数据同步异常

墨天轮 2019-10-12
865

ALM-25004 LdapServer数据同步异常

告警解释

当Manager中LdapServer数据内容不一致时,产生该告警,当两者的数据一致时,对应告警恢复。

当集群中LdapServer与Manager中的LdapServer数据内容不一致时,产生该告警,当两者的数据一致时,对应告警恢复。

告警属性

告警ID

告警级别

是否自动清除

25004

紧急

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

产生告警的主机节点信息。

对系统的影响

LdapServer数据不一致时,有可能是Manager上的LdapServer数据损坏,也有可能是集群上的LdapServer数据损坏,此时数据损坏的LdapServer进程将无法对外提供服务,影响Manager和集群的认证功能。

可能原因

  • LdapServer进程所在的节点网络故障。
  • LdapServer进程异常。
  • OS重启导致的LdapServer数据损坏。

处理步骤

检查LdapServer所在的节点网络是否故障。

  • 在FusionInsight Manager界面,选择“运维 > 告警 > 告警”。记录该告警定位信息中的“HostName”的IP地址为IP1(若出现多个告警,则分别记录其中的IP地址为IP1、IP2、IP3等)。
  • 联系运维人员,使用PuTTY工具登录IP1节点,在这个节点上使用ping命令检查该节点与主OMS节点的管理平面IP是否可达。

    • 是,执行4。
    • 否,执行3。

  • 联系网络管理员恢复网络,然后查看“ALM-25004 LdapServer数据同步异常”告警是否恢复。

    • 是,处理完毕。
    • 否,执行4。

检查LdapServer进程是否正常。

  • 在FusionInsight Manager的“告警”页面,查看是否有LdapServer的“ALM-12004 OLdap资源异常”告警产生。

    • 是,执行5。
    • 否,执行7。

  • 按照ALM-12004 OLdap资源异常提供的步骤处理该告警。
  • 在告警列表中查看“ALM-25004 LdapServer数据同步异常”告警是否清除。

    • 是,处理完毕。
    • 否,执行7。

  • 在FusionInsight Manager的“告警”页面,查看是否有LdapServer的“ALM-12007 进程故障”告警产生。

    • 是,执行8。
    • 否,执行10。

  • 按照ALM-12007 进程故障提供的步骤处理该告警。
  • 在告警列表中查看“ALM-25004 LdapServer数据同步异常”告警是否清除。

    • 是,处理完毕。
    • 否,执行10。

检查是否存在因为OS重启导致LdapServer数据损坏。

  • 在FusionInsight Manager界面,选择“运维 > 告警 > 告警”。记录该告警定位信息中的“HostName”的IP地址为IP1(若出现多个告警,则分别记录其中的IP地址为IP1,IP2,IP3等)。选择“集群 > 待操作集群的名称 > 服务 > LdapServer > 配置”,记录LdapServer的端口号PORT(若告警定位信息中的IP地址为备管理节点IP地址,选择“系统 > OMS > oldap > 修改配置”,记录LdapServer服务监听端口号)。
  • 使用PuTTY工具以omm用户登录IP1节点。

  • 执行以下命令,观察查询出来的内容是否提示有error错误信息。

    ldapsearch -H ldaps://IP1:PORT -LLL -x -D cn=root,dc=hadoop,dc=com -W -b ou=Peoples,dc=hadoop,dc=com

    • 是,执行13。
    • 否,执行15。

  • 使用告警出现日期之前的备份文件进行LdapServer恢复和OMS恢复。

    • FusionInsight HD,参考《管理员指南》的“恢复Manager数据”章节。
    • GaussDB 200GaussDB 300,参考《GaussDB 200 管理员指南》/《GaussDB 300 管理员指南》的“创建恢复任务”章节。
    说明:

    必须使用同一时间点的OMS和LdapServer备份数据进行恢复,否则可能造成业务和操作失败。当业务正常时需要恢复数据,建议手动备份最新管理数据后,再执行恢复数据操作,否则会丢失从备份时刻到恢复时刻之间的Manager数据。

  • 在告警列表中查看“ALM-25004 LdapServer数据同步异常”告警是否清除。

    • 是,处理完毕。
    • 否,执行15。

收集故障信息。

  • 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  • 在“服务”中勾选待操作集群的“LdapServer”和“OmsLdapServer”。
  • 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。
  • 请联系技术支持,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

配置恢复任务具体操作步骤请参考《管理员指南》。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论