暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

ocp_agent 进程异常 OceanBase工具学习笔记292

数据库新手 2023-06-22
518

欢迎访问 OceanBase 官网获取更多信息:https://www.oceanbase.com/

问题描述

OCP-Agent 通过不同的进程实现监控和管理主机,各进程作用不同,详情可参见 进程清单。如果某个进程异常将可能导致其负责的功能异常,如出现以下现象:

  • 租户 页面、 集群 页面、租户的 性能监控 页面、集群的 性能监控 页面、主机的 监控 页签中监控数据缺失。
  • 主机磁盘或内存不足,导致创建租户失败或无法创建表分区等,而配置的监控告警却未上报。
  • 主机列表 中显示主机的 状态 为离线。

如果出现上述现象,请参照本节查看 ocp-agent 进程是否异常。

可能原因

下表中列出了相关现象的可能原因供您参考。

现象

可能原因

可查看日志

主机状态离线

ocp_agent 相关进程异常

* /home/admin/ocp_agent/log/agentd.log * /home/admin/ocp_agent/log/agentctl.log

监控、诊断、日志、告警数据缺失

ocp_monagent 进程异常

* /home/admin/ocp_agent/log/monagent.log * /home/admin/ocp_agent/log/ocp_monagent.error.log

运维操作失败

ocp_mgragent 进程异常

* /home/admin/ocp_agent/log/mgragent.log * /home/admin/ocp_agent/log/ocp_mgragent.err.log

解决办法

  1. 查看问题主机上是否有进程异常。
    • 可通过 OCP 的 主机列表 进入到问题主机,并选择 OCP Agent 页签。在该页签的进程列表中查看进程状态。
    • 登录到问题主机,执行 ps -ef 命令查看是否相关进程未被拉起。可参考 进程清单 中说明进行排查。

若存在异常进程则继续执行下一步;若不存在则可能是其他问题,不在本节介绍范围内。

  1. 参考 OCP-Agent 运维工具 重新启动异常的进程。

启动失败,可通过 进程清单 查看该进程是否有依赖。

如需停止某个进程,请先停其守护进程。

  1. 查看 ${HOME}/ocp_agent/log 目录下各进程对应的日志中是否有 ERROR 级别的记录。

对 ERROR 级别的记录进行分析找到具体原因。

欢迎访问 OceanBase 官网获取更多信息:https://www.oceanbase.com/

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论