欢迎访问 OceanBase 官网获取更多信息:https://www.oceanbase.com/
问题描述
OCP-Agent 通过不同的进程实现监控和管理主机,各进程作用不同,详情可参见 进程清单。如果某个进程异常将可能导致其负责的功能异常,如出现以下现象:
- 租户 页面、 集群 页面、租户的 性能监控 页面、集群的 性能监控 页面、主机的 监控 页签中监控数据缺失。
- 主机磁盘或内存不足,导致创建租户失败或无法创建表分区等,而配置的监控告警却未上报。
- 主机列表 中显示主机的 状态 为离线。
如果出现上述现象,请参照本节查看 ocp-agent 进程是否异常。
可能原因
下表中列出了相关现象的可能原因供您参考。
现象 | 可能原因 | 可查看日志 |
|---|---|---|
主机状态离线 | ocp_agent 相关进程异常 | * /home/admin/ocp_agent/log/agentd.log * /home/admin/ocp_agent/log/agentctl.log |
监控、诊断、日志、告警数据缺失 | ocp_monagent 进程异常 | * /home/admin/ocp_agent/log/monagent.log * /home/admin/ocp_agent/log/ocp_monagent.error.log |
运维操作失败 | ocp_mgragent 进程异常 | * /home/admin/ocp_agent/log/mgragent.log * /home/admin/ocp_agent/log/ocp_mgragent.err.log |
解决办法
- 查看问题主机上是否有进程异常。
- 可通过 OCP 的 主机列表 进入到问题主机,并选择 OCP Agent 页签。在该页签的进程列表中查看进程状态。
- 登录到问题主机,执行 ps -ef 命令查看是否相关进程未被拉起。可参考 进程清单 中说明进行排查。
若存在异常进程则继续执行下一步;若不存在则可能是其他问题,不在本节介绍范围内。
- 参考 OCP-Agent 运维工具 重新启动异常的进程。
启动失败,可通过 进程清单 查看该进程是否有依赖。
如需停止某个进程,请先停其守护进程。
- 查看 ${HOME}/ocp_agent/log 目录下各进程对应的日志中是否有 ERROR 级别的记录。
对 ERROR 级别的记录进行分析找到具体原因。
欢迎访问 OceanBase 官网获取更多信息:https://www.oceanbase.com/
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




