本章主要介绍日常对 OceanBase 集群进行巡检应该检查的事项,包含 OceanBase 集群的核心指标,范围涉及性能、可用性、资源水位和数据备份。为了及时发现和修复 OceanBase 的隐患,建议您重点关注 OceanBase 的日常巡检结果。
概述
本章节将分篇介绍日常巡检相关的以下内容:
OceanBase 数据库支持对集群的运行状态和合并状态检查,集群运行状态检查会全面排查集群的运行情况,针对有异常的地方产生相应的异常报告,您可以根据巡检报告查看异常项,并进行相应处理;合并状态检查会查看合并状态是否健康,异常会导致基线数据和增量数据无法合并,因此需要关注。
OceanBase 数据库支持对集群最佳实践的参数进行检查。在问题分析阶段,您可通过检查集群参数来进行问题排查,您可以修改日志打印级别来获取更多的参数日志信息,待问题确定并修复后,请修改回原来的参数。
OceanBase 数据库该检查项支持对主机状态进行检查,包括不限于磁盘水位、主机时间和主机负载。
OceanBase 数据库支持对租户资源使用进行检查,包括不限于 CPU 、内存、副本数和磁盘。
OceanBase 数据库支持对集群资源使用进行检查,包括不限于 CPU 、内存、副本数和磁盘。
OceanBase 数据库支持对 OBServer 的状态检查,包括进程是否存在、副本数等。
OceanBase 数据库支持对主机 NTP 偏移量的检查,OceanBase 集群主机节点的 NTP 偏移量如果相差太大,可能会导致选主异常。
OceanBase 数据库支持对备份的检查,包括备份成功与否、备份速度和备份进度。
OceanBase 数据库支持对 OBProxy 连接状态的检查。客户端通过 OBProxy 访问 OceanBase 集群,如果 OBProxy 连接异常,会导致客户端请求集群异常。




