暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

GaussDB日常运维—检查活动状态

Olivia 2023-08-03
210

检查活动状态:
通过检查,确认集群和数据库处于正常运行状态,可以对外提供数据服务。
主要涉及项:
1、实例状态:

gs_om -t status
查询返回集群状态,正常状态应为Normal,Balanced为Yes.
gs_om -t status --detail
详细查看集群各节点上的实例进程状态
2、会话信息:

SOL>SELECT * FROM pg_stat_activity;
SOL>SHOW max_active_statements;
当前CN会话数和允许的最高连接会话数量。

SOL>SELECT usename, pid, application_name,client_addr
FROM pg_stat_activity ORDER BY usename, pid;
当前CN的数据库连接数,以用户和线程ID分组。

SOL>SELECT pg_terminate_backent(pid);
强行停止会话
3、参数检查:

SOL>SHOW max_active_statements;
查询给定参数的设置值。示例参数缺省值为60,推荐设置为CPU内核数*2.5/ DN总数。
4、参数修改:

gs_guc reload -Z coordinator -N all -I all -c “max_active_statements=10”
gs_guc reload -Z datanode -N all -I all -c “max_active_statements=10”
5、实例异常:
当连接数据库出现缓慢、挂起等现象,需要进行诊断和分析,甚至可能需要重新启动数据库实例。
1)集群健康检查
检查操作系统参数。
gs_checkos -i A
检查集群数据库状态。
gs_check -i CheckClusterState
检查数据库性能
gs_checkperf
2)修复故障实例
查找异常实例
gs_om -t status --detail
修复异常实例。
gs_replace -t config -h hostl, host2
gs_replace -t start -h host1 , host2
重置实例状态,以保证集群各主机的负载均衡
gs_om -t switch --reset
6、信息采集:

gs_collector --begin-time=“20230131 23:00” -end-time=“20180201 20:00” -h host1
通过采集系统的Hang信息、系统状态信息等,可以分析系统挂起的原因,间隔采样,可以用于对比变化,辅助分析。
7、清理运行日:

cd $GAUSSLOG
rm 日志名称
注意: 请谨慎清理,确保所清理的日志不影响未来问题定位。
8、停库:

1)安全停库
gs_om -t stop -m smart
如果数据库出现异常需要重新启动,可以通过示范命令等待用户业务结束后退出,以保证主备关系的实例数据一致。
2)强制停库
gs_om -t stop -m immediate
如果安全方式不能顺利关闭数据库,可以不等待业务结束直接退出集群。主备关系的实例数据可能不一致。
image.png

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论