暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

GreenPlum统一运维之健康度模型

IT那活儿 2024-07-30
86

点击上方“IT那活儿”公众号--专注于企业全栈运维技术分享,不管IT什么活儿,干就完了!!!


健康度建立原则

根据数据库各个视图和及监控脚本,实时监控一段时间内数据库运行状态情况,得到各个性能指标,根据一定的规则加权后得到总健康度 值以使管理员大致了解数据库监控情况。

总体原则为需要可以根据健康度各项分数体现数据库性能变化的趋势,每项值的减少可以体现数据库性能的变化,累积到一定程度即可反映数据库的性能影响。部分值的影响变化会直接影响数据库的健康度,例如有数据库节点异常直接表示数据库不健康。


健康度评分标准

  • 通过最佳时间,健康度满分为100分;

  • 90 分以上数据库总体健康;
  • 80-90 分 数据库运行压力较大需要关注;
  • 80分以下数据库不健康,需要查看扣分原因。
特殊情况,例如网络存在丢包情况,数据库master节点异常,应立即判定数据库不健康。

健康度评分矩阵

该健康度评分矩阵,主要分别从数据库、主机两个维度,10个关键技术指标;通过评分细则进行数据库整体健康度打分。

GP数据库健康度模型

健康度项
评分标准
单项评分
满分总分
权重
加权后总分
权重总分
主机健康度
CPU使用率
>90%
30
 
0.1
 
5
<80%
40
 
 
>80%,<90%
50
 
 
内存使用率
使用到swap
10
 
0.1
 
5
>90%
40
 
 
<90%
50
 
 
IO wait情况
无IO wait情况
100
 
0.1
 
10
<10%
80
 
 
>10%
60
 
 
网络情况
ping或者netstat存在丢包
0
 
0.2
 
20
无丢包
100
 
 
数据目录使用率
使用率<70%
100
 
0.1
 
10
70%<使用率<85%
60
 
 
使用率>85%
30
 
 
数据目录倾斜率
大于5%(最大目录使用率减去最小目录使用率)
50
 
0.1
 
10
小于2%
90
 
 
无倾斜
100
 
 
数据库健康度
数据库资源队列
存在锁等时间超2小时sql
60
 
0.05
 
5
存在锁等时间超6小时sql
40
 
 
所有sql执行时间小于2小时
100
 
 
数据库节点状态
所有节点正常
100
 
0.2
 
20
master节点异常
0
 
 
primary segment 异常
25
 
 
mirror segment异常
25
 
 
同组主备segment异常
0
 
 
用户连接数
等于600
0
 
0.1
 
10
大于400
70
 
 
小于400
100
 
 
膨胀表情况
存在pg_catalog系统膨胀表
60
 
0.05
 
5
无膨胀表
100
 
 
存在其他膨胀表

80

 
 

END


本文作者:唐田寿(上海新炬中北团队)

本文来源:“IT那活儿”公众号

最后修改时间:2024-07-30 14:18:00
文章转载自IT那活儿,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论