监控ping 以及url涉及到的模块为n9e-probe,模块地址为:https://github.com/shanghai-edu/n9e-probe
本例子中,我已经此模块下载回来,可直接部署使用
部署方法:
1、将此模块上传到机器的指定位置(可与agent放在同一路径下),解压,如图:

2、解压后将probe.yml文件放在address.yml相同路径下,如图:

3、编辑address.yml文件,添加probe的配置信息,如图:

4、编辑probe.yml文件,修改内容如下:

说明:ping 位置填写的是需要探测的ip地址信息,url位置填写需要探测的url地址信息,上面的3表示机器所在的服务节点信息,在用户资源中心—节点信息—节点ID,如图:

5、创建probe.service文件,文件内容如下:

6、执行命令启动probe,命令如下:
systemctl enable probe systemctl start probe
7、启动后在监控告警系统—监控看图—即时看图—选择节点—设备无关,可以看到监控指标,如图:

注意:一定是选择设备无关
说明:
ping.latency::ping 请求的延迟,单位是毫秒。-1 表示 ping 不通
url.cert:证书探测。1正常,-1不正常。http 站点则是0
url.latency:http 请求的延迟,单位是毫秒。-1 表示无法访问
url.status_code:返回的状态码
配置告警策略:
例如:探测指定机器的URL信息,配置策略如下:

注意:一定要选择设备无关
然后根据需要配置告警触发条件,本例子为探测1次的返回状态码不等于200则告警,如图:

收到的微信告警如图:

从上图可以看出,当前tomcat已经down,返回状态码为0,所以告警

文章转载自运维DevOps,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




