暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

夜莺问题排查思路(请看完再提问)

夜莺监控 2021-12-29
606
  • 官网文档要读完,B站视频(搜索夜莺v5.0正式版)要看完,文档和视频里有答案的问题就不要问了

  • 检查进程和端口存活性,根据架构图检查各个模块

  • 检查各个进程的异常日志,如果是systemd托管的进程,使用journalctl -f -u <service>方式查看

  • 如果用systemd托管的,可以先不用systemd,直接手工命令行运行二进制看看报错

  • WEB上如有功能异常,要先打开浏览器开发者工具,看看接口返回了什么内容,如果看不懂,可以从开发者工具中截取请求的request和response信息,在星球里提问

  • 监控数据对时间一致性要求很高,检查机器时间用NTP校准了么,目标机器和监控服务端的时间一定不能相差超过1秒


如果以上排查了都是正常的,肯定有遗漏再排查一遍(只要有异常一定会有日志)。


如果实在搞不定,可以在星球提问,提问时选择要提问的人,否则系统无法通知到被提问者,另外请说明以下信息:


  • 问题是什么

  • 如何复现

  • 相关模块的日志贴一下,比如server模块、webapi模块、Telegraf(如果用到了)

  • server.conf和webapi.conf的配置贴一下

  • 页面上一些相关配置贴一下,比如告警有问题,至少要贴一下告警规则、告警事件详情;看图有问题,至少要贴一下promql,至少要贴一下在即时查询里查询promql的结果


只是说:我这白屏了、我这没有收到报警、我这不出图,这样的问问题的方式神仙难解。如果你连这些信息都没有时间写,凭什么认为我就有时间帮你呢,我也有工作和生活,另外,开源软件代码都在github,觉得有问题可以直接看代码,代码有问题可以直接提PR,别说什么我不是开发或我不懂go语言,你不懂难道还成了我的责任了...


如果想要更高时效性的反馈,请采购我们的技术支持服务,我们有很多小伙伴轮班帮你解决问题。


开源软件是我有一个idea,并且我也实现了第一版本的solution,你也有类似的问题困境,也认可这个solution,于是共同参与完善。而不是我用了你的开源软件我是大爷,说话颐指气使,毫无礼貌,不好意思,爷不伺候!



文章转载自夜莺监控,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论