
今天的分享主要围绕着我所主导和重度参与的两个开源项目,Open-Falcon 和夜莺监控展开,管中窥豹,和大家一起探讨交流监控系统的发展和演进。
大家可以看到,在CNCF landscape中,在监控分析这个大的领域中,涌现出了特别多的优秀项目,为什么会发生这样的变化?

用经验总结编织、及时调“方向”,以反思复盘催熟Open-Falcon“新计划”
微服务和云原生,带来好处的同时却也有代价?
但代价是什么?微服务和云原生,给系统的可维护性,带来了巨大的挑战,系统的整体复杂度和系统之间的相互依赖程度更高,因此,监控分析,成为一个关键支撑因素。Open-Falcon 和夜莺监控,也是在这样的大背景下,发展和成长起来的。
要回答Open-Falcon为什么会流行,那就得先回到2013年,从需求说起。当时我在小米工作,公司的互联网业务飞速发展,业务规模越来越大,监控系统的容量有限和业务的体量快速膨胀,成为核心矛盾。

Open-Falcon架构设计上的思考要点
Open-Falcon掉队,发展卡在“瓶颈”关口

瓶颈二,原因在于,Open-Falcon关注的更多是物理机架构的监控方案,未能很好的跟上云原生架构转型的步伐。
云原生监控的发展特点和趋势再分析
那云原生时代的监控,有怎样的特点和变化趋势呢?

把好看、简单、功能全面,摆在第一位

5、Go语言开发,安全,易维护,架构简洁;

夜莺监控由数据采集器、告警引擎、可视化引擎、告警自愈引擎构成。夜莺的设计非常简单,核心是 server 、webapi、frontend 三个模块。

4、Go语言开发:安全、易分发、易安装维护,插件化。
告警功能:
1、支持多数据源告警,Prometheus、Victoriametrics、M3DB、Thanos,ElasticSearch、SLS;
2、多种告警判定策略,多条件策略,生效周期,产品化配置和管理;
3、多通知渠道和自定义通知模版;
4、支持故障自愈和告警 Webhook;
5、支持告警聚合、收敛、排班、协同(需要对接Flashcat SaaS应用);
自研可视化引擎,对标Grafana:
俗话讲,一图胜千言,可视化是透传数据价值最直接的手段。夜莺监控的 Dashboard 不仅从功能、设计上可以对标 Grafana,同时也兼容 Grafana,要是你觉得 Grafana 某个 Dashboard 非常有用,甚至可以直接导入到夜莺监控中使用。
此外,夜莺监控的 Dashboard 支持多种数据源,比如时序数据库 Prometheus、Victoriametrics、M3DB、Thanos,又比如日志·数据源 ElasticSearch、SLS 等。
曾挨“几拳”再爬起,破局“出圈”弄潮博浪


|嘉宾介绍|

来炜 快猫星云创始人






