暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

混合云下Prometheus的集群管理方案(Thanos)

政采云运维团队 2021-10-29
2071

混合云架构特点

业务需求的不同,可能导致平台处于混合云部署模式。混合云架构有如下特点:

  • 基础设施异构: 在混合云架构下,每个云可能各不相同,有些云是公有云,比如阿里云,华为云,腾讯云;有些云是专有云,比如曙光云,电信云,华三云,阿里云,华为云等;不同云上提供的资源类型也不同,公有云上提供的资源类型比较全,比如说ECS, RDS, OSS, VPC, EIP等;专有云上就可能没那么全,比如说只有计算, 网络,存储等资源。

  • 云与云之间的连通会存在时延,点对点,受限的问题: 云与云之间的连通的模式通过公网,专线,VPN, 云企业网,这种连通模式都要求点对点打通连接,受限的,会导致云之间访问时延比较长。

  • 多云运维不便:对于业务部署模式,混合云架构下,在各个云上都会部署一套平台,包括kubernetes集群,中间件,数据库,业务应用等,对应的运维服务也需要单独部署一套,比如监控服务,运维人员需要切换不同的链接对应到不同云监控面板的查看,监控配置管理,特别不方便。

对于运维来说,希望通过统一的控制面进行所有混合云的运维管理,尤其是监控服务,需要有一个监控的统一控制台,该控制台功能包括资产的下发,告警规则的下发,告警通知的发送,以及监控告警数据的查看。Thanos作为prometheus集群管理的开源解决方案,支持从prometheus读取数据进行数据的远程存储(支持对象存储服务,比如oss, minio等),可以对监控数据进行分析,配置告警,并兼容Prometheus的query接口,对接grafana做统一的界面展示。

Thanos架构

thanos从部署架构上可以支持sidecar部署以及receive部署模式。

Thanos sidecar部署模式

在混合云架构下,建议采取Receive模式。

Thanos Receive部署模式

Thanos通过prometheus的remote write方式通过http协议把metric监控数据发送给Thanos Receive。Thanos Receive对数据进行临时存储,并同步数据到对象存储服务。

Thanos Gateway作为数据查询的网关组件,对接Thanos Query的请求, 做监控指标的可视化。

Thanos Ruler做告警规则的配置,触发告警发送给alertmanager, 最终告警会通过AlertManager进行发送。

Thanos从功能上完美的对接了Promenthues生态,包括prometheus, alertmanager, 以及grafana,做Prometheus的多集群管理。

使用Thanos管理Prometheus集群

在混合云模式下,采用Thanos Receive模式进行部署,Thanos部署在统一的运维控制面侧,告警服务AlertManager, 监控可视化服务Grafana也部署在控制面侧。专有云侧通过Promentheus上传数据到云端的Thanos, 本地的Prometheus按需部署alertmanager, grafana。

基于Thanos管理混合云下Prometheus集群

对于运维人员,可以有统一的运维视图, 可以查看告警,查看监控等。

小结

因为一些政策以及安全的要求,在对政府对企业的业务上,混合云运维模式会长久存在,监控服务在混合云下的运维管理可以通过引入Thanos为运维人员提供了统一的管理端,提高了运维人员能效;同时数据存储在云端统一的数据存储端,可以支持数据的长期保存,为AIOPS提供数据支持。


文章转载自政采云运维团队,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论