点击上方“IT那活儿”公众号,关注后了解更多内容,不管IT什么活儿,干就完了!!!
Kafka作为一款高性能、低延迟的分布式消息系统,已经成为应用系统中常用的消息中间件。在使用Kafka进行数据传输的过程中,可能会出现各种不同的故障情况,需要运维人员进行快速处理。
本文将围绕Kafka日常运维和故障处理展开,分享方案。
1. 系统监控
2. 系统配置
修改Broker和ZooKeeper配置; 优化Topic配置; 优化JVM配置和网络等。
3. 系统备份
Kafka系统备份主要是将Broker的日志数据进行备份,并进行定期备份。因为Kafka的日志数据是分布式的,所以备份可能会带来较大的数据变化量。
1. Broker宕机
2. ZooKeeper宕机
3. Topic无法消费
- Kafka集群不可用; - 没有正确配置消费者; - 消费者组被删除了; - 背后的Kafka主题已被删除; - 消费者没有预期的分组管理器分配分区。
4. 消费速度慢
5. 磁盘空间不足
结 论:

本文作者:事业二部(上海新炬中北团队)
本文来源:“IT那活儿”公众号

文章转载自IT那活儿,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




