一、ZooKeeper介绍
Zookeeper是Apache开源的一个分布式框架,它主要为分布式应用提供协调服务。
Zookeeper最早由雅虎研究院开发,是Google Chubby的开源实现,后来托管到Apache,并于2010年
11月正式成为Apache的顶级项目。
有个比较有意思的是,大数据生态系统里很多组件选用动物或昆虫来命名,比如我们所熟知的
Hadoop是头可爱的大象、Hive是一只蜜蜂、Camel是一头骆驼,ZooKeeper图像是什么呢,是一个动物
园管理者。
Apache ZooKeeper是一个开源的分布式协调服务,它为分布式应用提供了一套简单而强大的基础架
构服务,用以实现诸如配置管理、命名服务、分布式同步以及提供组服务等功能。ZooKeeper的设计目
标是将这些复杂的分布式协调过程封装成一个简单的接口,从而使分布式应用的开发变得更加容易和可
靠。
核心概念
ZooKeeper的数据模型类似于一个文件系统,以层次化的目录树形式组织数据,每个节点称为一个
Znode。这些Znode可以存储数据,并且可以有子节点。不仅如此,ZooKeeper还为这些Znode提供了
临时节点和观察者(Watcher)机制,增强了其在分布式环境中的应用场景。
临时节点:这是一种特殊类型的节点,当创建它的客户端会话结束时,这个节点会被自动删
除。这对于实现锁和选举机制非常有用。
观察者(Watcher):客户端可以在Znode上设置观察者,当这个Znode发生变化(如数据更
改、节点删除、子节点变化)时,设置了观察者的客户端会收到通知。
使用场景
ZooKeeper在分布式系统中的典型使用场景包括:
配置管理:动态地更新和管理分布式环境中的配置信息。
命名服务:为分布式系统中的资源和服务提供全局唯一的名称。
分布式锁:在分布式环境中协调和控制资源的访问。
集群管理:监控入群和退群的节点,以及节点状态的变化。
强一致性保证
ZooKeeper保证了一系列强一致性的特性,包括顺序一致性、原子性、单一视图、可靠性和实时性
(或最终一致性)。这些保证使得ZooKeeper成为构建可靠分布式系统的坚实基础。
开发和运行要求
ZooKeeper用Java编写,因此它需要Java运行时环境。根据ZooKeeper的不同版本,对Java版本有不
同的要求,通常推荐使用Java 8或更高版本以确保最佳兼容性和性能。
二、ZooKeeper与ClickHouse-Keeper对比
ClickHouse-Keeper是ClickHouse从21.8版本开始引入的一个组件,旨在作为ZooKeeper的替代
品,用于管理ClickHouse集群的元数据和一些协调任务。下面是基于集成度、性能、配置和维护、兼容
性、功能、社区和支持、稳定性和成熟度、开发语言、快照和日志处理等几个维度,对ClickHouse-
Keeper和原生ZooKeeper进行的对比。
集成度
文档被以下合辑收录
评论