
- 1 -
Kettle 中的集群
目录
KETTL E 中的集群 ................................................................................................................................................1
1 设计 ...................................................................................................................................................................2
1.1
定义
Cluster schema .........................................................................................................................2
1.2 定义转换 ...................................................... 5
2 执行转换 ..........................................................................................................................................................7
2.1 启动子服务器................................................... 7
2.1.1
脚本启动
........................................................................................................................................7
2.1.2
程序启动
........................................................................................................................................9
2.1.3
子服务器内幕
............................................................................................................................ 10
2.2 运行转换 ..................................................... 12
2.2.1
在
spoon
中运行
........................................................................................................................ 12
2.2.2
编程运行
..................................................................................................................................... 13
2.2.3
运行内幕
..................................................................................................................................... 13
Kettle 是一款开源的 ETL 工具,以其高效和可扩展性而闻名于业内。其高效的一个重
要原因就是其多线程和集群功能。
Kettle 的多线程采用的是一种流水线并发的机制,我们在另外的文章中专门有介绍。这里
主要介绍的是 kettle 的集群。
集群允许转换以及转换中的步骤在多个服务器上并发执行。在使用 kettle 集群时,首先
需要定义的是 Cluster schema。所谓的 Cluster schema 就是一系列的子服务器的集合。在
评论