DataX本身作为离线数据同步框架,采用Framework + plugin
架构构建。将数据源读取和写入抽象成为Reader/Writer插件,
纳入到整个同步框架中。
Reader:Reader为数据采集模块,负责采集数据源的数
据,将数据发送给Framework。
Writer: Writer为数据写入模块,负责不断向Framework取
数据,并将数据写入到目的端。
Framework:Framework用于连接reader和writer,作为两
者的数据传输通道,并处理缓冲,流控,并发,数据转换等
核心技术问题。
DataX3.0核心架构
DataX 3.0 开源版本支持单机多线程模式完成同步作业运行,本
小节按一个DataX作业生命周期的时序图,从整体架构设计非常
简要说明DataX各个模块相互关系。
核心模块介绍:
1. DataX完成单个数据同步的作业,我们称之为Job,DataX接
受到一个Job之后,将启动一个进程来完成整个作业同步过
程。DataX Job模块是单个作业的中枢管理节点,承担了数
评论