第1章 系统介绍
1.1 系统简介
ETL平台用于数据的抽取、转换、加载,为数据比对提供数据的采集、转换、导入、导出等功能。
第2章 系统管理
2.1 基本概念
- 数据库连接:用户自定义的,在转换或作业中使用的数据库连接。
- 转换:数据抽取、转换、加载流程的封装。
- 作业:将多个转换或一些任务封装,用于ETL任务的执行。
- 知识库:固定存储已建立好的连接、转换或作业的位置。
- 数据流:分输入流和输出流,输入流是离开一个步骤时的行的堆栈,输出流是进入一个步骤时的行的堆栈。
- 节点连接:连接两个步骤的连线。
2.2 主界面介绍
【功能描述】
- 浏览和管理知识库。
- 增加数据库连接。
- 增加转换或作业。
- 导入、导出XML文件。
【操作步骤或操作内容】
功能1:浏览和管理知识库
1、用户进入ETL平台,点击『知识库』页签,可浏览知识库,如下图所示:
2、双击其中一个数据库连接、采集作业或转换,可打开相应的页面,进行查看、运行、修改和删除。
功能2:增加数据库连接
单击图标,选择『新建数据库连接』选项,打开如下图所示窗口:
连接类型:选择数据库类型。
访问方法:推荐使用JDBC。
连接名称:用户自定义。
服务器主机:填写数据库服务器IP地址。
数据库名称:填写数据库名称。
数据库表空间:填写数据库的用户数据表空间名称。
索引表空间:填写数据库的索引表空间名称。
端口号:填写数据库使用的端口号。
用户名和密码:登陆数据库的用户名和密码。
功能3:增加转换或作业
单击图标,选择『新建转换』或『新建转换』选项。
功能4:导入、导出XML文件
单击图标,可将建立好的转换或作业导出为XML文件,存储在本地,也可从本地XML文件导入到知识库。
2.3 基本功能
【功能描述】
- 转换管理。
- 作业管理。
- 节点连接类型。
【操作步骤或操作内容】
功能1:转换管理
1、新建或打开一个转换,可看到转换设计页面,如下图:
2、单击主对象树,可将菜单中的转换步骤拖到转换设计页面中。
3、单击可运行转换。
4、右键单击空白区域,可设置转换的属性。
功能2:作业管理
1、新建或打开一个作业,可看到作业设计页面,如下图:
2、单击主对象树,可将菜单中的作业步骤拖到作业设计页面中。
3、单击可运行作业。
4、右键单击空白区域,可设置作业的属性。
功能3:节点连接类型
- 在一个节点处按住SHIFT拖动鼠标到另一节点可建立节点连接。
- 改变开始复制的数量
有时候多次运行相同的步骤是非常有用的。例如,执行一个数据库查询三次或者三次以上,这是因为数据库连接通常有一个反应时间,改变步骤运行的次数,可以有效的减少反应时间,提高效率。要运行一个步骤的多个副本,你只要在图形界面的步骤上点击鼠标右键,选择“改变开始复制的数量…”
- 分发或复制
分发表示所有的行被平均分发到各个目标步骤,复制表示所有行被复制到全部目标步骤。
- 串行或并行
仅用在作业中,默认串行,右键单击作业步骤,选择并行,可并行运行一个作业中的各个分步骤。
- 有连接条件和无条件连接
仅用在作业中,用于控制连接生效的条件,可设置上一步骤运行成功则运行下一步骤,或上一步骤运行失败则运行下一步骤,或无论成功或失败都运行下一步骤,即无条件连接。
如下图:带平行线表示是并行连接;绿色表示该连接生效(灰色表示失效);勾号表示结果为真运行下一步骤,圆圈表示结果为假运行下一步骤,锁标志表示无条件连接。




