暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

kettle使用介绍

原创 超越无限D 2022-06-13
2097

第1章 系统介绍

1.1 系统简介

ETL平台用于数据的抽取、转换、加载,为数据比对提供数据的采集、转换、导入、导出等功能。

第2章 系统管理

2.1 基本概念

  1. 数据库连接:用户自定义的,在转换或作业中使用的数据库连接。
  2. 转换:数据抽取、转换、加载流程的封装。
  3. 作业:将多个转换或一些任务封装,用于ETL任务的执行。
  4. 知识库:固定存储已建立好的连接、转换或作业的位置。
  5. 数据流:分输入流和输出流,输入流是离开一个步骤时的行的堆栈,输出流是进入一个步骤时的行的堆栈。
  6. 节点连接:连接两个步骤的连线。

2.2 主界面介绍

【功能描述】

  1. 浏览和管理知识库。
  2. 增加数据库连接。
  3. 增加转换或作业。
  4. 导入、导出XML文件。

【操作步骤或操作内容】

功能1:浏览和管理知识库

1、用户进入ETL平台,点击『知识库』页签,可浏览知识库,如下图所示:

2、双击其中一个数据库连接、采集作业或转换,可打开相应的页面,进行查看、运行、修改和删除。

功能2:增加数据库连接

单击图标,选择『新建数据库连接』选项,打开如下图所示窗口:

连接类型:选择数据库类型。

访问方法:推荐使用JDBC。

连接名称:用户自定义。

服务器主机:填写数据库服务器IP地址。

数据库名称:填写数据库名称。

数据库表空间:填写数据库的用户数据表空间名称。

索引表空间:填写数据库的索引表空间名称。

端口号:填写数据库使用的端口号。

用户名和密码:登陆数据库的用户名和密码。

功能3:增加转换或作业

单击图标,选择『新建转换』或『新建转换』选项。

功能4:导入、导出XML文件

单击图标,可将建立好的转换或作业导出为XML文件,存储在本地,也可从本地XML文件导入到知识库。

2.3 基本功能

【功能描述】

  1. 转换管理。
  2. 作业管理。
  3. 节点连接类型。

【操作步骤或操作内容】

功能1:转换管理

1、新建或打开一个转换,可看到转换设计页面,如下图:

2、单击主对象树,可将菜单中的转换步骤拖到转换设计页面中。

3、单击可运行转换。

4、右键单击空白区域,可设置转换的属性。

功能2:作业管理

1、新建或打开一个作业,可看到作业设计页面,如下图:

2、单击主对象树,可将菜单中的作业步骤拖到作业设计页面中。

3、单击可运行作业。

4、右键单击空白区域,可设置作业的属性。

功能3:节点连接类型

  1. 在一个节点处按住SHIFT拖动鼠标到另一节点可建立节点连接。
  2. 改变开始复制的数量

有时候多次运行相同的步骤是非常有用的。例如,执行一个数据库查询三次或者三次以上,这是因为数据库连接通常有一个反应时间,改变步骤运行的次数,可以有效的减少反应时间,提高效率。要运行一个步骤的多个副本,你只要在图形界面的步骤上点击鼠标右键,选择“改变开始复制的数量…”

  1. 分发或复制

分发表示所有的行被平均分发到各个目标步骤,复制表示所有行被复制到全部目标步骤。

  1. 串行或并行

仅用在作业中,默认串行,右键单击作业步骤,选择并行,可并行运行一个作业中的各个分步骤。

  1. 有连接条件和无条件连接

仅用在作业中,用于控制连接生效的条件,可设置上一步骤运行成功则运行下一步骤,或上一步骤运行失败则运行下一步骤,或无论成功或失败都运行下一步骤,即无条件连接。

如下图:带平行线表示是并行连接;绿色表示该连接生效(灰色表示失效);勾号表示结果为真运行下一步骤,圆圈表示结果为假运行下一步骤,锁标志表示无条件连接。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论