尚硅谷大数据技术之 Kettle
—————————————————————————————
尚硅谷大数据技术之
Kettle
(
作者:尚硅谷大数据研发部
)
版本:
V2.0
第
1
章
Kettle
概述
1.1 ETL
简介
ETL
(
Extract-Transform-Load
的缩写,即数据抽取、转换、装载的过程),对于企业
或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种
ETL
工具的使用,必不可少。
市面上常用的
ETL
工具有很多,比如
Sqoop
,
DataX
,
Kettle
,
Talend
等,作为一个大
数据工程师,我们最好要掌握其中的两到三种,这里我们要学习的
ETL
工具是
Kettle
!
1.2 Kettle
简介
1.2.1 Kettle
是什么
Kettle
是一款国外开源的
ETL
工具,纯
java
编写,可以在
Window
、
Linux
、
Unix
上运
行,绿色无需安装,数据抽取高效稳定。
Kettle
中文名称叫水壶,该项目的主程序员
MATT
希望把各种数据放到一个壶里,然
后以一种指定的格式流出。
Kettle
这个
ETL
工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化
的用户环境来描述你想做什么,而不是你想怎么做。
Kettle
中有两种脚本文件,
transformation
和
job
,
transformation
完成针对数据的基础
转换,
job
则完成整个工作流的控制。
Kettle(
现在已经更名为
PDI
,
Pentaho Data Integration-Pentaho
数据集成
)
。
更多 Java –大数据 –前端 –python 人工智能资料下载,可百度访问:尚硅谷官网
评论