点击蓝字 · 关注我们

01
支持以下引擎
Spark Flink SeaTunnel Zeta
02
关键特性
批处理 精确一次性处理 列投影 并行处理 支持用户自定义拆分 支持查询 SQL 并实现投影效果
03
描述
04
支持的数据源信息

05
数据库依赖
请下载与 'Maven' 对应的支持列表,并将其复制到 '$SEATNUNNEL_HOME/plugins/jdbc/lib/' 工作目录中
例如,Vertica 数据源:cp vertica-jdbc-xxx.jar $SEATNUNNEL_HOME/plugins/jdbc/lib/
06
数据库映射类型
| Vertical Data type | SeaTunnel Data type |
TINYINT UNSIGNED SMALLINT SMALLINT UNSIGNED MEDIUMINT MEDIUMINT UNSIGNED INT INTEGER YEAR | |
INTEGER UNSIGNED BIGINT | |
(Gets the designated column's number of digits to right of the decimal point.))) | |
FLOAT UNSIGNED | |
DOUBLE UNSIGNED | |
VARCHAR TINYTEXT MEDIUMTEXT TEXT LONGTEXT JSON | |
TIMESTAMP | |
MEDIUMBLOB BLOB LONGBLOB BINARY VARBINAR BIT(n) | |
UNKNOWN |
07
源选项
| Name | Type | Required | Default | Description |
if you use Vertica the value is com.vertica.jdbc.Driver. | ||||
the row fetch size used in the query toimprove performance by reducing the number database hits required to satisfy the selection criteria. Zero means use jdbc default value. | ||||
提示
partition_column,则会在单一并发中运行;如果设置了
partition_column,则将根据任务的并发性进行并行执行。
08
任务示例
简单示例:
type_bin 'table'16 个数据,并查询其所有字段。您还可以指定要查询的字段,以便将最终输出显示在控制台上。
env {
您可以在此处设置 Flink 配置
execution.parallelism = 2
job.mode = "BATCH"
}
source{
Jdbc {
url = "jdbc:vertica://localhost:5433/vertica"
driver = "com.vertica.jdbc.Driver"
connection_check_timeout_sec = 100
user = "root"
password = "123456"
query = "select * from type_bin limit 16"
}
}
transform {
# 如果您想获取有关如何配置 seatunnel 的更多信息,并查看完整的转换插件列表,
# 请访问 https://seatunnel.apache.org/docs/transform-v2/sql
}
sink {
Console {}
}
并行示例:
Jdbc {
url = "jdbc:vertica://localhost:5433/vertica"
driver = "com.vertica.jdbc.Driver"
connection_check_timeout_sec = 100
user = "root"
password = "123456"
# 根据需要定义查询逻辑
query = "select * from type_bin"
# 并行分片读取字段
partition_column = "id"
# 片段数量
partition_num = 10
}
}
并行边界示例:
source {
Jdbc {
url = "jdbc:vertica://localhost:5433/vertica"
driver = "com.vertica.jdbc.Driver"
connection_check_timeout_sec = 100
user = "root"
password = "123456"
# 根据需要定义查询逻辑
query = "select * from type_bin"
partition_column = "id"
# 读取起始边界
partition_lower_bound = 1
# 读取结束边界
partition_upper_bound = 500
partition_num = 10
}
}
活动推荐
就在今天!Apache SeaTunnel 政务数据交换业务场景实践专场线上直播马上开始。
政务行业在数据交换的业务场景上面临哪些挑战?如何利用 Apache SeaTunnel 数据集成技术支持实现数据价值的最大化?2023 年 8 月 15 日 19:00,来自数字广东的专家将现身 Apache SeaTunnel 用户线上分享 Meetup,介绍政务行业数据共享交换业务场景面临的挑战以及数字广东的数据集成技术演进之路。
详情点击链接查看:预约开启!Apache SeaTunnel 政务数据交换业务场景实践专场
马上预约直播🔽
点击阅读原文预约直播!

文章转载自SeaTunnel,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




