【每周 FAQ】第一期 | 回答你关于 Apache SeaTunnel 的疑问

SeaTunnel 2023-04-10

1503

点击蓝字关注我们

摘要

为了让 Apache SeaTunnel 的广大用户和爱好者对于此项目的疑问得到及时快速的解答，社区特发起此次【每周 FAQ】栏目，希望可以解决大家的实际问题。

关于本栏目的要点：

本栏目每周将通过腾讯文档（每周更新）从社区微信群收集 10-30 个问答，并在每周五整理具有典型代表意义的问答后发布，供大家参考。
所有人均可登录文档并提出问题，每人限 2 个提问，提问范围包括：

关于 Apache SeaTunnel 的使用问题和技术性问题；
在实际应用中遇到的瓶颈问题；
参与社区贡献遇到的困难；
关于社区发展的疑问。

资源有限，请勿提问项目无关问题。
【每周FAQ】是一个社区互助的项目，发起宗旨是鼓励社区成员相互帮助，因此，欢迎大家积极踊跃志愿回答提出的疑问，在腾讯文档中写下答案即可。（高手们都别“潜水”了，出来露一手😜😎）
在社群里已经提问的问题，请勿在文档中重复提问，节约资源。
本栏目招募志愿者，有兴趣参与的小伙伴请加微信小助手 17743592110 报名。

FAQ（4月3日-4月9日）

问

SeaTunnel 要求Spark版本最低是2.4么？

SeaTunnel 2.1.x 可以支持Spark2.3。

答

原则上没有问题，但是有小伙伴发现部分版本升级的时候存在问题，建议先1.3升级2.0.4，然后升级到3。

问

DolphinScheduler 3.1.4去 ZK 依赖了吗？

答

重新编译的DolphinScheduler 3.1.4支持cdh版本zk3.4.5，不依赖原来默认的zk3.8，主要是用到数据质量的，主要是解决多版本zk的依赖的问题。后面想解决打包的问题，可以用这个命令mvn clean install -Prelease -Dzk-3.4 -Dmaven.test.skip=true。

问

User-subscribe 邮件订阅好像有问题？

答

发送邮件到 dev-subscribe@dolphinscheduler.apache.org

问

SeaTunnel操作Hive数据的时候还需要额外加什么依赖jar包么？

https://seatunnel.apache.org/docs/2.3.1/connector

v2/source/Hive#description 中有说明，如果用的是Spark/Flink引擎，需要Spark/Flink已经集成好了Hive。

如果用SeaTunnel Zeta引擎，需要将seatunnel-hadoop3-3.1.4-uber.jar 和 hive-exec-2.3.9.jar 放到 $SEATUNNEL_HOME/lib/ 目录下。

答

换一下对应的版本，参考一下 https://dolphinscheduler.apache.org/zh-cn/docs/1.3.3/upgrade

问

官网下载太慢了，怎么办?

答

可以使用镜像下载 https://mirrors.tuna.tsinghua.edu.cn/apache/

dolphinscheduler/3.1.4/

问

DolphinScheduler 目前不支持 OAuth2.0的单点登陆吗？

答

没发现有相关配置支持，不过支持LDAP。

问

SeaTunnel支持图片、音视频的采集吗？

暂时不支持。

答

可以开发编译，但不能运行。要基于DS做二开，建议开个虚拟机做debug开发。

问

有本地搭建 DolphinScheduler 的文档吗？

答

有的，体验的话可以看看官网的standalone安装 https://dolphinscheduler.apache.org/zh-cn/docs/1.3.3/standalone-deployment

问

psmisc 在DolphinScheduler中有啥用处啊？

答

这是停止工作流按钮需要的，kill 任务实例。

问

DolphinSchedulercdc模式，不够20000条不能写入？

升级DolphinScheduler，现问题是因为sink中没有设置source_table_name。

答

还可以xsync分发文件。

问

DolphinScheduler是必须新建一个用户来调度吗，还是说root用户也OK？

答

最好建一个DolphinScheduler的账号，并有sudo权限，因为有时候你用root用户调度的东西有些危险。

问

如何用DolphinScheduler来调度SeaTunnel任务？

答

如果要使用SeaTunnel v2的话，需要升级到DolphinScheduler 3.1（可以试试看）。

问

DolphinScheduler是不是只能集成SeaTunnel+2.1.X版本？有官方文档或教程吗？

社区已经提供了支持最新SeaTunnel版本的PR，待merge。

答

问

SeaTunnel如何设置占用的内存大小？

在$SeaTunnel_HOME/config目录中有jvm_options文件和jvm_client_options文件，jvm_options文件控制的是Zeta Cluster模式下的进程的内存。jvm_client_options控制的是提交作业的client和local模式下的作业的内存。

答

问

SeaTunnel完成从HDFS的数据同步到MySQL中，怎么写？

参考官方文档HDFS Source和JDBC Sink连接器：https://seatunnel.apache.org/docs/2.3.1/about。

答

问

执行完成 sh install-pulgins之后，运行官方给的demo，还是报错plugin找不到是怎么回事？

确认下$SeaTunnel_HOME/connectors/SeaTunnel 目录下是否有对应的插件jar包

答

问

Sink 之前先清理下数据, 类似于做个 truncate table 这样的操作, 如何配置sink?

这个目前还不支持，需要等社区SaveMode这个特性做完。

答

问

SeaTunnel 使用zeta引擎 -i传参的时候，配置文件里面应该怎么写？

现在zeta暂时不支持-i。

答

问

SeaTunnel支持Doris到MySQL吗？

支持。

答

问

有无数把PostgreSQL用cdc的方式同步到Hudi数据湖，SeaTunnel是否支持？

PG cdc有PR，待merge，https://github.com/apache/incubator-seatunnel/pull/3867/files。

答

问

使用http source请求api数据，但是需要先请求到token，然后把token传递给下一个http source作为参数，这个具体怎么实现呢？

1. 写shell请求token

2.作为SeaTunnel前置依赖

3.传递token到SeaTunnel作业。

答

Apache SeaTunnel

Apache SeaTunnel(Incubating) 是一个分布式、高性能、易扩展、用于海量数据（离线&实时）同步和转化的数据集成平台

仓库地址：

https://github.com/apache/incubator-seatunnel

网址：

https://seatunnel.apache.org/

Proposal：

https://cwiki.apache.org/confluence/display/INCUBATOR/SeaTunnelPro

Apache SeaTunnel(Incubating) 下载地址：

https://seatunnel.apache.org/download

衷心欢迎更多人加入！

我们相信，在「Community Over Code」（社区大于代码）、「Open and Cooperation」（开放协作）、「Meritocracy」（精英管理）、以及「多样性与共识决策」等 The Apache Way 的指引下，我们将迎来更加多元化和包容的社区生态，共建开源精神带来的技术进步！

我们诚邀各位有志于让本土开源立足全球的伙伴加入 SeaTunnel 贡献者大家庭，一起共建开源!

提交问题和建议：

https://github.com/apache/incubator-seatunnel/issues

贡献代码：

https://github.com/apache/incubator-seatunnel/pulls

订阅社区开发邮件列表 :

dev-subscribe@seatunnel.apache.org

开发邮件列表：

dev@seatunnel.apache.org

加入 Slack:

https://join.slack.com/t/apacheseatunnel/shared_invite/zt-1cmonqu2q-ljomD6bY1PQ~oOzfbxxXWQ

关注 Twitter:

https://twitter.com/ASFSeaTunnel

性能测试报告：SeaTunnel 批量同步数据比 GLUE 快 420%！

对话 SQL Transform 功能贡献者马骋原

点击阅读原文，点亮Star⭐️！

文章转载自SeaTunnel，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。

【每周 FAQ】第一期 | 回答你关于 Apache SeaTunnel 的疑问

评论