暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

海豚调度任务类型Apache SeaTunnel部署指南

海豚调度 2024-04-02
1274

点击蓝字

关注我们


Apache DolphinScheduler现已支持Apache SeaTunnel任务类型,本文介绍了SeaTunnel任务类型如何创建,任务参数,以及任务样例。

01

Apache SeaTunnel


SeaTunnel 任务类型,用于创建并执行 SeaTunnel 类型任务。worker 执行该任务的时候,会通过 start-seatunnel-spark.sh、start-seatunnel-flink.sh 和 seatunnel.sh 命令解析 config 文件。

02

创建任务


  • 点击项目管理 -> 项目名称 -> 工作流定义,点击“创建工作流”按钮,进入 DAG 编辑页面;
  • 拖动工具栏的 任务节点到画板中。

03

任务参数


  • 启动脚本:选择你想要运行任务的启动脚本,包括 seatunnel.sh, start-seatunnel-flink-13-connector-v2.sh, start-seatunnel-flink-15-connector-v2.sh, start-seatunnel-flink-connector-v2.sh, start-seatunnel-flink.sh, start-seatunnel-spark-2-connector-v2.sh, start-seatunnel-spark-3-connector-v2.sh, start-seatunnel-spark-connector-v2.sh, start-seatunnel-spark.sh
  • FLINK
  • 运行模型:支持 run 和 run-application 两种模式
  • 选项参数:用于添加 Flink 引擎本身参数,例如 -m yarn-cluster -ynm seatunnel
  • SPARK
  • 部署方式:指定部署模式,cluster client
  • Master:指定 Master 模型,yarn local spark mesos,其中 spark 和 mesos 需要指定 Master 服务地址,例如:127.0.0.1:7077
  • SEATUNNEL_ENGINE
  • 部署方式:指定部署模式,cluster local
  • 自定义配置:支持自定义配置或从资源中心选择配置文件
  • 脚本:在任务节点那自定义配置信息,包括四部分:env source transform sink

04

任务样例


该样例演示为使用 Flink 引擎从 Fake 源读取数据打印到控制台。

1.在 DolphinScheduler 中配置 SeaTunnel 环境
若生产环境中要是使用到 SeaTunnel 任务类型,则需要先配置好所需的环境,配置文件如下:/dolphinscheduler/conf/env/dolphinscheduler_env.sh。

2.配置 SeaTunnel 任务节点
根据上述参数说明,配置所需的内容即可。

Config 样例
    env {
    execution.parallelism = 1
    }


    source {
    FakeSource {
    result_table_name = "fake"
    field_name = "name,age"
    }
    }


    transform {
    sql {
    sql = "select name,age from fake"
    }
    }


    sink {
    ConsoleSink {}
    }


    原文链接:https://blog.csdn.net/zhengzaifeidelushang/article/details/136685864

    < 🐬🐬 >
    精彩推荐

    用户实践案例
    奇富科技  蜀海供应链 联通数科 拈花云科
    蔚来汽车 长城汽车 集度 长安汽车
    思科网讯 生鲜电商 联通医疗 联想
    新网银行 消费金融  腾讯音乐 自如
    有赞 伊利 当贝大数据
    联想 传智教育 Bigo
    通信行业  作业帮


    迁移实践
    Azkaban   Ooize   
    Airflow (有赞案例) Air2phin(迁移工具)
    Airflow迁移实践
    Apache DolphinScheduler 3.0.0 升级到 3.1.8 教程


    新手入门
    选择Apache DolphinScheduler的10个理由
    Apache DolphinScheduler 3.1.8 保姆级教程【安装、介绍、项目运用、邮箱预警设置】轻松拿捏!
    Apache DolphinScheduler 如何实现自动化打包+单机/集群部署?
    Apache DolphinScheduler-3.1.3 版本安装部署详细教程
    Apache DolphinScheduler 在大数据环境中的应用与调优
    < 🐬🐬 >
    参与社区

    参与Apache DolphinScheduler 社区有非常多的参与贡献的方式,包括:


    贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

    社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689

    非新手问题列表:https://github.com/apache/dolphinscheduler/issues?
    q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22

    如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html

    来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的!

    文章转载自海豚调度,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

    评论