暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Apache DolphinScheduler 重磅发布3.2.0版本!

海豚调度 2023-10-18
736

今天,Apache DolphinScheduler 3.2.0 版本在万众期待中终于发布了!在之前的预告中,包括《重磅预告!Apache DolphinScheduler 3.2.0 新功能“剧透”》《3.2.0 版本预告!Apache DolphinScheduler API 增强相关功能》《3.2.0 版本预告!远程日志解决 Worker 故障获取不到日志的问题》,以及《3.2.0 终极预告!云原生支持新增 Spark on k8S 支持》文章汇总已经大致覆盖了 3.2.0 版本的全新功能和优化。

现在,来看看新版本的全新“样貌”吧!

Release Note:https://github.com/apache/dolphinscheduler/releases/tag/3.2.0

下载地址:https://dolphinscheduler.apache.org/en-us/download/3.2.0

主要更新包括:

  • • 添加默认租户

  • • 新增多种数据源

  • • 新增任务类型

  • • 重跑任务时指定工作流向前、向后运行

  • • 增加远程日志功能

  • • 参数优化

  • • 资源中心

  • • 增强页面易用性

  • • 云原生支持新增 Spark on k8S 支持

  • • 增加了部分 Restful API

  • • 注册中心增加 ETCD、JDBC 注册中心

  • • 架构优化

添加默认租户

在之前的版本中,用户部署完毕后必须手动添加租户。3.2.0 版本中添加了默认租户,方便用户更直接地使用 Apache DolphinScheduler。

新增多种数据源

新增了多个数据源,如 Snowflake、Databend、Kyuubi、Doris、OceanBase、Dameng、AzureSQL、StarRocks、AWS Athena、,并且更新了部分数据源,如 Redshift 增加 Access key。

file

新增任务类型

新增了多个任务类型,包括:

    • • 通用模块中,增加 Remote-shell组件、Java Task

    • • Cloud 模块中,新增 Amazon DMS、Azure Datafactory、AWS Database Migration,增强与各种云的互联互通

    • • 机器学习模块中,新增 Kubeflow组件(基于云原生构建的机器学习任务工具大合集)

    • • 其他模块中,增加 AmazonDatasync、Apache Linkis



file

file

file

并更新了部分任务,如 DataX 支持 Presto,http任务增加output 参数传递,运行批量同时 kill 多个 Yarn 任务:

file

Dependent 支持依赖自己:

file

支持了 Zeppelin 鉴权;

此外,任务现在可以支持缓存;

file

Sqoop 日志支持隐藏密码;

以及 SQL 任务支持默认切割符:

file

新增远程日志功能

3.2.0 版本增加了远程日志功能,并同时支持了 Google Cloud Storage、Amazon S3、阿里云 OSS 日志存储,用户可以通过编辑配置文件,把日志存储到云端,解决万一意外情况发生,Woker 日志不存在,用户无法查看日志的问题。

file

详情参加《3.2.0 版本预告!远程日志解决 Worker 故障获取不到日志的问题》

参数优化

  • • 增加了项目级别参数

  • • 调整参数优先级,启动参数最高

  • • 增加了内置参数计算规则

file
  • • 增加了文件类型的参数


file

云原生相关

资源中心

增加了 Alibaba Cloud OSS 、Huawei Cloud OBS、Azure Blob Storage的支持,重构资源中心并设计默认使用本地作为存储介质,重新支持了 re-upload。

file

资源中心容许覆盖上传,优化文件路径,显示文件的全部路径。另外,之前版本中资源中心已经上传的同类型文件只能删除后重新上传,新版本中对本功能进行了优化,可以点击上传按钮进行上传。

支持 reupload 文件

API 增强

3.2.0 版本中,增加了部分 Restful API,包括 taskInstance、workflow state、workflowInstance、workflow and schedule、task relation,且API 触发工作流运行可以获得 instance ID,从而使得 Apache DolphinScheduler 的 API 能力得到显著增强。

详情参见:《3.2.0 版本预告!Apache DolphinScheduler API 增强相关功能

增加页面易用性

3.2.0 增加了页面易用性和便利性,如增加 workflow instance 跳转到当前工作流、复制工作流名称、调整列宽等操作。

跳转到工作流实例

复制工作流名称

调整列表名称宽度

默认情况下会有 default 租户和本地资源中心,安装后就能使用。

默认租户

允许在 workflow instance 中重新运行任务,任务运行日志更加明确。

可以重新运行任务
json 导出可阅读性加强。


注册中心

增加了 ETCD、JDBC 注册中心。

架构

  • • Alert 支持 HA

  • • 单线程更新 Kerberos

  • • Worker server 移除了 dao 依赖

  • • 接管 task instance 失败的任务

  • • 增加动态任务组配置

  • • 重构了逻辑任务和远程命令

  • • 资源限制(cpu 内存)从原来绝对值改成百分比

  • • 支持了 SSO

其中,支持了 SSO 后,用户可以通过 Casdoor 实现 SSO 登录。Casdoor 是基于 OAuth 2.0、OIDC、SAML 和 CAS 的面向 UI 的身份访问管理(IAM)/单点登录(SSO)平台,需要先部署 Casdoor 并获取 `Client ID` 和 `Client secret` 两个字段,再修改 dolphinscheduler-api/src/main/resources/application.yaml 文件配置 SSO。

可以通过以下步骤通过 Casdoor 为 Apache Dolphinscheduler 添加 SSO 功能:

    security:
    authentication:
    # Authentication types (supported types: PASSWORD,LDAP,CASDOOR_SSO)
    type: CASDOOR_SSO
    casdoor:
    # Your Casdoor server url
    endpoint:
    client-id:
    client-secret:
    # The certificate may be multi-line, you can use `|-` for ease
    certificate:
    # Your organization name added in Casdoor
    organization-name:
    # Your application name added in Casdoor
    application-name:
    # Doplhinscheduler login url
    redirect-url: http://localhost:5173/login
    y

    贡献者列表

    感谢@zhongjiajie对此次发版的指导,以及下列贡献者的支持:

    106umao, Abingcbc, AliceXiaoLu, BongBongBang, CallMeKingsley97, Chris-Arith, DarkAssassinator, EricGao888, EricPyZhou, FlechazoW, Gallardot, GavinGYM, IT-Kwj, LiXuemin, LucasClt, Mukvin, NoSuchField,



    Orange-Summer, QuantumXiecao, Radeity, Rianico, SYSU-Coder, SbloodyS, Tianqi-Dotes, TyrantLucifer, ZhongJinHacker, Zzih, ahuljh, alei1206, alextinng, amaoisnb, arlendp, baihongbin, bmk15897, boy-xiaozhang, c3Vu,



    caishunfeng, calvinjiang, darrkz, davidzollo, dddyszy, devosend, ediconss, eye-gu, fengjian1129, fuchanghai, guowei-su, haibingtown, hantmac, hdygxsj, hezean, hiSandog, hoey94, hstdream, huage1994, imizao, insist777,



    iuhoay, jackfanwan, jbampton, jieguangzhou, kezhenxu94, kingbabingge, labbomb, lenian, ly109974, lynn-illumio, moonkop, muggleChen, pandong2011, pppppjcc, qianli2022, qindongliang, qingwli, rickchengx, ruanwenjun, sandiegoe, seedscoder, shangeyao, shenyun, simsicon, sketchmind,



    stalary, tracehh, whhe, xdu-chenrj, xiaomin0322, xinxingi, xuchunlai, xxjingcd, yeahhhz, youzipi, zhangfane, zhangkuantian, zhaohehuhu,zhoufanglu, zhuangchong, zhutong6688, zhuxt2015, zzzhangqi


    用户实践案例

    奇富科技  蜀海供应链 联通数科 拈花云科

    蔚来汽车 长城汽车 集度 长安汽车

    思科网讯 生鲜电商 联通医疗 联想

    新网银行 消费金融  腾讯音乐 自如

    有赞 伊利 当贝大数据

    联想 传智教育 Bigo


    参与Apache DolphinScheduler 社区有非常多的参与贡献的方式,包括:


    贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

    社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689

    非新手问题列表:https://github.com/apache/dolphinscheduler/issues?
    q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22

    如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html

    来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。

    文章转载自海豚调度,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

    评论