点亮 ⭐️ Star · 照亮开源之路GitHub:https://github.com/apache/dolphinscheduler

版本发布
2022/8/10
2022 年 8 月 10 日,Apache DolphinScheduler 在经过 3.0.0 alpha、3.0.0-beta-1、3.0.0-beta-2 不断验证之后,终于迎来了社区期盼已久的第三个大版本!
3.0.0 正式版本发生了自发版以来的最大幅度变动,新增了众多全新功能和特性,旨在为用户带来全新的体验和更多价值。
2
关键词:更快、更强、更现代化、更易维护
更快:重构了 UI 界面,新 UI 不仅用户响应速度提高数十倍,开发者构建速度提高数百倍; 更强:带来了许多振奋人心的新功能,如数据质量保证、自定义时区、新增多个任务支持和多个告警插件; 更现代化:新 UI 除了更快外,大到页面布局,细到图标样式都更加现代化; 更易维护:后端服务拆分更加符合容器化和微服务化的发展趋势,还能明确各个服务的职责,让维护更加简单。
2
新功能和新特性

![]() | ![]() |




02
AWS 支持
针对 Amazon EMR,我们创建了一个新的任务类型,并提供了其 Run Job Flow 的功能,允许用户向 Amazon EMR 提交多个 steps 作业,并指定使用的资源数量。

对于 Amazon Redshift,我们目前在 SQL 任务类型中扩展了对 Amazon Redshift 数据源的支持,现在用户可以在 SQL 任务中选择 Redshift 数据源来运行 Amazon Redshift 任务。

对于 Amazon S3,我们扩展了 Apache DolphinScheduler 的资源中心,使其不仅能支持本地资源、HDFS 资源存储,同时支持 Amazon S3 作为资源中心的储存。 详情可见:https://dolphinscheduler.apache.org/zh-cn/docs/latest/user_doc/guide/resource.html 中的 `resource.storage.type`
03
服务拆分
master-server: master服务 worker-server: worker服务 api-server: API服务 alert-server: 告警服务 standalone-server: standalone用于快速体验 dolphinscheduler 功能 ui: UI资源 bin: 快速启动脚本,主要是启动各个服务的脚本 tools: 工具相关脚本,主要包含数据库创建,更新脚本
`bin/dolphinscheduler-daemon.sh`
04
数据质量保证


05
任务组

06
自定义时区

07
任务定义列表

08
新告警类型支持

09
Python API 新功能
# environment variableexport PYDS_JAVA_GATEWAY_ADDRESS="192.168.1.1"export PYDS_WORKFLOW_USER="custom-user"# file changeDirectly change ~/pydolphinscheudler/config.yaml# CLIpydolphinscheduler config --set java_gateway.address 192.168.1.1pydolphinscheduler config --set java_gateway.address 192.168.1.1 --set java_gateway.port 25334
# versionpydolphinscheduler verison# 3.0.0# configpydolphinscheduler config --get java_gateway.address --get java_gateway.port# The output look like below:# java_gateway.address = 127.0.0.1# java_gateway.port = 25333pydolphinscheduler config --set java_gateway.address 192.168.1.1 --set java_gateway.port 25334
支持 Flink 任务类型

新增 Zepplin 任务类型

Bash 传参功能
lines_num=$(wget https://raw.githubusercontent.com/apache/dolphinscheduler/dev/README.md -q -O - | wc -l | xargs)echo "#{setValue(set_val_var=${lines_num})}"
允许用户上传没有后缀的文件
其他功能增强
3
主要优化项
任务后端插件优化,新插件只需要修改插件自带的模块 在工作流下提交/创建 cron 时验证结束时间和开始时间 Dependent 添加依赖时可以选择全局项目 AlertSender 优化及关闭优化,如 MasterServer 增加 slot 条件查询数据库, 减少返回数据记录 通过将 python gatewar 迁移到 apiserver 来精简 dist 包 [python] 将 pythonGatewayServer 迁移到 api 服务器 [python] 添加缺失的配置和连接远程服务器文档 [Master/Worker] 将任务 ack 更改为运行回调 [Master] 添加任务事件线程池
4
主要 Bug 修复
修复使用 S3a Minio 创建租户失败的问题 修复文本文件 busy 的问题 修复项目授权时生成一个重复授权项目的问题 修复因无法连接到 postgresql 而启动服务器失败的问题 修复消息显示找不到数据源插件“Spark”的问题 修复 MapReduce 生成的命令内置参数位置错误的问题 解决更改参数用户,队列在 ProcessDefinition 中失效的问题 解决使用依赖组件的进程无法在测试和生产环境之间迁移 解决了资源文件删除条件的问题 修复编辑复制节点的表单时影响原始节点数据的问题 解决了 Worker 资源耗尽并导致停机的问题 解决了某些类型的警报无法显示项目名称的问题 3.0.0 各个部署方式出现的问题 任务组为空时页面报错问题 treemap 视图深度错误问题 告警信息不明确问题:告警组为空时报错信息不明确,批量删除工作流有异常时报错信息不明确,租户内容错长的错误提示,删除 参数校验问题:数据源中心的参数校验问题,修改密码时密码不一致提示,发告警前校验 alert scriptb Python api:不能设置 release state 问题,本地参数有值但是校验失败问题 token 查询不遵循时区问题 修复 HTTPS 和 HTTP 字符串识别问题 修复 alert server 健康监测失效问题 修复 condition 任务分支失败问题 修复 docker 镜像不支持多平台问题 修复带有任务组优先级的工作流创建时不能正确写数据库的问题 master 任务的失效问题 修复串行等待不运行的问题 时区问题:调度时区错误问题,日志增加时区支持 重新运行、暂停工作流实例失败问题 资源中心实例化失败问题 修复邮件告警模板分隔线问题 修复Standalone模式下数据初始化问题 修复监控中心DB不存在时的页面展示问题 修复创建工作流参数无效问题 修复K8S部署时zookeeper端口异常问题 修复Standalone模式下服务启动失败问题 修复LDAP登录失败问题 Python api: 修复同一个项目下不同工作流的任务组件名称不支持重名问题 Python api: 修复SQL任务组件SQL类型错误问题 修复资源文件重命名表单异常问题 修复根据定时设置获取工作流可执行时间错误问题 升级了Logback、Log4j等模块依赖 修复任务失败问题 修复好HDFS NPE 问题 修复任务组异常导致master死锁问题 修复一些列稳定性问题
5
文档修改
更正部署文档 修复、更新部分使用文档:WebexTeams 中文文档,本地参数、全局参数文档,Kubernetes FAQ 文档,Spark 注意事项文档,DataX 使用文档,删除 Flink API 文档,修复 open-api 的错误,修复数据质量中的错误文档;新增 stand-alone 切换数据库文档;新增 shell 中判断 Yarn 运行状态文档;新增更新系统截图; 参数传递、全局参数、参数优先级文档,告警组件向导、Telegram、钉钉告警文档,告警FAQ文档,Shell组件文档,Switch任务组件文档,资源中心配置详情文档,工作流定义补数文档 更正部分开发文档:明确支持的操作系统,修复开发环境搭建文档,新增自己构建 docker 镜像文档
6
Release note
7
感谢贡献者
Aaron Lin、Amy0104、Assert、BaoLiang、Benedict Jin、BenjaminWenqiYu、Brennan Fox、Dannila、Desperado2、Devosend、DingPengfei、DuChaoJiaYou、EdwardYang、Eric Gao、Frank Chen、GaoTianDuo、HanayoZz、HeChuan、HomminLee、Hua Jiang、Hwting、Ivan0626、Jeff Zhan、Jiajie Zhong、JieguangZhou、Jiezhi.G、JinYong Li、J·Y、Kerwin、Kevin.Shin、KingsleyY、Kirs、KyoYang、LinKai、LiuBodong、LongJGun、Luke Yan、Lyle Shaw、Manhua、Martin Huang、Maxwell、Molin Wang、Mr.An、OS、PJ Fanning、Paul Zhang、QuakeWang、ReonYu、SbloodyS、Sheldon、Shiwen Cheng、ShuiMuNianHuaLP、ShuoTiann、SongTao Zhuang、Stalary、Sunny Lei、Tom、Town、Tq、WangJPLeo、Wenjun Ruan、X&Z、XiaochenNan、Yanbin Lin、Yao WANG、Yiming Guo、Zonglei Dong、aCodingAddict、aaronlinv、aiwenmo、caishunfeng、calvin、calvinit、cheney、chouc、chuxing、czeming、devosend、exmy、gaojun2048、guodong、guoshupei、hjli、hstdream、huangxiaohai、janeHe13、jegger、jiachuan.zhu、jon-qj、juzimao、kezhenxu94、labbomb、leiwingqueen、lgcareer、lhjzmn、lidongdai、lifeng、lilyzhou、litiliu、liubo1990、liudi1184、longtb、lvshaokang、lyq、mans2singh、mask、mazhong、mgduoduo、myangle1120、naziD、nobolity、ououtt、ouyangyewei、pinkhello、qianli2022、qinchaofeng、rickchengx、rockfang、ronyang1985、seagle、shuai hou、simsicon、sneh-wha、songjianet、sparklezzz、springmonster、sq-q、syyangs799、uh001、wangbowen、wangqiang、wangxj3、wangyang、wangyizhi、wind、worry、wqxs、xiangzihao、xiaodi wang、xiaoguaiguai、xuhhui、yangyunxi、yc322、yihong、yimaixinchen、youzipi、zchong、zekai-li、zhang、zhangxinruu、zhanqian、zhuxt2015、zixi0825、zwZjut、天仇、小张、弘树丶、张俊杰、旭旭同學、时光、旺阳、王强、百岁、秋天、罗铭涛、阿福Chris、陈家名、陈爽、飞侠美如画
参与贡献
随着国内开源的迅猛崛起,Apache DolphinScheduler 社区迎来蓬勃发展,为了做更好用、易用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量,让本土开源走向全球。

参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。
社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689
非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22
如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html
来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。
参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手微信(Leonard-ds) ,手把手教会您( 贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心 )。
添加小助手微信时请说明想参与贡献。
来吧,开源社区非常期待您的参与。
活动推荐
Apache DolphinScheduler社区联合了Apache Kylin社区,共同举办Meetup主题为《大数据底座的构建与展望,助力企业数字化转型》即将重磅开启!我们也有幸邀请到了来自伊利、T3出行、白鲸开源、Apache Kylin社区等企业的资深大数据工程师与开发者,从数据分析引擎、数据调度、数字化转型、维护开源视角等话题探讨在两个开源项目的开发实践。
本次活动受疫情影响仍以线上直播的形式开展,活动现已开放免费报名,欢迎扫描下图二维码,或点击“阅读原文”免费报名!
时间:2022-8-13 14:00-17:00
形式:线上直播
点击原文链接或扫描报名二维码(免费):https://www.slidestalk.com/m/1062/dsgongzhongh

扫码预约直播

扫码进入群聊







