点击蓝字 关注我们

摘要
为了让 Apache DolphinScheduler 的广大用户和爱好者对于此项目的疑问得到及时快速的解答,社区特发起此次【每周 FAQ】栏目,希望可以解决大家的实际问题。
关于本栏目的要点:
本栏目每周将通过腾讯文档(每周更新)从社区微信群收集 10-30 个问答,并在每周五整理具有典型代表意义的问答后发布,供大家参考。
所有人均可登录文档并提出问题,每人限 2 个提问,提问范围包括:
关于 Apache DolphinScheduler 的使用问题和技术性问题;
在实际应用中遇到的瓶颈问题;
参与社区贡献遇到的困难;
关于社区发展的疑问。
资源有限,请勿提问项目无关问题。
【每周FAQ】是一个社区互助的项目,发起宗旨是鼓励社区成员相互帮助,因此,欢迎大家积极踊跃志愿回答提出的疑问,在腾讯文档中写下答案即可。(高手们都别“潜水”了,出来露一手😜😎)
在社群里已经提问的问题,请勿在文档中重复提问,节约资源。
本栏目招募志愿者,有兴趣参与的小伙伴请加微信小助手 Leonard ds 报名。
5月13日-5月19日
问
DS 3.1.5 调度平台关闭了一段时间,启动之后会把这一段时间内没有跑的批次全部跑一遍,是否可以配置不进行补数?有时候就是为了停机维护。
答
在停止之前下线全部工作流,下次启动再上线即可。
问
Docker部署的dp能使用Docker部署DataX吗(两个容器),如果可以,请问怎么操作(相同IP和不同IP)?
答
需要修改docker 镜像,https://dolphinscheduler.apache.org/zh-cn/docs/3.1.6/contribute/development-environment-setup 将你需要DataX打包进去。
问
CDH启用kerberos之后,海豚的资源中心脚本无法查看和编辑了,要改什么配置?
答
改keytab 和 krb5 相关的配置:https://dolphinscheduler.apache.org/zh-cn/docs/3.1.6/architecture/configuration。
问
之前低版本支持文件重新上传功能,3.1.5为什么不支持呢?数据团队中同一个项目有多人协作开发的时候,打包是同一个名字,之后如果修改只能重新打包上传,但是只能删除后再次上传,这样其他的工作流只要是跟这个包名一样的就都会报错,有解决办法吗?
答
3.1.x 不支持了,3.2.0 将有新的资源中心,不会用。
问
3.1.4版本,使用shell脚本执行jdk17的java程序,报了不兼容,有没有暂时替代的解决方案?(不降级java jdk,添加--add-opens java.base/java.lang=ALL-UNNAMED 不好使)
答
目前最高 JDK 测试支持的版本是 11。
问
3.1.5版本,使用shell脚本执行hive EOF命令,实际执行命令中间过程有error和failed,但最后hive返回状态也是0,导致shell节点执行成功,但实际作业执行失败。后续依赖也调度起来了。这是什么原因?
答
Shell 任务只要运行的命令不是exit 0 都是成功的, 可以尝试用 Hive cli 任务。
问
2.0.1版本DS工作流一个单独的任务A有其他流中的任务依赖,用了依赖组件,如果这个依赖的这个流B没有运行成功或者这个依赖的任务C没有运行成功,A的依赖组件都会运行失败,导致A任务运行失败。这个问题怎么处理?
答
2.0.x 的如果使用dependent 组件的话,建议升级到最新的的 2.0.8 版本。
问
DS的局部变量怎么传入给子流程呢?是不是需要在shell脚本里面设置setvalue这个函数呢?我直接在out里面的value写了值好像不起作用。
答
本地参数的 out 和 setValue 应该都是可用的。
问
DS进行项目级别的发布或者新工作流的发布生产有比较好的方法吗?目前对于工作流内subprocess任务和dependent任务迁移,会丢失依赖的任务ID,需要大量修改,是否有比较好的解决方法?
答
一般通过 json 导入导出的方式就能解决问题,如果 subprocess 和 dependent 有问题就是你的依赖有别的项目的,这个时候要手动分析依赖,将父依赖先导进去。
问
A工作流作为B工作流和C工作流的子任务。如果A工作流设置串行等待,在B工作流和C工作流同时调用A工作流的时候,A工作流是并发执行的。好像是个BUG吧?
答
按照目前的设计方式是正确的,子工作流是被引用了,工作流的运行策略是跟父工作流一致。
问
sql 任务是将替换的参数使用 ? 占位符的形式替换的(例如 select * from a where b = '${b_value}' 会变成 select * from a where b = ?),除了防止sql注入外,为什么要这样做呢?默认会把外面的引号干掉,并且在手动运行工作流的时候填入启动参数,又会将这些参数默认设置成varchar格式。感觉这样逻辑不太对?
答
替换逻辑是走的参数替换,目前识别的关键字就是 '${name}' 的方式,这是一个约定的关键字。目前启动参数确实没有办法配置类型。
问
每次进行代码风格检查命令后,很多java类莫名丢失依赖,导致打包不成功,无限在手动导入类,这怎么解决呢?
答
应该是使用了 import * 或者被禁用的 module 了。
问
创建DataX任务时,诸如sr数据库写入时,需要增加loadUrl等参数,这个还需要支持么?
答
可以使用自定义的DataX 配置。
问
任务调度中报警模块,只有在延时报警的时候才会发送邮件,但是在报错或者成功都不会发送邮件,配置中已经配置告警组并且通知策略也已经配置成功或失败都发,并且在日志中没有sendEmail 失败的报错,是什么原因?
答
成功失败的告警时在执行工作流的时候配置的,尝试下线定时,然后手动执行工作流,配置都发送告警是否成功,如果不成功且是 3.1.x 的版本的话就创建一个 github issue 具体看看。
问
DS是否可以提供循环节点?
答
DAG 是有向无环图。
问
3.1.3版本UI优化建议:添加denpend节点时,无法搜索目标依赖,要手动拉,一个个翻过去,几百个工作流一个个找过去,难找,效率低。
答
3.1.6版本已解决。
☞【每周 FAQ】第二期 | 回答你关于 Apache DolphinScheduler 的疑问
☞【每周 FAQ】第一期 | 回答你关于 Apache DolphinScheduler 的疑问
☞【第三期】Apache DolphinScheduler 每周 FAQ 集锦
☞【第四期】Apache DolphinScheduler 每周 FAQ 集锦
☞【第五期】Apache DolphinScheduler 每周 FAQ 集锦
☞【第六期】Apache DolphinScheduler 每周 FAQ 集锦
汽车行业走在了数字化革命浪潮的前列。大数据和 AI 技术的日益成熟,让汽车行业面对着动辄上百万的日活数据,二调度系统助力汽车数字化平台数据调度重塑着未来汽车的面貌,其重要作用不言而喻。
Apache DolphinScheduler 作为国内外多家知名车企数据平台的核心调度系统,它是如何帮助车企迎接数字化时代新挑战的?如何辅助重塑未来汽车的新面貌?欢迎大家关注即将到来的 Apache DolphinScheduler 汽车行业最佳应用实践专场直播!
直播时间:2023 年 5 月 23 日 19:00-21:00
预约方式:点击预约,视频号直播不见不散!
参与贡献
随着国内开源的迅猛崛起,Apache DolphinScheduler 社区迎来蓬勃发展,为了做更好用、易用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量,让本土开源走向全球。

参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。
社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689
非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22
如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html
来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。
参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手微信(Leonard-ds) ,手把手教会您( 贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心 )。

添加社区小助手微信(Leonard-ds)
添加小助手微信时请说明想参与贡献。
来吧,开源社区非常期待您的参与。





