点击蓝字 关注我们

用户案例 | 集度汽车
集度大数据集成平台日累计离线调度任务量2w+,既要满足高并发分发任务也要满足多种任务类型,为了保障数据的准确性和及时性,集度选择Apache DolphinScheduler作为核心调度系统,在此基础上也做了二次的开发,形成一整套体系,包含元数据管理、血缘地图、数据集成、数据质量管理、Ad-Hoc等,从而降低了使用数据的成本。
业务挑战
解决方案
1
调度架构设计

数据质量:关联调度、通过强弱规则是否截断任务、丰富的规则模版(参考-- 微众 Qualitis) Ad-Hoc:SQL开发/调试、发布调度、数据订阅 任务血缘:收集DolphinScheduler的任务依赖关系、任务粒度依赖关系、方便抽象全局DAG(包含所有工作流) 数据集成:依赖DolphinScheduler丰富任务类型的支持,主要包含:数据导入、数据导出、数据加工
2
任务并发高
任务组织形式 工作流(画布)方式 优点:方便界面操作、DAG执行 缺点:任务维护成本高、依赖关系维护成本高

任务粒度方式(工作流=任务) 优点:任务维护成本低、依赖关系维护成本低 缺点:Quartz定时触发器资源消耗高、DAG执行不方便(要解决跨工作流依赖问题)

3
血缘及数据质量


4
多种任务类型及日期变量支持
用户收益
实现了每天承接累计2w+的调度任务,涵盖全公司所有业务;凌晨并发1w+的任务量; 统一管理任务血缘关系,抽象全局DAG,方便数据开发人员维护任务; 支撑复杂业务场景下,多种数据源支持、多种任务类型的支持和多种业务属性日期变量的支持; 提升了数据开发人员的研发效率。
客户简介
参与贡献
随着国内开源的迅猛崛起,Apache DolphinScheduler 社区迎来蓬勃发展,为了做更好用、易用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量,让本土开源走向全球。

参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。
社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689
非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22
如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html
来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。
参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手微信(Leonard-ds) ,手把手教会您( 贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心 )。

添加社区小助手微信(Leonard-ds)
添加小助手微信时请说明想参与贡献。
来吧,开源社区非常期待您的参与。
☞DolphinScheduler×T3出行 | 打造车联网一站式数据应用交互体验






