dbt-core - 是一个数据管道开发平台,支持动态SQL、模板和建模等功能。
Github:https://github.com/dbt-labs/dbt-core
dbt 官网
介绍
dbt™是一个SQL优先的转换工作流,使团队能够按照模块化、可移植性、CI/CD和文档等软件工程最佳实践快速协作地部署分析代码。现在,数据团队中的任何人都可以安全地为生产级数据管道做出贡献。
dbt是一个数据管道开发平台,支持动态SQL、模板和建模等功能。dbt的一个重要特性是自动化测试,用户可以使用dbt执行全面数据测试、数据质量检查和数据验证。可以在数据管道、数据源和目标数据之上使用dbt执行的质量检测模型,例如:数据范式(3NF及以上)模型、维度模型和数据仓库模型。
dbt除了提供数据测试和数据质量功能,在应用生态上,许多公司还为dbt扩展数据质量功能。例如:Elementary,它能够总结dbt中的所有内容,提供数据质量监控指标、数据新鲜度、数据异常信息和异常数据分析的功能。
系统截图

erd-online - 是全球第一个开源、免费在线数据建模、元数据AI平台。
Gitee:https://gitee.com/MARTIN-88/erd-online

介绍
ERD Online 是全球第一个开源、免费在线数据建模、元数据AI平台。集成ChatGPT,提供简单易用的元数据设计、关系图设计、SQL审批查询等功能,辅以版本、导入、导出、数据源、SQL解析、审计、团队协作等功能,方便我们快速、安全的管理数据库中的元数据。
特性
- 开箱即用:将注意力集中在数据结构设计上
- 团队协作:三级权限(拥有者、管理员、普通角色)管理,元素级权限控制
- 元数据设计:快速复制已有表结构、JSON 生成表,表默认字段、默认大小写等控制
- 元数据管理:在线管理表结构,支持正向向数据库执行
- 元数据解析:将已有的数据库结构解析到软件中管理
- 多数源支持:支持多种数据库连接在线管理(Mysql、Oracle、DB2、SqlServer、PostGreSql),各数据源之间元数据结构同步
- 版本管理:每个需求与变动,都可以生成版本;每个版本之间可以比对差异
- 可将所有表结构,自动生成 word、html、md 文档,便于线下流动
- 在线SQL:在线SQL查询、SQL执行计划,历史查询留痕
- 永不丢失:元数据历史操作版本留痕(最近9次),可以恢复到任意历史版本
- 数据字典:全局数据字典设计,控制元数据设计规范
发展里程碑

产品图鉴

LarkMidTable - 是一站式开源的数据中台,实现元数据管理,数据仓库开发,数据质量管理,数据的可视化,实现高效赋能数据前台并提供数据服务的产品。
Gitee:https://gitee.com/LarkMidTable/LarkMidTable

介绍
LarkMidTable 中文名称 云雀,云代表大数据,雀代表平凡和自由。
LarkMidTable 是一站式开源的数据中台,实现中台的基础建设,数据治理,数据开发,监控告警,数据服务,数据的可视化,实现高效赋能数据前台并提供数据服务的产品。
系统截图





datacap - 是用于数据转换、集成和可视化的集成软件。支持多种数据源、文件类型、大数据相关数据库、关系数据库、NoSQL数据库等。
Github:https://github.com/devlive-community/datacap

介绍
DataCap 是用于数据转换、集成和可视化的集成软件。
支持多种数据源、文件类型、大数据相关数据库、关系数据库、NoSQL数据库等。
通过软件可以实现多数据源的管理,对源下的数据进行各种操作转换、制作数据图表、监控数据源和其他功能。
系统截图


Qualitis - 是一个支持多种异构数据源的质量校验、通知、管理服务的数据质量管理平台
Gitee:https://gitee.com/WeBank/Qualitis

介绍
Qualitis是一个支持多种异构数据源的质量校验、通知、管理服务的数据质量管理平台,用于解决业务系统运行、数据中心建设及数据治理过程中的各种数据质量问题。
Qualitis基于Spring Boot,依赖于Linkis进行数据计算,提供数据质量模型构建,数据质量模型执行,数据质量任务管理,异常数据发现保存以及数据质量报表生成等功能。并提供了金融级数据质量模型资源隔离,资源管控,权限隔离等企业特性,具备高并发,高性能,高可用的大数据质量管理能力。
核心特点
- 数据质量模型定义支持以下数据模型定义:1.单表校验数据模型。2.跨表校验数据模型。3.自定义校验数据模型。同时,系统预置了多个数据质量校验模版,包括空值校验,枚举校验等常用校验,并且支持自定义数据质量模版。
- 数据质量模型调度支持数据质量模型调度。
- 数据质量报表支持生成数据质量报表。
- 日志管理 日志聚合管理,方便排查数据质量任务
- 异常数据管理 支持异常数据提取和存储,快速定位问题
- 支持工作流 支持在工作流当中进行数据质量校验工作流必装DataSphereStudio.
- 管理员控制台提供管理员控制台界面,支持人员管理,权限管理,权限管理,元数据管理等管理功能。
系统截图






TipDM - 建模平台提供数据丰富的数据预处理、 数据分析与数据挖掘组件,是开源的数据挖掘工具。
Gitee:https://gitee.com/guangzhou_TipDM_intelligence_devp/TipDM

介绍
TipDM建模平台,是由广东泰迪智能科技股份有限公司研发并开源的数据挖掘工具,TipDM建模平台提供数据丰富的数据预处理、 数据分析与数据挖掘组件,帮助广大中小企业快速建立数据挖掘工程,提升数据处理的效能。同时,我们也在积极 推动大数据挖掘社区建设,构建校企对接桥梁,为企业精准推送优质大数据挖掘人才;在产业需求的基础上推动高 校的人才培养工作。
特性
- 基于Python,用于数据挖掘建模。
- 使用直观的拖放式图形界面构建数据挖掘工作流程,无需编程。
- 支持多种数据源,包括CSV文件和关系型数据库。
- 支持挖掘流程每个节点的结果在线预览。
- 提供5大类共40种算法组件,包括数据预处理、分类、聚类等数据挖掘算法。
- 支持新增/编辑算法组件,自定义程度高。
- 提供众多公开可用的数据挖掘示例工程,一键创建,快速运行。
- 提供完善的交流社区,提供数据挖掘相关的学习资源(数据、代码和模型等)。
系统截图







