极数云舟DTark与Tapdata联合共建开放数据生态,为企业快速建立「高可靠、高性能、高效率、易使用」的数据融合体系。
近日,专注实时数据服务平台的Tapdata,宣布开源其数据源开发框架—— PDK(Plugin Development Kit),并同步启动 PDK 插件生态共建计划,旨在充分激发实时数据流动的价值,助力企业完成从传统数据架构平滑过渡到新一代数据库架构,为用户提供更好的数据服务体验。
极数云舟 DTark 多维数据融合计算的理念和 Tapdata Data on Tap 的愿景不谋而合,通过构建强大的数据整合工具实现数据实时流动和多样化数据服务。极数云舟作为首批代表,与10余家优质数据库伙伴一道,积极参与该共建计划,联合 Tapdata,共同布局开放数据生态,让数据架构更简单。
关于 DTark
云舟数据经纬平台(DTark)是解决现阶段复杂数据处理需求的广义数据库系统。
经过极数云舟四年的研发和精心打磨,目前产品已经广泛应用于国家载人航天、雄安智慧城市、国家电网数字审计、国防数字化建设以及钢铁石化数字化转型建设等诸多领域,并在实际项目中通过技术优势战胜各种数据中台方案以及数据库集成方案。
DTark 核心源码及关键技术自主研发,产品安全可控。通过实现内核层多引擎融合技术,解决目前数据库产品或者数据中台方案都不能解决的混合数据场景中的融合数据技术与服务的需求。
极数云舟官网:
关于 Tapdata
Tapdata 是一款基于 MongoDB 的实时 ETL 及数据服务平台工具,具备异构数据实时同步、批流一体数据融合、自助式 API 发布等功能。Tapdata 目前已支持近百个数据源和类型,包括市场主流的数据库、API、队列、物联网等,所有操作均是低代码、可视化方式,无需专业的编程能力就可完成数据实时同步、数据映射与合并、数据建模、数据服务 API 开发,数据实时入湖入仓等。
Tapdata 官网:
关于 Tapdata PDK
PDK 是 Tapdata 开源的一个插件开发框架,具有很强的扩展性。开发者基于 PDK 开发规范,可以简化数据链路的开发流程,通过 PDK 文档、 Plugin 模板以及内置的 TDD 测试框架,可以快速完成新数据源和目标端的开发工作。
支持类型:
接入数据库:MySQL、Oracle、PostgreSQL 等
接入 SaaS 产品:Salesforce、Zoho、Jira 等
接入自定义数据源:可对接私有协议数据源
作为 Tapdata 支持异构数据源实时数据采集能力的基石,PDK 的开源,意味着可以快速、有效地将新数据源对接至 Tapdata 产品之中,不仅能获得广泛的连接性,还能通过简单配置,0 代码完成数据的互联互通。此外,低代码流式 ETL、类型转换、模式转换等能力也支持实时对数据进行修改,从而支撑业务对数据的多样化需求。
Github 链接:
DTark-ArkIoT & Tapdata
联合解决方案
DTark 接入层 ArkIoT 旨在解决现阶段客户多元化数据接入的需求。特别在数字化转型建设中,除了传统的信息化数据外,针对常见的工业化、物联网数据以及异构化和未知数据,DTark 接入层可以根据需求提供多种数据接入通道。打破数据孤岛,规范数据标准,统一数据口径,提高数据质量,ETL 分析形成数据模型,数据资源交换共享,提供云边结合的开放式混合数据引擎,支持信息系统结构化数据、工业物联网时序数据、科学引擎接口数据的可扩展接入,并针对数据类型与计算需求可扩展至在线事务处理(OLTP)、在线分析处理(OLAP)、时序数据处理(TSDP)、全文检索(FTS)、知识库(KB)等多种引擎,满足数据预处理、数据组装、数据编排、数据标注、数据血缘等一站式数据治理需求。
数据孤岛
一般来说,企业信息化发展有三个阶段:基于设备的建设,基于项目的建设和基于战略的建设。在第二阶段必然会产生信息孤岛,把这些孤岛连接起来从技术上还是可以实现的,但关键的难题就在于不同部门针对于相同数据的值可以不同,很难有自动的方法可以区分出来哪些是“正确”的数据,并且各种信息系统大多是独立采购与建设的。DTark 接入层从流程、底层系统进行解耦,打通横向和上下游系统之间的交叉互联关系,打破数据孤岛的问题。
数据异构
企业生产中,数据来源有信息化数据、工业化数据、物联网数据、异构化数据、未知数据等,其数据协议、格式化多样,数据异构化显著,多种异构数据源被分散在多个系统中。DTark 接入层以智能网关作为开放平台,配置多种嵌入式数据采集功能,包括数据采集、数据处理等,支持网关与 PLC、生产管理系统、生产装备的通信。同时,支持集成开源或者客户定制的工业应用,进行个性化工业数据采集和转换处理,支持多种工业协议与多种网络传输模式有效整合的工业数据采集和转换系统,解决工业设备种类繁杂、工业通信协议格式各异,协议承载和分析的成本巨大的问题。
数据存储
随着业务的发展,数据接入并存储也随之迎来了挑战,老旧的技术体系构建的单体应用不能支撑现阶段互联网的高并发环境和超大规模数据存储。DTark 解决了传统数据库单实例数据量大、备份迁移扩容频繁且难度较大、分库分表人工 sharding 效率低下、无法灵活的动态扩缩容节点的问题。可实现数据多副本、水平弹性伸缩、数据一致性、透明高可用、分层解耦融合。
数据融合
多源异构的底层计算、存储架构以及数据库种类,使得数据融合面临巨大挑战,无法有效提升数据整体价值。DTark 接入层可在不同阶段对数据进行融合:在数据接入阶段,通过边缘计算接入、API 服务接入满足工业场景中数据写入的新需求。同时可将融合超前到存储阶段实现,在数据引擎阶段,通过多引擎融合横向打通解决数据多样性存储的问题。
数据软件复杂未知
基础数据库产品与大数据系统需要融合,传统烟囱式软件实现架构与技术体系需要优化,已有数据库产品在可用性、可扩展性层面需要升级。DTark 接入层在数据接入方面可实现对多种数据格式、多种数据协议、多种数据服务的可扩展接入,在数据输出方面实现了以数据服务为标准的数据输出手段,在数据引擎方面以引擎作为数据库的基本能力,同时实现了可扩展的插件式引擎,提升了数据库产品和技术的天花板。
合作共赢,携手共建。未来,DTark 将持续携手 Tapdata,共同探索数据开放生态的更多可能,让数据无界、价值共享。
详情请点击左下角“阅读原文”




