点击蓝字 关注我们
摘要
Apache SeaTunnel概览


Apache SeaTunnel核心特性
多种同步方式优势:支持批流一体的同步,批量数据同步能够从数据源头上通过JDBC的方式进行同步,或直接对接原来的数据接进行批量数据读写,这比JDBC加载的方式快很多。批流一体的数据同步也是使得CDC非常方便,可以自动化同步历史数据,在内存里驱动并加载相关binlog,省去了手工同步地址等相关工作。同时,Apache SeaTunnel还支持动态加载表,分库分表、Checkpoint等场景。


连接器支持:支持超过130种连接器,覆盖了主流的数据库和数据存储系统。

支持多引擎:Apache SeaTunnel支持自研的Zeta数据同步专用引擎,并与Spark、Flink、Zeta等多种数据处理引擎兼容,提供snapshot存储功能。

性能优势:Apache SeaTunnel在数据同步任务中表现出色,在实际场景中性能优于大部分数据同步工具,例如比DataX快30%,比Airbyte快80%。


部署便捷性

官网: https://seatunnel.apache.org GitHub:https://github.com/apache/incubator-seatunnel Slack:https://apacheseatunnel.slack.com X:https://twitter.com/asfseatunnel
B 站:https://space.bilibili.com/1542095008
SAP数据到Redshift的集成实践
数据同步作业创建

从AWS Marketplace快速部署WhaleTunnel

WhaleTunnel帮助企业快速完成复杂
数据源之间CDC与批量整合问题

通过WhaleTunnel可视化配置SAP
到Redshift集成

创建SAP Hana数据源

创建S3-Redshift数据源

可视化勾选同步表格,自动类型映射与可视化转化


直接在Redshift中自动建表和类型转换


SAP RFC数据同步到Redshift

全面可视化监控数据同步过程,并根据不同情况报警

AWS客户案例分析
案例背景
痛点分析
从SAP到Redshift数据链路过长,采用多种技术消耗多种资源,且使用原有产品抽取Hana速度过慢 数据直接进入Redshift速度太慢,需要先变成文件再处理 Talend使用比较复杂,不能支持Spark Controller,且只支持SAP Hana 6.2,对SAP Hana 7.3支持不好
选择白鲸WhaleStudio原因
经过POC验证,抽取Hana速度明显提升,不受制于工具本身,而是Hana库资源 WhaleStudio界面简单操作,支持可视化开发,支持统一数据源管理与版本控制 采用WhaleStudio可以直接用SAP进入Redshift,再用WhaleStudio 在Redshift上直接SQL开发调试,而不用Hudi、Hive、S3、EMR等复杂开发,使得整体开发效率提升
WhaleStudio解决方案


案例成效

结语

Apache SeaTunnel
精彩推荐
点击阅读原文了解更多!⭐️

文章转载自SeaTunnel,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




