暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

8a V95技术白皮书——GBase8aMPPCluster 高级特性(1)

原创 PEWSGGL 2022-09-26
764

数据加载及集成
数据加载

GBase 8a MPP Cluster 中,集群加载功能直接集成在 GBase 8a MPP Cluster 内部,不需要额外部署外部加载工具。

数据加载具备如下一些特性和优点: 1)与集群高度集成;

面向用户的 SQL 接口方式更符合用户的使用习惯;
支持单表多数据源并行加载,支持多加载机对单表的并行加载,最大 化提升加载性能;
支持从通用数据服务器拉取数据,支持ftp/sftp/hdfs/Kafka/http/https 等多种文件传输协议;
支持普通文本、gzip 压缩、snappy 压缩、lzo 压缩等多种格式数据文件;
支持普通文本、定长文本、宽松模式的加载;
支持用户自定义列分割符、行分隔符和日期时间格式;
支持错误数据溯源功能,可以准确定位错误数据在源文件中的位置;
加载性能可以随着集群规模的扩展而持续提升。
kafka 数据集成
数据同步系统通过Oracle Golden Gate(OGG)、GBase RTSync 等工具复制Oracle、GBase 8s 等数据库的业务数据,通过 kafka 同步到 GBase 8a MPP Cluster,OGG 发送端(GoldenGate Extract)从 Oracle 的在线日志和归档日志中抽取事务信息,生成 Trail 文件。OGG 接收端(GoldenGate Replicat)收到 Trail 文件抽取事务信息转换为目标格式,并生产事务消息到 Kafka。Consumer 从Kafka 中消费事务消息,将数据更新到 8a MPP Cluster 中。

Kafka consumer 的主要功能就是同步 Kafka 数据到 8a MPP Cluster: 1) 根据配置,可以指定需要同步的业务;

在同步过程中,提供同步状态查询功能;
实现数据同步的高可用性和事务数据一致性。
————————————————
版权声明:本文为CSDN博主「aisirea」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/aisirea/article/details/127047991

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论