暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Flink CDC 3.3.0 发布公告

Flink 中文社区 2025-01-24
309

Apache Flink 社区非常高兴地宣布 Flink CDC 的下一个主要版本 3.3.0 已经发布。

现在,您可以访问 Flink CDC Release 页面[1] 下载 CDC 3.3.0 的二进制包,也可以在文档网站[2] 上访问最新版本的文档。如果您在使用时遇到任何问题,欢迎在 Flink 用户邮件列表[3]、用户钉群、GitHub Discussions[4] 或 Flink JIRA 看板[5] 上提出问题或发起讨论。

此次更新为数据集成 Pipeline 引入了 AI Model 支持,新增了 Oceanbase 与 MaxCompute Sink 连接器,并为 Transform 模块带来了若干改进。我们推荐您升级到 Flink CDC 3.3.0 版本。

此版本不再保证与 Flink 1.18 及更早版本的兼容性。

新功能速览

Transform

  • 支持在 Transform 表达式中调用 AI Model。目前内置 OpenAI Chat 模型及 Embedding 向量化模型。
  • 新增了操作时间戳的 TIMESTAMPADD
    TIMESTAMPDIFF
    UNIX_TIMESTAMP
     内置函数。

  • 支持“逻辑删除”转换功能,将来自上游的 DELETE 事件转换为带特殊标记的 INSERT 事件。

Connectors

  • 适用于 OceanBase 和 MaxCompute 的 Pipeline 连接器现已提供。

  • 为接入增量快照框架的 CDC 连接器实现了异步分片功能,并完善了 Metrics 支持。

  • 优化了 CDC 连接器 ROW 类型字段的反序列化效率。

OceanBase Pipeline Connector

OceanBase 是一款原生分布式关系型数据库,具备高性能和高可用性,能够支持海量数据和高并发。现在可以作为 YAML Pipeline Sink 使用。

MaxCompute Pipeline Connector

MaxCompute 是阿里云提供的分布式大数据处理平台,广泛应用于数据分析、报表生成、机器学习等场景。现在可以作为 YAML Pipeline Sink 使用。

Paimon Pipeline Connector

  • 支持同步列默认值。

  • 支持应用 TRUNCATE TABLE 和 DROP TABLE 事件。

  • 更新 Paimon 依赖版本到 0.9.0。

MySQL Connector

  • 支持解析 gh-ost 和 pt-osc 等无锁 Schema 变更工具产生的 DDL 变更事件。

  • 新增是否将 TINYINT(1) 映射到 BOOLEAN 类型的配置。

  • 支持同步表注释及行注释。

  • MySQL CDC 下发的增量数据记录中现在携带 op_ts
     元数据列,可以在 Transform 表达式中进行操作。

PostgreSQL CDC Connector

  • 减少不必要的 Schema 查询,优化初次启动时间。

  • 支持 Heartbeat 心跳包。

  • 增加 op_type
     元数据列。

Common

  • 新增了用于快速搭建数据集成验证环境的 cdc-up 脚本。

缺陷修复

  • 修复了 MySQL CDC 处理新增表时可能的死锁问题。

  • 修复了 MySQL CDC 处理 JSON 类型、带精度 FLOAT 类型的处理行为。

  • 修复了 Paimon Sink 重复 commit 导致作业失败问题。

  • 修复了 Transform 底层实现参数传递顺序问题。

  • 修复了并发执行 Schema Evolution 时作业挂起的问题。

  • 修复了作业失败重启后,Data Sink 内部状态不正确的问题。

致谢

感谢以下 37 名开发者对 Flink CDC 3.3 版本做出的贡献:

Chaoming Zhang, ConradJam, Hang Ruan, hiliuxg, Hongshun Wang, Jason Zhang, Junbo wang, Jzjsnow, jzjsnow, Kunni, Leonard Xu, liuxiaodong, MOBIN, MOBIN-F, molin.lxd, moses, North Lin, Olivier, ouyangwulin, Petrichor, Robin Moffatt, Runkang He, Sergei Morozov, Seung-Min Lee, Shawn Huang, stayrascal, Thorne, Timi, Umesh Dangat, wenmo, Wink, wudi, wuzhiping, Xin Gong, yuanoOo, yuxiqian, Zexian Wu


[1] https://github.com/apache/flink-cdc/releases/tag/release-3.3.0

[2] https://nightlies.apache.org/flink/flink-cdc-docs-stable

[3] https://flink.apache.org/what-is-flink/community

[4] https://github.com/apache/flink-cdc/discussions

[5] https://issues.apache.org/jira/projects/FLINK/summary


本周五,阿里云技术专家、Apache Flink Committer 阮航老师将为大家解读 Apache Flink CDC 3.3 新版本、新特性。

点击下方直播预约,周五同小松鼠一起快速了解 3.3 版本~



     
 
活动推荐

阿里云基于 Apache Flink 构建的企业级产品-实时计算 Flink 版现开启活动:
新用户复制下方链接或者扫描二维码即可0元免费试用 Flink + Paimon
了解活动详情:https://free.aliyun.com/?pipCode=sc
▼ 关注「Apache Flink」 
回复 FFA 2024 获取大会资料
   点击「阅读原文跳转阿里云实时计算 Flink~

文章转载自Flink 中文社区,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论