暂无图片
暂无图片
3
暂无图片
暂无图片
暂无图片

RisingWave 产品月报|25 年 4 月

Doc 团队
来源|RisingWave 官网

欢迎阅读 RisingWave 2025 年 4 月产品月报!本期内容将为您带来过去一个月的产品更新、文档优化、博客发布动态,以及即将上线的精彩活动,敬请关注!


产品更新

RisingWave Cloud

  • Kafka 源向导(Kafka Source Wizard)我们推出了精简版 Kafka 源向导,以简化数据管道的设置。新的工作流程可以自动获取主题,根据样本数据生成 Schema,从而免去了人工检查。现在还可以将关键元数据字段(如键、分区和时间戳)直接作为表列包含在内。

    Kafka Source Wizard|图源:RW
  • 表详情页(Table Details Page)现在可以查看表的详细信息,包括关键指标、设置和模式概览。此次更新后,RisingWave 为所有主要数据对象(Sources、 Sinks、物化视图和表)提供完整的详情页面。

    Table Details Page|图源:RW
RisingWave Kernel
  • RisingWave 现支持从 PostgreSQL 17 摄取 CDC 数[1](此功能已处于公开预览阶段)。

  • RisingWave 现在支持在不中断运行的情况下动态调整共享源(Shared source)的并行度[2]。此前,共享源的并行度被锁定为与计算节点(CN)的并行度一致,每次修改都需要重启服务。
  • RisingWave 不断增强其 Iceberg 集成,以支持更多使用场景:
    • RisingWave 现在可以作为 JDBC catalog[3],让用户通过第三方引擎查询托管的 Iceberg 表。
    • 此外,目前除在 Amazon S3 和 Google Cloud Storage(GCS)上托管 Iceberg 表之外,RisingWave 还支持在 Azure Blob 存储上托管 Iceberg 表[4]
与 Iceberg 的集成不断增强|图源:RW

文档更新

  • 了解 RisingWave 全新的弹性磁盘缓存( Elastic Disk Cache)[5]如何提升性能并降低 S3 访问成本。通过使用本地磁盘(如 NVMe 或 EBS)作为缓存扩展,它可以缩短延迟并提高大规模流处理工作负载的效率。
  • RisingWave 已支持数据库隔离、资源组和跨数据库查[6],使管理多个工作负载更加便捷,且能灵活访问并整合隔离环境中的数据。
  • RisingWave 与 Apache Flink 的详细对比[7],包括 SQL 功能、数据类型、流式操作和系统功能等各项重要指标。
  • 端到端延迟性能指南[8]深入分析了影响 RisingWave 延迟的因素,并分享了在降低延迟与提高吞吐量之间保持平衡以优化性能的技巧。
  • RisingWave 提供多种与 Apache Iceberg 交互的方式,包括读取和写入外部 Iceberg 表、以 Iceberg 原生格式存储数据,以及将 Amazon S3 表作为 Iceberg 目录。请查阅官方文档[9]了解更多细节。
精选文章

    文章 1:RisingWave 四周年:我们的目标不只是流处理大众化[10]

    四年来,RisingWave 始终致力于让流处理的强大能力触手可及。如今,我们正踏上全新征程。未来不仅关乎高效的流处理,更在于构建一个集成式、端到端的平台,将实时处理、实时服务与长期存储无缝衔接。

    文章 2:RisingWave 引入 Iceberg 表引擎:用 SQL 管理 Iceberg 流数据[11]
    Apache Iceberg 为数据湖提供了坚实的基础,但将实时流与之集成仍然是一项挑战。RisingWave 推出的 Iceberg 表引擎提供以下能力:
    • 在流处理环境中通过 SQL 管理 Iceberg 表
    • 原生支持 CDC 流和等值删除操作
    • 基于标准 SQL 的实时 ETL 能力
    • 对流数据管道的低延迟可见性
    • 与 Iceberg 生态系统的全面兼容
    文章 3:使用 Databento 和 RisingWave 实时检测电子欺诈[12]

    我们展示了如何通过将 Databento 的市场数据与 RisingWave 的实时 SQL 处理能力相结合,构建一个用于识别欺诈性挂单(spoofing)的基础交易监控系统。我们引入了历史数据,并借助 RisingWave 的物化视图,持续识别基于挂单大小与其相对最佳买卖报价(BBO)位置的可疑撤单模式。

    文章 4:RisingWave v2.3 亮点概览[13]

    RisingWave v2.3 现已正式发布!此次更新包含了基于 Apache Iceberg 的列式存储、用于工作负载管理的资源组、全新的 SQL 函数等诸多新特性,为流处理工作带来了更强大的功能与更高的灵活性。

    文章 5:RisingWave 中的工作负载隔离:数据库隔离、资源组和跨数据库查询[14]

    RisingWave v2.3 在管理复杂的多工作负载流处理环境方面实现了重大跃进。增强的数据库隔离机制提供了更加坚实的系统基础;资源组则带来了对计算资源、故障域与性能调优的精细化控制能力。在此之上,跨数据库查询功能打破了内部数据孤岛,使用户能够通过简单的 SQL 或基于 CREATE SUBSCRIPTION 的强大物化视图,灵活访问并整合隔离环境中的数据。

    精彩活动

    • 线上(25 年 5 月 8 日):Real-Time Data+AI[15]
    • 伦敦(25 年 5 月 20-21 日):Current London[16]
    参考资料
    [1] 

    从 PostgreSQL 17 摄取 CDC 数据: https://docs.risingwave.com/ingestion/sources/pg-cdc

    [2] 

    动态调整共享源(Shared source)的并行度: https://docs.risingwave.com/sql/commands/sql-alter-source

    [3] 

    JDBC ca talog: https://github.com/risingwavelabs/risingwave/pull/21400

    [4] 

    在 Azure Blob 存储上托管 Iceberg 表: https://docs.risingwave.com/integrations/destinations/apache-iceberg

    [5] 

    Elastic Disk Cache: https://docs.risingwave.com/get-started/disk-cache?utm_source=hs_email

    [6] 

    数据库隔离、资源组和跨数据库查询: https://docs.risingwave.com/operate/workload-isolation-interaction

    [7] 

    RisingWave 与 Apache Flink 的详细对比: https://docs.risingwave.com/faq/risingwave-flink-comparison

    [8] 

    端到端延迟性能指南: https://docs.risingwave.com/performance/troubleshoot-e2e-latency

    [9] 

    官方文档: https://docs.risingwave.com/iceberg/overview

    [10] 

    RisingWave 四周年:我们的目标不只是流处理大众化: https://www.risingwave.com/blog/risingwave-turns-four/

    [11] 

    RisingWave 引入 Iceberg 表引擎:用 SQL 管理 Iceberg 流数据: https://www.risingwave.com/blog/risingwave-iceberg-table-engine/

    [12] 

    使用 Databento 和 RisingWave 实时检测仿冒行为: https://www.risingwave.com/blog/spoofing-detection-databento-risingwave/

    [13] 

    RisingWave v2.3 亮点概览: https://www.risingwave.com/blog/highlights-of-risingwave-v23/

    [14] 

    RisingWave 中的工作负载隔离:数据库隔离、资源组和跨数据库查询: https://www.risingwave.com/blog/workload-isolation-in-risingwave/

    [15] 

    Real Time Data + AIhttps://lu.ma/k2kfng9x

    [16] 

    Current Londonhttps://current.confluent.io/london

    关于 RisingWave 

    RisingWave 是一款基于 Apache 2.0 协议开源的分布式流数据库,致力于为用户提供极致简单、高效的流数据处理与管理能力。RisingWave 采用存算分离架构,实现了高效的复杂查询、瞬时动态扩缩容以及快速故障恢复,并助力用户极大地简化流计算架构,轻松搭建稳定且高效的流计算应用。
    RisingWave 始终聆听来自社区的声音,并积极回应用户的反馈。目前,RisingWave 已汇聚了 150+ 名开源贡献者和 3000+ 名社区成员。全球范围内,已有上百个 RisingWave 集群在生产环境中部署。

    技术内幕

    如何上手 RisingWave 👉 新手入门教程

    RisingWave 中文用户文档上线,阅读更高效!

    深入探索 RisingWave 中的高可用性与容错机制

    深入理解 RisingWave 流处理引擎(三):触发机制

    深入理解 RisingWave 流处理引擎(二):计算模型

    深入理解 RisingWave 流处理引擎(一):总览

    用户案例
    视源股份(CVTE)IT 流计算应用历程
    尘锋 SCRM 如何使用 RisingWave 实时打宽
    RisingWave 在超百亿管理规模对冲基金公司中的应用
    金融科技公司 Kaito 使用 RisingWave 实现实时智能化
    龙腾出行如何通过 RisingWave 实现实时数据分析

    RisingWave 助力乾象投资打造实时监控平台



    👇 点击阅读原文立即体验 RisingWave

    最后修改时间:2025-05-08 10:18:57
    文章转载自RisingWave中文开源社区,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

    评论