暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

RisingWave 产品月报|25 年 5 月

Doc 团队
来源|RisingWave 官网

欢迎阅读 RisingWave 2025 年 5 月产品月报!本期内容涵盖过去一个月的产品更新、文档优化、博客精选,以及即将上线的精彩活动,敬请关注!


产品更新

RisingWave Cloud

  • 全新定制化配置 UI(Revamped Custom Configuration UI我们对 RisingWave Cloud 的定制配置 UI 进行了全面升级,提升了整体使用体验。节点副本数的配置选项已恢复,同时现在支持选择更大规格的节点资源,方便根据实际工作负载精细调整集群设置。

  • Serverless 自动压缩(预览功能)我们还推出了全新的 Serverless 自动压缩功能,可根据实际需求自动扩展计算资源,无需手动设置。系统会在后台持续清理并优化数据文件,加速查询效率,让性能始终保持最佳状态。

  • 更智能的 Rescaling 选项(Smarter Rescaling OptionsRescaling UI 现已与项目创建流程保持一致,配置体验更加统一、直观,方便在后续调整时快速上手。

RisingWave Kernel
  • 回填顺序控制(Backfill Order Control):RisingWave 支持固定回填顺序[1]。该功能统一了流式摄取与回填阶段的数据顺序,有助于避免大规模 Join 放大问题。

  • Table Sinks 支持解耦(Decoupled Sinks for Table Sinks):Sink 解耦功能一直深受用户欢迎。此前,该功能主要用于将 Sink 解耦以连接到外部系统。现在能力进一步拓展,为 sink into table 引入了 sink_decouple 选项[2]。通过该选项,用户在创建写入目标表的 Sink 时可以启用解耦执行模式,从而进一步提升 RisingWave 的系统稳定性。
  • 更强的 Iceberg 集成能力(Enhanced Iceberg Integration)
    • RisingWave 引入了针对 Apache Iceberg Sink 操作的 Exactly-Once 语义[3]。由于数据湖常作为分析场景中的单一可信来源,保障数据不丢失、不重复至关重要。此次增强进一步提升了数据湖下游流程的数据一致性与可靠性。
    • RisingWave 还支持与 Iceberg 的托管 SQL Catalog 集成[4],简化表管理流程,提升与其他 SQL 系统的互操作性,让 Iceberg 更好地融入 RisingWave 的数据平台生态。

文档更新

  • 通过 EXPLAIN ANALYZE[5]命令,深入了解流处理作业的实际运行时性能。
  • 借助 DESCRIBE FRAGMENTS[6] 命令,轻松查看任意现有作业的执行片段。
  • RisingWave 现已增强其 Redis sink[7]功能,不仅支持以键值对形式存储数据,还能利用 Redis 的地理空间数据特性,并通过其发布/订阅 (Pub/Sub) 系统发布消息。
  • RisingWave 支持使用 Iceberg table engine 创建仅追加表 (append-only table[8])。数据将仅存储于 Iceberg,并在提交 (commit) 后对下游作业可见。
精选文章

    文章 1:RisingWave 携手 Fabi.ai,将实时高级分析带入企业级场景[9]

    RisingWave 提供强大的流处理能力和统一的指标定义,Fabi.ai 则以直观友好的界面见长,二者结合,有效消除企业在数据项目中面临的技术门槛与组织混乱。使得使用团队可以基于最新、可靠的数据保持一致节奏,数据从业者也能在协作环境中高效地将洞察传达给业务团队。

    文章 2:无缝集成 Iceberg:RisingWave 支持 Amazon S3 表[10]
    通过与 Amazon S3 Tables 的集成,RisingWave 为 AWS 用户提供了一种强大而高效的方式,将 Iceberg 自然融入流数据处理流程。无论是从 S3 Tables 中摄取数据、将处理结果写回表中,还是直接通过 S3 Tables 管理 Iceberg 表,RisingWave 都能提供贴合 AWS 生态的顺畅体验,简化系统架构、提升兼容性,让开发者更专注于构建可扩展的流处理应用。
      文章 3:实时加密分析:RisingWave 如何应对数据挑战[11]

      本文展示了一家加密分析公司如何借助 RisingWave 进行即时数据处理与分析。文章深入剖析了五个核心使用场景,展示 RisingWave 如何从关键数据源中实时采集并转化信息——包括网页内容、音频流(如播客和 Twitter/X Spaces)、X/Twitter 互动数据、应用日志、Medium、YouTube 等,并生成可立即使用的洞察。

      文章 4:RisingWave 架构揭秘:如何基于 S3 构建主存储系统[12]

      本文深入解析了 S3 作为 RisingWave 主存储的架构设计,我们如何跑出内存性能,仅需云端成本。从一开始,我们就决定将 S3 用作唯一的存储层,而不仅仅是备份用途。无论是内部状态、物化视图、算子输出,还是恢复日志,全部都存放在 S3 上。这一选择迫使我们针对需要解决出现的各种限制问题:读写延迟高、API 请求贵、无法保证强一致性、完全不支持传统磁盘语义……但我们成功了。

      文章 5:用流式 SQL 调用外部 API:RisingWave JS UDFs 支持 fetch 与批处理[13]

      在传统方案中,从流式 SQL 查询中高效地发起外部调用一直是个难题。每一次调用都可能引入延迟;而当高吞吐量的流处理任务需要频繁请求外部接口时,系统很容易陷入性能瓶颈,甚至在遇到按调用计费或限流的 API 时带来高昂的成本。RisingWave v2.3 对 JavaScript 用户自定义函数(UDF)进行了重要升级:现在全面支持 fetch API 以及批处理执行。这项增强专为在流式 SQL 查询中调用外部 API 而设计,助您实现更强大、高效且具成本效益的外部数据访问能力。

      文章 6:在 Apache Iceberg 中摄取、转换与查询流式数据[14]
      在 RisingWave 中,只需使用 SQL,你就能完成从 Kafka 进行数据摄取、实时转换,到将结果写入 Apache Iceberg ,并实现秒级数据更新。无需 JVM、无需构建 DAG、也无需 Airflow。
      文章 7:RisingWave 引入弹性磁盘缓存功能[15]

      弹性磁盘缓存(Elastic Disk Cache) 在计算节点本地引入了全新的缓存层,使用本地磁盘进行数据缓存。那些访问频繁却无法装入内存的数据,现在可以缓存在高速本地磁盘中,而无需每次都走一趟既慢又昂贵的 S3 访问路径。这项能力构建起一套智能的分层存储架构:内存 → 磁盘 → S3

      精彩活动

      过去的一个月里,RisingWave 的全球巡回活动 Streaming Lakehouse Tour[16] 走访了多个城市,与来自世界各地的热情用户、开发者、合作伙伴和技术爱好者们面对面交流碰撞。

      这个夏天,精彩仍将继续——6 月和 7 月我们将继续在新加坡、纽约、巴黎、慕尼黑等地陆续举办活动,期待与你相见!

      • 线上(25 年 6 月 3 日):Streaming Apache Iceberg Essentials[17]
      • 新加坡(25 年 6 月 5 日):Streaming Lakehouse Tour[18]

      • 柏林&线上(25 年 6 月 16 日):Berlin Buzzwords[19]

      • 慕尼黑(25 年 6 月 17 日):Munich Database Meetup[20]
      • 巴黎(25 年 6 月 19 日):Streaming Lakehouse Tour
      参考资料
      [1] 

      固定回填顺序: https://github.com/risingwavelabs/risingwave/pull/20967

      [2] 

      sink_decouple: https://github.com/risingwavelabs/risingwave/pull/21784

      [3] 

      Exactly-Once 语义: https://github.com/risingwavelabs/risingwave/pull/19771

      [4] 

      托管 SQL Catalog 集成: https://github.com/risingwavelabs/risingwave/pull/21351

      [5] 

      EXPLAIN ANALYZE 命令: https://docs.risingwave.com/sql/commands/sql-explain-analyze

      [6] 

      DESCRIBE FRAGMENTS 命令: https://docs.risingwave.com/sql/commands/sql-describe

      [7] 

      Redis sink: https://docs.risingwave.com/integrations/destinations/redis

      [8] 

      append-only table: https://docs.risingwave.com/store/iceberg-table-engine#append-only-tables

      [9] 

      文章一: https://www.risingwave.com/blog/risingwave-fabi-ai-partnership/

      [10] 

      文章二: https://www.risingwave.com/blog/risingwave-amazon-s3-tables-iceberg/

      [11] 

      文章三: https://www.risingwave.com/blog/real-time-crypto-analytics-overcoming-data-challenges-with-risingwave/

      [12] 

      文章四: https://www.risingwave.com/blog/how-we-built-risingwave-on-s3-a-deep-dive-into-s3-as-primary-storage-architecture/

      [13] 

      文章五: https://www.risingwave.com/blog/risingwave-js-udf-fetch-batch/

      [14] 

      文章六: https://www.risingwave.com/blog/the-simplest-way-to-ingest-transform-and-query-streaming-data-in-apache-iceberg/

      [15] 

      文章七: https://www.risingwave.com/blog/risingwave-elastic-disk-cache/

      [16] 

      Streaming Lakehouse Tourhttps://risingwave.com/streaming-lakehouse-tour/

      [17] 

      Streaming Apache Iceberg Essentialshttps://www.linkedin.com/events/streamingapacheicebergessential7333577015981199364/about/

      [18] 

      Streaming Lakehouse Tour-Singapore: https://2025.berlinbuzzwords.de/session/the-dark-secrets-of-stream-processing/

      [19] 

      Berlin Buzzwordshttps://2025.berlinbuzzwords.de/session/the-dark-secrets-of-stream-processing/

      [20] 

      Munich Database Meetuphttps://www.meetup.com/munich-database-meetup/events/308068568/


      关于 RisingWave 

      RisingWave 是一款基于 Apache 2.0 协议开源的分布式流数据库,致力于为用户提供极致简单、高效的流数据处理与管理能力。RisingWave 采用存算分离架构,实现了高效的复杂查询、瞬时动态扩缩容以及快速故障恢复,并助力用户极大地简化流计算架构,轻松搭建稳定且高效的流计算应用。
      RisingWave 始终聆听来自社区的声音,并积极回应用户的反馈。目前,RisingWave 已汇聚了 150+ 名开源贡献者和 3000+ 名社区成员。全球范围内,已有上百个 RisingWave 集群在生产环境中部署。

      技术内幕

      如何上手 RisingWave 👉 新手入门教程

      RisingWave 中文用户文档上线,阅读更高效!

      深入探索 RisingWave 中的高可用性与容错机制

      深入理解 RisingWave 流处理引擎(三):触发机制

      深入理解 RisingWave 流处理引擎(二):计算模型

      深入理解 RisingWave 流处理引擎(一):总览

      用户案例
      视源股份(CVTE)IT 流计算应用历程
      尘锋 SCRM 如何使用 RisingWave 实时打宽
      RisingWave 在超百亿管理规模对冲基金公司中的应用
      金融科技公司 Kaito 使用 RisingWave 实现实时智能化
      龙腾出行如何通过 RisingWave 实现实时数据分析

      RisingWave 助力乾象投资打造实时监控平台



      👇 点击阅读原文立即体验 RisingWave

      文章转载自RisingWave中文开源社区,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

      评论