GreptimeDB v0.8 发布｜引入 Flow Engine 提供持续聚合能力

GreptimeDB 2024-05-20

244

关注 GreptimeDB，了解更多技术干货👇

2024 年转眼已快过半，我们 Greptime 团队也在按计划稳步迈向 v1.0 版本的生产发布。今天，我们很高兴地宣布 v0.8 版本已正式上线，该版本引入了 Flow Engine，一个轻量级、面向时序的流计算框架，能够提供持续聚合能力。

从 v0.7 到 v0.8，Greptime 团队取得了显著的进展：共合并了 88 次代码提交，修改了 893 个文件，其中包括 40 项功能增强，20 项错误修复，22 项代码重构，以及大量的测试工作。在此期间，共有 16 位来自社区的个人贡献者提交了 44 次代码贡献。

Tips

v0.8 是 GreptimeDB 迈向 GA（General Availability Releases）版本发布的一个重要节点，我们修复了之前开发中用户反馈的问题，并根据目前的市场痛点调整了版本的迭代计划。

按照惯例，我们希望和大家分享 GreptimeDB 版本升级的细节和架构思考，所以本次更新将有视频号直播分享。

了解更多功能细节、观看 demo 演示，或是直接提问我们的核心工程师，欢迎参与本周四（5 月 23 日）晚 19:00 的直播。

🎁 点击下方直播链接立即预约我们的直播哦~

Flow Engine

GreptimeDB v0.8 中新增了 Flow Engine 来提供持续聚合功能，可实时流式地对数据进行聚合计算并物化结果。当需要即时计算与查询总和、平均值或其他汇总信息时，这项功能将非常实用。

（Flow Engine 工作流程示意图）

例如，我们有一张 my_source_table 表，需要持续五分钟一个窗口计算统计计数，则可以声明如下 flow 任务：

CREATE FLOW IF NOT EXISTS my_flow
OUTPUT TO my_sink_table
COMMENT = "My first flow in GreptimeDB"
AS
SELECT count(item)
FROM my_source_table
GROUP BY tumble(time_index,  '5 minutes');

目前已经支持固定窗口的计算以及若干常用聚合函数，并且在持续开发中，欢迎大家试用。

持续聚合任务演示

这里简单展示一下一个持续聚合任务看起来大概是什么样子。首先，通过以下语句创建一个 numbers_input 表作为输入表，以及 out_num_cnt 作为输出表。我们目前正在持续优化用户体验，预计在下个版本中将不需要手动创建 sink table，可以交由 GreptimeDB 直接从查询推导而来。

CREATE TABLE numbers_input (
    number INT,
    ts TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    PRIMARY KEY(number),
    TIME INDEX(ts)
);

CREATE TABLE out_num_cnt (
    sum_number BIGINT,
    start_window TIMESTAMP TIME INDEX,
    end_window TIMESTAMP,
    update_at TIMESTAMP,
);

然后创建持续聚合任务 test_numbers 来对 number 列求和。聚合窗口为 1 秒的固定窗口。

CREATE FLOW test_numbers 
SINK TO out_num_cnt
AS 
SELECT sum(number) FROM numbers_input GROUP BY tumble(ts, '1 second','2024-5-20');

现在，可以向 numbers_input 中插入记录，并在 out_num_cnt 中观察到结果。

INSERT INTO numbers_input 
VALUES
    (20,1625097600000),
    (22,1625097600500);

out_num_cnt 会产生如下数据。

SELECT * FROM out_num_cnt;

 sum_number |        start_window        |         end_window         |         update_at          
------------+----------------------------+----------------------------+----------------------------
         42 | 2021-07-01 00:00:00.000000 | 2021-07-01 00:00:01.000000 | 2024-05-17 08:32:56.026000
(1 row)

其他更新

1. 支持对列类型的更改

这个特性可以让用户轻松地更改表中列的数据类型，无需重新建表或者手动迁移数据，提高了数据库的灵活性和可维护性。

例如，下面语句将 monitor 表的 load_15 列变更为 STRING 类型：

ALTER TABLE monitor MODIFY COLUMN load_15 STRING;

注意：修改的列不能是 tag（主键）或 time index，并且必须可以为空以确保数据可以安全地转换（转换失败时返回 “NULL”）。

2. 实现了 information_schema 的集群管理信息表（cluster_info）

在 information_schema 中增加了 cluster_info 表。我们可以通过查询 cluster_info 表获取集群的信息。这个功能帮助管理员监控和管理数据库集群的健康状态，及时发现和解决问题。

Distributed 模式下的查询结果：

+---------+-----------+----------------+---------+------------+-------------------------+-------------+-------------+
| peer_id | peer_type | peer_addr      | version | git_commit | start_time              | uptime      | active_time |
+---------+-----------+----------------+---------+------------+-------------------------+-------------+-------------+
| 1       | DATANODE  | 127.0.0.1:4101 | 0.7.2   | 86ab3d9    | 2024-04-30T06:40:04.791 | 4s 478ms    | 1s 467ms    |
| 2       | DATANODE  | 127.0.0.1:4102 | 0.7.2   | 86ab3d9    | 2024-04-30T06:40:06.098 | 3s 171ms    | 162ms       |
| 3       | DATANODE  | 127.0.0.1:4103 | 0.7.2   | 86ab3d9    | 2024-04-30T06:40:07.425 | 1s 844ms    | 1s 839ms    |
| -1      | FRONTEND  | 127.0.0.1:4001 | 0.7.2   | 86ab3d9    | 2024-04-30T06:40:08.815 | 454ms       | 47ms        |
| -1      | METASRV   | 127.0.0.1:3002 | 0.7.2   | 86ab3d9    | 2024-04-30T06:39:03.290 | 1m 5s 677ms |             |
+---------+-----------+----------------+---------+------------+-------------------------+-------------+-------------+

3. 支持 Append-only 表

用户可以在建表时通过设置 append 模式（create table ... engine=mito with('append_mode'='true');）来创建 Append-only 模式的表，Append-only 表只支持插入，不支持删除和更新，插入的数据也不会去重，因此可以更方便地存储重复的数据。

4. 支持 DROP DATABASE 语句

DROP DATABASE 语句可以快速删除一个 database 实例下的所有表和资源。

5. 大幅优化了 Prometheus Remote Write 的协议解析开销

优化细节可参阅文章：《Rust 解码 Protobuf 数据比 Go 慢五倍？记一次性能调优之旅》。

6. 新的表分区方式和分区语法

考虑到未来自动分区、重新分区等需要频繁变更分区的需求，我们开始开发一种新的分区语法。使用方式可参考官方中文文档：

https://docs.greptime.cn/contributor-guide/frontend/table-sharding

7. 支持分布式查询性能分析 EXPLAIN ANALYZE <QUERY>，可以在分布式模式下方便快速定位及优化查询语句
例如：分析 count(*) 的单步耗时

explain analyze SELECT count(*) FROM system_metrics;

+-------+------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| stage | node | plan                                                                                                                                                                            |
+-------+------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| 0     | 0    |  MergeScanExec: peers=[4402341478400(1025, 0), ] metrics=[output_rows: 1, ready_time: 6352264, finish_time: 7509279,] |
|       |      |                                                                                                                                                                                 |
| 1     | 0    |  AggregateExec: mode=Final, gby=[], aggr=[COUNT(greptime.public.system_metrics.ts)] metrics=[output_rows: 1, elapsed_compute: 108029, ]                                         |
|       |      |   CoalescePartitionsExec metrics=[output_rows: 32, elapsed_compute: 83055, ]                                                                                                    |
|       |      |     AggregateExec: mode=Partial, gby=[], aggr=[COUNT(greptime.public.system_metrics.ts)] metrics=[output_rows: 32, elapsed_compute: 334913, ]                                   |
|       |      |       RepartitionExec: partitioning=RoundRobinBatch(32), input_partitions=1 metrics=[repart_time: 1, fetch_time: 441565, send_time: 30325, ]                                    |
|       |      |         StreamScanAdapter { stream: "<SendableRecordBatchStream>" } metrics=[output_rows: 3, mem_used: 24, ]                                                                    |
|       |      |                                                                                                                                                                                 |
|       |      | Total rows: 1                                                                                                                                                                   |
+-------+------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

升级指南

由于新版本存在一些重大变更，本次 v0.8 发布需要停机升级，推荐使用官方升级工具，大致升级流程如下：

1. 创建一个全新的 v0.8 集群

2. 关闭旧集群流量入口（停写）

3. 通过 GreptimeDB CLI 升级工具导出表结构和数据

4. 通过 GreptimeDB CLI 升级工具导入数据到新集群

5. 入口流量切换至新集群

详细升级指南请参考：

中文：https://docs.greptime.cn/user-guide/upgrade
英文：https://docs.greptime.com/user-guide/upgrade

未来展望

我们下一个里程碑在 7 月初，届时将推出 v0.9 版本。这一版本将引入 Log Engine，一个专门的为日志存储和查询优化的存储引擎，会包含全文索引，也可能会与 Flow Engine 进行一定的结合，比如日志内容解析抽取。GreptimeDB 的终态目标是一个融合 Metrics 和 Log 的泛时序数据库。

欢迎大家来到直播间了解我们的版本更新计划，也欢迎各位参与代码贡献或功能、性能的反馈和讨论，让我们携手见证 GreptimeDB 持续的成长与精进。

关于 Greptime

Greptime 格睿科技专注于为物联网（如智慧能源、智能汽车等）及可观测等产生大量时序数据的领域提供实时、高效的数据存储和分析服务，帮助客户挖掘数据的深层价值。目前主要有以下三款产品：

GreptimeDB 是一款用 Rust 语言编写的开源时序数据库，具有云原生、无限水平扩展、高性能和融合分析等特点，帮助企业实时读写、处理和分析时序数据的同时，降低长期存储的成本。我们提供 GreptimeDB 企业版，支持更多企业特性和定制化服务，如有需要欢迎联系我们：15310923206（同微信）。

GreptimeCloud 是一款全托管的云上数据库即服务（DBaaS）解决方案，基于开源时序数据库 GreptimeDB 打造，能够高效支持可观测、物联网、金融等领域的应用。用户可以通过内置的可观测性解决方案 GreptimeAI 全面掌握 LLM 应用的成本、性能、流量和安全等情况。

车云一体解决方案 是一款深入车企实际业务场景的时序数据库解决方案，解决了企业车辆数据呈几何倍数增长后的实际业务痛点。多模态车端数据库结合云端 GreptimeDB 企业版帮助车企极大降低流量、计算和存储成本，并帮助提升数据实时性和业务洞察能力。

GreptimeDB 作为开源项目，欢迎对时序数据库、Rust 语言等内容感兴趣的同学们参与贡献和讨论。第一次参与项目的同学推荐先从带有 good first issue 标签的 issue 入手，期待在开源社群里遇见你！扫码添加小助手备注“技术交流群”立即加入讨论吧~