暂无图片
暂无图片
6
暂无图片
暂无图片
暂无图片

墨天轮2023年6月时序数据库流行度排名观察

原创 代野Tank 2023-06-20
5854

当今数据库产品形态呈多元化发展,赛道逐渐细分,越来越多的应用系统需要处理大量的时间序列数据,尤其近几年随物联网、车联网、工业互联网和智慧城市等领域快速发展,时序数据库备受关注,也成为了增长趋势最快的数据库类型之一。

1.png

图:墨天轮 2023 年 5 月中国数据库行业分析报告

截至 2023 年 6 月,墨天轮中国数据库流行度排行榜的时序数据库分类(https://www.modb.pro/dbRank)中已收录有 41 款产品。本文将通过数个话题,为大家介绍时序数据库的概念、发展趋势、近期榜单动态及相关时序数据库产品介绍。

目录

1. 时序数据库概述

为了高效处理和分析时间相关的数据,出现了专门针对时间序列数据的新型数据库系统——时序数据库,与传统关系型数据库有明显差异。在概述部分,我们通过几个问题,来回顾时序数据库的概念。

1.1 什么是时序数据库?

时序数据库 (Time Series Database) 是一种专为存储和查询高频产生的时间序列数据而设计的数据库系统,主要用于物联网、工业互联网建设。

与传统关系型数据库不同,时序数据库专注于高效地存储和检索大规模的时间序列数据,如传感器数据、日志数据、监控数据等。它采用了优化的数据结构和查询算法,提供了更快速的数据写入和读取能力。

1.2 时序数据库的特点?

1.时间属性:数据带有时间属性(随着时间递增),其数据需要经过系列复杂处理后使用。
2.高吞吐写:可处理大规模的时间序列数据,支持快速的数据写入和读取操作。
3.精确的时间戳:对时间戳的处理非常精确,能够处理不同粒度和时区的时间数据,并提供高精度的时间戳索引。
4.可扩展性:可处理大规模时间序列数据,支持数据的水平扩展和负载均衡部署。
5.高压缩比:可将时间序列数据进行压缩,从而减少存储空间的占用。
6.多维度数据分析:可支持多种统计分析和聚合操作,如聚合计算和预测等。

目前时序数据库的主要在物联网和工业互联网领域应用较多,如果在非垂直领域来观察,比如我们常见的监控告警的使用,那么时序数据库则会触及到金融服务、车联网等各个领域当中。

时序数据库以其快速高效处理时间序列数据的能力,在众多应用领域中发挥着重要的作用,为不同行业提供了强大的时序数据存储和分析解决方案。 关于更详细的时序数据库总结,可阅读墨天轮发布的《2023年5月中国数据库行业分析报告-时序爆发,实时共振》[1]。

2. 发展趋势

综合流行度趋势、国内外市场容量以及政策支持来看,目前时序数据库发展处于上升阶段,发展潜力巨大。

2.1 关注度趋势

关于时序数据库的流行度趋势,我们可通过 DB-Engines 的数据进行参考,从 2013 年到目前编写本文的时间(2023 年 6 月),时序数据库模型的流行度处于第二位,从近期分数来看,涨势仍然非常明显。

2.png

图:DB-Engines: Ranking by database model

2.2 市场容量

市场洞察和战略商业情报提供商 IoT Analytics 在《物联网企业支出跟踪更新报告》中称,2022 年全球企业物联网总支出增长 21.5% 至 2010 亿美元,预计 2023 年全球物联网市场规模将增长 19%。
报告还预测,从 2022 年到 2027 年,全球物联网市场规模将以 19.4%的复合年增长率增长,并在 2027 年达到 4830 亿美元。其中亚太地区将在 2022 年至 2027 年期间以 22% 的复合年增长率增长,并超过世界其他地区[2]。

3.png

图:Enterprise loT market 2019-2027

IDC 曾在《全球物联网设备数据报告》中预测,2025 年全球范围内将有 416 亿台物联网连接设备,每年产生的数据量将达到 79.4 ZB。

随着物联网接入设备数量的不断增加,相关设备产生的数据量也在不断增长之中,以数据为驱动的物联网市场将持续扩张,市场竞争也会加剧。

2.3 政策支持

在政策层面,近几年我国工业物联网发展得到了大力支持。2021 年初,工业互联网专项工作组印发《工业互联网创新发展行动计划(2021-2023年)》[3],该计划确立了近几年我国工业互联网发展目标:到 2023 年,工业互联网新型基础设施建设量质并进,新模式、新业态大范围推广,产业综合实力显著提升。

同时提出了五方面、11 项重点行动和 10 大重点工程,着力解决工业互联网发展中的深层次难点、痛点问题,推动产业数字化,带动数字产业化。

综合国家推出的相关指导意见、推进方案及行动计划,可清晰地看到我国工业强国的战略目标。

3. 中国时序数据库榜单解读

本月,墨天轮时序数据库榜单中有 41 款产品,其中 5 款为新收录产品榜单前 10 名的阵容较上月没有发生变化,第 10 名得分约为第 11 名的 2 倍,预计 TOP 10 阵容会保持一段时间。

4.png

图:墨天轮中国数据库流行度排行(时序数据库)

TOP 1~3:分差明显

TOP 1~3 顺序同 5 月一样,分别是 TDengine、DolphinDB 和 IoTDB,三款产品分数保持着不小的分差,其中 IoTDB 分数在近半年增长明显。

TDengine
TDengine 稳居时序模型榜首,TDengine 是一款开源、云原生的时序数据库,专为物联网、工业互联网、金融、IT 运维监控等场景设计并优化。近日发布的 TDengine 3.0.5.0,进一步提升了系统稳定性,帮助用户将资源占用降到更低。
而 2022 年 9 月上线的TDengine Cloud,已支持 AWS/Google Cloud/Microsoft Azure(海外)及阿里云(国内),是一款全托管的时序数据管理云服务平台。

DolphinDB
排名第二位的 DolphinDB 是由浙江智臾科技有限公司研发的一款高性能分布式时序数据库,集成了功能强大的编程语言和高容量高速度的流数据分析系统,适用于量化金融及工业物联网等领域。
继上线 AWS Marketplace(海外区)后,DolphinDB 近日与亚马逊云科技运营方合作,在 AWS 中国上线了 DolphinDB(v1.30.21)镜像产品。

IoTDB
排名第三位的 IoTDB 是清华大学主导的 Apache 孵化项目,近半年 IoTDB 得分有明显增加。
Apache IoTDB(物联网数据库)是一体化收集、存储、管理与分析物联网时序数据的软件系统。
近日 Apache IoTDB 荣获国家网信办 2022 年中国开源创新大赛决赛一等奖,三位核心研发荣获表彰。

TOP 4~6:棋逢对手

近期 TOP 4~6 聚集的是互联网大厂产品,分别是腾讯云 CTSDB、百度 TSDB 和阿里云 TSDB,本月三款产品得分不相上下,分差均在 1 分之内。

CTSDB
第四位的 CTSDB(TencentDB for CTSDB)近几月 CTSDB 分数相对平稳,本月名次较上月前进一位。CTSDB 是腾讯云推出的一款分布式、可扩展、支持近实时数据搜索与分析的时序数据库,包含 InfluxDB 版和 CTSDB 版。
2023 年 4 月,腾讯云全新推出了兼容开源 InfluxDB 协议的高性能分布式时序数据库 InfluxDB 版。

Baidu TSDB
第五位的 Baidu TSDB 在近半年分数持续保持上涨。Baidu TSDB 是一种存储和管理时间序列数据的专业化数据库,为时间序列的存储提供高性能读写、低成本存储、强计算能力和多生态支持的多种能力。

Alibaba TSDB
第六位阿里云时间序列数据库 (Lindorm Time Series Database , 简称 TSDB) 是云原生多模数据库 Lindorm 中负责时序数据处理的专用引擎,兼容开源 OpenTSDB 标准接口。

TOP 7~10:排名波动

TOP 7~10 分别是 KaiwuDB、YMatrix、CeresDB 和 openPlant,本月四款产品得分均为 20 分出头,半年内分数增长较快的是 KaiwuDB。

KaiwuDB
KaiwuDB 是一款面向 AIoT 的分布式多模数据库,其近半年得分增加了 20 分以上,近半发布了多个方案,同时也获得了多个奖项。
2023 年 5 月,KaiwuDB “离散制造业 IIoT 标杆解决方案” 从全球多个国家和地区的 350 余项科技成果中脱颖而出,获颁 2023 数博会“优秀科技成果”奖。

YMatrix
YMatrix 是四维纵横(YMatrix)基于 PostgreSQL / Greenplum 经典系开源数据库开发的超融合数据库产品。
2023 年 4 月,YMatrix 5.0.0 GA 版本正式发布,在性能、功能、易用性及稳定性方面均实现了重大提升。

CeresDB
CeresDB 诞生于蚂蚁集团内部,是基于 OceanBase 分布式存储引擎设计的时序数据库产品,兼容 OpenTSDB 和 Prometheus 协议。
2023 年 3 月,CeresDB 1.0 经过近一年的开源研发工作正式发布,达到生产可用标准。

openPlant
近半年 openPlant 得分比较平稳,本月排名第十。openPlant 是上海麦杰科技自主研发的实时数据库系统,是一款针对海量动态数据进行采集、存储、分析和展示的数据库产品。

下面我们关注下半年来排名上升较快的产品,在半年时间上升了 10 名以上的产品共有 3 款,分别是核信实时、Uqbar 和 SyncBASE。

5.png

图:墨天轮中国数据库流行度排行(时序数据库)

核信实时
本月核信实时数据库排名第 14 位,半年时间排名上升飞快,上月仅差一步进入 TOP 10。核信实时数据库系统是中核核信(计算机所)自主研发,具有独特安全认证机制的国产基础软件,可以更快速应对变化的数据,并适用于具有时间限制的事务处理。

Uqbar
Uqbar(音译:乌克巴尔)是云和恩墨开发的一款能够同时支持关系模型和时序模型的超融合时序数据库产品,目标是能够提供物联网场景下的一站式数据处理能力。
Uqbar 排名 23 位,相比半年前排名上升了 13 位。通过今年 DTC 分享中了解,Uqbar 的第一个LTS商业版本将于今年6月30日发布,支持向量化查询,同时支持海量数据的分析和查询能力。

SyncBASE
SyncBASE是科远智慧2001年推出的具有自主知识产权的大型实时数据库产品,它可以安全、稳定地实现与现场各种控制系统的接口,并能对采集的海量数据进行实时计算、高效的数据压缩和长期的历史存储。
3 月 16 日,科远智慧在投资者互动平台表示,其自主研发的 SyncBASE 实时数据库产品已经广泛应用于流程工业信息化管控平台项目中,下一步公司将会考虑将该数据库独立成一个成熟的产品对外销售。

以上是国内部分具有代表性产品的动态和简介。虽然当前时序数据库存在较大市场空间,且国内已有优秀的代表性产品,但在工业互联网高速发展背景之下,时序数据库的技术发展和生态建设层面仍存在着一定技术挑战。

4. 技术挑战

云原生
对于时序数据库来说,云原生化是一个重要的挑战,需要将数据库设计和架构与云平台相结合,以实现弹性扩展、自动化管理和高可用性等云原生特性,充分利用云平台的优势。

可扩展性
随着数据规模和负载的增加,时序数据库需要具备良好的扩展性,以满足大规模数据处理的需求。

复杂查询
为了更好地理解和分析数据,时序数据库需要支持复杂的多维数据分析查询,例如时序数据的聚合、分组和过滤等复杂查询操作。

易用性
相比大家所熟悉的传统关系型数据库,时序数据库的学习和使用成本较高,如不同产品有自己的查询语言,存在一定的学习曲线。友好的可视化界面、易用的查询语言和友好的文档是提高时序数据库易用性的关键。

5. 未来发展

中国时序数据库在工业智能化的发展逐步被业界所重视,处于发展成熟的重要时期,热度持续攀升的同时也有更多的工作待完成。在一段时间内,生态建设将是时序数据库重点工作。

时序数据库在不断演进和创新的过程中,将继续发挥重要作用,推动物联网、实时分析和智能化等领域的发展。展望一下未来,笔者认为云原生和边缘计算的融合以及向 AIoT 的转变是未来两大发展方面。

云原生和边缘计算的融合
时序数据库将更加紧密地与云平台、容器技术和边缘设备结合,以提供云原生的时序数据库解决方案,支持在云端和边缘环境的灵活部署和协同工作,实现更加高效、智能、灵活的数据处理。

向 AIoT 的转变
在过去几年中,加入工业 AI 市场的软件供应商数量大幅增加,未来时序产品向 AIoT 的增强转变会更具有变革性。

参考资料

[1] 2023年5月中国数据库行业分析报告-时序爆发,实时共振 https://www.modb.pro/doc/107365
[2] Global IoT market size to grow 19% in 2023 https://iot-analytics.com/iot-market-size/
[3] 《工业互联网创新发展行动计划(2021-2023年)》解读 https://www.gov.cn/zhengce/2021-02/18/content_5587565.htm
[4] 数据库系统的分类和评测研究 https://www.modb.pro/edoc/723/105/557055

本文为墨天轮社区特约作者 代野Tank 原创作品,转载需联系作者或墨天轮官方。本文代表作者个人观点,欢迎大家交流、讨论。

最后修改时间:2023-06-25 12:00:40
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论