定义
实时流数据包含个体、时间、空间、状态信息。 时序数据库(Time series database)是能够处理实时流数据的数据库。
特性
- 数据不断生成,要保证实时入库,对应不同数据和查询,需要设计数据压缩算法来实现;
- 持续对生成数据进行分析,而且常需要提供多时间粒度的分析结果;
- 实时返回计算结果,分析结果用于决策时,计算时间过长,会导致结果失效;
- 对历史数据进行复杂分析,原始数据无法直接使用,需要经过系列复杂处理。
时序数据库中主要分为两类,一类构建在已有的基本数据库之上来添加功能,另一类直接对时序数据库进行存储、查询等操作。
评测标准
TS-Benchmark:基于DCGAN的数据生成模型,在经过真实数据训练后,以高吞吐量生成高质量的合成时间序列数据。 特别是,我们模拟了一个场景,其中来自风力涡轮机的大量传感器(不同类型)经常向数据中心报告感测数据。 工作负载:1.读负载,测试在时序数据库上的范围查询、聚合查询、滚动窗口查询等; 2.写负载,假设每个风力涡轮机定期(默认情况下为7秒)向TSDB报告收集的数据; 3.加载负载,将一定大小的时间序列数据批量加载到TSDB时的数据加载性能。Analytics in Motion(AIM) 评估流媒体事件的接收性能和基于计费数据的物化状态的SQL分析。
时序数据库业界代表
时序数据库业界代表包括InfluxDB、OpenTSDB等。
