1 .一种时序数据的压缩方法,其特征在于,包括:
将待压缩的时序数据中的每个时间序列,按照预设时长划分为多个片段;
对每个所述片段进行参数化分解,得到每个所述片段对应的参数值;
根据不同所述片段对应的参数值之间的相似性,对不同所述片段对应的参数值进行重
新排序,生成列数据;
根据所述列数据的类型,按列对所述列数据进行压缩。
2.如权利要求1所述的时序数据的压缩方法,其特征在于,对每个所述片段进行参数化
分解,得到每个所述片段对应的参数值,包括:
采用ARIMA模型对每个所述片段进行参数化分解,得到每个所述片段对应的参数值,所
述参数值包括初始值、自回归系数多项式的系数以及滑动平均系数多项式的系数。
3 .如权利要求1所述的时序数据的压缩方法,其特征在于,根据不同所述片段对应的参
数值之间的相似性,对不同所述片段对应的参数值进行重新排序,生成列数据,包括:
针对同一对象的同一指标的不同所述片段对应的参数值,按照时间序列的生成周期,
确定不同周期内参数值具有相似性的第一时间段;
将不同周期内同一第一时间段的所述片段对应的参数值按照周期的先后顺序重新排
序,生成列数据。
4 .如权利要求3所述的时序数据的压缩方法,其特征在于,按照时间序列的生成周期,
确定不同周期内参数值具有相似性的第一时间段,包括:
计算不同周期间所述片段对应的参数值之间的曼哈顿距离;
将曼哈顿距离小于第一预设阈值且时间上连续的至少一个所述片段所在的时间段确
定为第一时间段。
5 .如权利要求3所述的时序数据的压缩方法,其特征在于,还包括:
针对同一对象的不同指标的不同所述片段对应的参数值,计算在所述第一时间段内不
同指标对应的列数据之间的重复度;
将重复度大于第二预设阈值的两个列数据调整为相邻列。
6 .如权利要求5所述的时序数据的压缩方法,其特征在于,计算在所述第一时间段内不
同指标对应的列数据之间的重复度,包括:
计算在所述第一时间段内不同指标对应的列数据之间的字节重复率,将所述字节重复
率确定为所述重复度。
7 .如权利要求1至6中任一项所述的时序数据的压缩方法,其特征在于,根据所述列数
据的类型,按列对所述列数据进行压缩,包括:
根据所述列数据的类型,采用无损的编码和基于信息熵的压缩算法按列对所述列数据
进行压缩。
8.一种时序数据的压缩装置,其特征在于,包括:
划分片段模块,用于将待压缩的时序数据中的每个时间序列,按照预设时长划分为多
个片段;
参数分解模块,用于对每个所述片段进行参数化分解,得到每个所述片段对应的参数
值;
排序模块,用于根据不同所述片段对应的参数值之间的相似性,对不同所述片段对应
权 利 要 求 书
1/2 页
2
评论