1 .时序数据库自适应有损压缩方法,其特征在于包括以下步骤:
步骤一:获取待压缩的时序数据,并将待压缩的时序数据划分成不同的数据块,数据块
中的数据与其他数据块中的数据不重复;
步骤二:根据精度需求,删除每个数据块中精度需求以外的数据点位;
步骤三:针对步骤二处理后的数据块,将每个数据块中相关性最小的一个数据点位作
为偏差,将其余部分作为基,利用基及偏差表示对应的数据块,若含有相同的基,则对应的
数据块共用一个基,并将重复的基删除,最后计算所有基和偏差所需的存储空间;
步骤四:令i=i+1,执行步骤三进行迭代,若当前所需的存储空间大于上一次所需的存
储空间时,则停止迭代,并将上一次得到的基和偏差作为最终基和偏差,其中,i表示每个数
据块中相关性最小的数据点位的个数;
步骤五:将最终基和偏差进行存储。
2.根据权利要求1所述的时序数据库自适应有损压缩方法,其特征在于所述步骤五的
具体步骤为:
步骤五一:针对得到的最终基,在基字典中查找是否存在相同的基,若基字典中存在相
同的基,则记录基字典中该基的ID,若基字典中不存在相同的基,则将该基保留;
步骤五二:针对步骤五一中保留的基,遍历待压缩的时序数据,并得到保留下来的基的
使用次数;
步骤五三:将保留下来的基按使用次数从小到大进行排序,然后由长ID编码至短ID编
码的顺序对从小到大排序的基进行编码;
步骤五四:利用步骤五三中编码后的基以及对应的ID更新基字典;
步骤五五:将ID与偏差进行存储。
3 .根据权利要求1所述的时序数据库自适应有损压缩方法,其特征在于所述步骤一中
将待压缩的时序数据划分成不同的数据块的具体步骤为:
通过迭代的方式将待压缩的时序数据划分成不存在重复的数据块,误差为0 .1%。
4 .根据权利要求1所述的时序数据库自适应有损压缩方法,其特征在于所述步骤五的
具体步骤为:
针对最终基和偏差进行熵编码,并将熵编码后的数据进行存储。
5 .根据权利要求4所述的时序数据库自适应有损压缩方法,其特征在于所述熵编码为:
香农编码、哈夫曼编码或算术编码。
6 .根据权利要求5所述的时序数据库自适应有损压缩方法,其特征在于所述熵编码为
哈夫曼编码。
7 .时序数据库自适应有损压缩系统,其特征在于包括:数据获取模块、数据切割模块、
数据处理模块以及存储模块;
所述数据获取模块用于获取待压缩的时序数据;
所述数据切割模块用于将待压缩的时序数据分割成不同的数据块,数据块中的数据与
其他数据块中的数据不重复;
所述数据处理模块用于针对分割后的数据块,确定数据块中的基与偏差,具体步骤为:
将每个数据块中相关性最小的一个数据点位作为偏差,将其余部分作为基,利用基及
偏差表示对应的数据块,若含有相同的基,则对应的数据块共用一个基,并将重复的基删
权 利 要 求 书
1/2 页
2
评论