时序数据库自适应有损压缩方法、系统及介质_CN 114665884 A_CnosDB.pdf

墨天轮福利君

12页

1次

2023-09-26

免费下载

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号

(43)申请公布日

(21)申请号 202210318623.8

(22)申请日 2022.03.29

(71)申请人北京诺司时空科技有限公司

地址 100020 北京市朝阳区利泽中园106号

楼2层B202-2

申请人哈尔滨工业大学

(72)发明人王宏志　姜楠　郑博　梁栋　

叶天生　燕钰　丁小欧　

(74)专利代理机构哈尔滨华夏松花江知识产权

代理有限公司 23213

专利代理师岳昕

(51)Int.Cl.

H03M

7/30

(2006 .01)

H03M

7/40

(2006 .01)

(54)发明名称

时序数据库自适应有损压缩方法、系统及介

质

(57)摘要

时序数据库自适应有损压缩方法、系统及介

质，涉及计算机技术领域，针对现有技术中缺少

提高数据压缩比的方法的问题，本申请自适应用

户的压缩精度需求。用户可以确定压缩精度，通

过存储数据段的基和部分偏差来确保压缩在相

应的精度内。数据库的数据压缩比高，节省存储

空间。有损压缩降低精度，在保持基的同时将部

分偏差丢弃，降低存储空间。使用类似Huffman编

码的思想进行编码，进一步提升压缩比。编码方

式灵活。可以更换编码方式，Huffman编码需要整

段全解压缩才能够查询，查询效率低时可以选择

更换不同的编码方式来提升效率。

权利要求书2页说明书7页附图2页

CN 114665884 A

2022.06.24

CN 114665884 A

1 .时序数据库自适应有损压缩方法，其特征在于包括以下步骤：

步骤一：获取待压缩的时序数据，并将待压缩的时序数据划分成不同的数据块，数据块

中的数据与其他数据块中的数据不重复；

步骤二：根据精度需求，删除每个数据块中精度需求以外的数据点位；

步骤三：针对步骤二处理后的数据块，将每个数据块中相关性最小的一个数据点位作

为偏差，将其余部分作为基，利用基及偏差表示对应的数据块，若含有相同的基，则对应的

数据块共用一个基，并将重复的基删除，最后计算所有基和偏差所需的存储空间；

步骤四：令i＝i+1，执行步骤三进行迭代，若当前所需的存储空间大于上一次所需的存

储空间时，则停止迭代，并将上一次得到的基和偏差作为最终基和偏差，其中，i表示每个数

据块中相关性最小的数据点位的个数；

步骤五：将最终基和偏差进行存储。

2.根据权利要求1所述的时序数据库自适应有损压缩方法，其特征在于所述步骤五的

具体步骤为：

步骤五一：针对得到的最终基，在基字典中查找是否存在相同的基，若基字典中存在相

同的基，则记录基字典中该基的ID，若基字典中不存在相同的基，则将该基保留；

步骤五二：针对步骤五一中保留的基，遍历待压缩的时序数据，并得到保留下来的基的

使用次数；

步骤五三：将保留下来的基按使用次数从小到大进行排序，然后由长ID编码至短ID编

码的顺序对从小到大排序的基进行编码；

步骤五四：利用步骤五三中编码后的基以及对应的ID更新基字典；

步骤五五：将ID与偏差进行存储。

3 .根据权利要求1所述的时序数据库自适应有损压缩方法，其特征在于所述步骤一中

将待压缩的时序数据划分成不同的数据块的具体步骤为：

通过迭代的方式将待压缩的时序数据划分成不存在重复的数据块，误差为0 .1％。

4 .根据权利要求1所述的时序数据库自适应有损压缩方法，其特征在于所述步骤五的

具体步骤为：

针对最终基和偏差进行熵编码，并将熵编码后的数据进行存储。

5 .根据权利要求4所述的时序数据库自适应有损压缩方法，其特征在于所述熵编码为：

香农编码、哈夫曼编码或算术编码。

6 .根据权利要求5所述的时序数据库自适应有损压缩方法，其特征在于所述熵编码为

哈夫曼编码。

7 .时序数据库自适应有损压缩系统，其特征在于包括：数据获取模块、数据切割模块、

数据处理模块以及存储模块；

所述数据获取模块用于获取待压缩的时序数据；

所述数据切割模块用于将待压缩的时序数据分割成不同的数据块，数据块中的数据与

其他数据块中的数据不重复；

所述数据处理模块用于针对分割后的数据块，确定数据块中的基与偏差，具体步骤为：

将每个数据块中相关性最小的一个数据点位作为偏差，将其余部分作为基，利用基及

偏差表示对应的数据块，若含有相同的基，则对应的数据块共用一个基，并将重复的基删

权　利　要　求　书

1/2 页

CN 114665884 A

of 12

免费下载

cnosdb patent

关注

评论