1 .一种分布式数据库的数据编码方法,其特征在于,所述方法包括:
获取待编码的流数据,所述流数据包括多个数据ID;
获取与所述流数据对应的至少一个编码区间,所述编码区间是根据多个所述数据ID的
分布情况划分的;
针对每个所述编码区间,基于所述编码区间确定多个编码ID;
根据每个所述编码区间的多个所述编码ID,分别对位于各所述编码区间内的所述数据
ID进行位图编码,得到编码数据。
2.根据权利要求1所述的方法,其特征在于,根据每个所述编码区间的多个所述编码
ID,分别对位于各所述编码区间内的所述数据ID进行位图编码,包括:
针对每个所述编码区间,确定所述编码区间内所述数据ID的分布密度;
若所述分布密度满足预设条件,确定每个编码区间中各所述编码ID的数据ID匹配情
况;
根据所述数据ID匹配情况对位于所述编码区间内的各所述数据ID进行位图编码,得到
编码数据。
3 .根据权利要求2所述的方法,其特征在于,根据所述数据ID匹配情况对位于所述编码
区间内的各所述数据ID进行位图编码,得到编码数据,包括:
针对每个编码ID,确定所述编码ID是否存在与之匹配的数据ID;
若所述编码ID存在与之匹配的数据ID,将与所述编码ID对应的编码值设置为第一编码
值;
若所述编码ID不存在与之匹配的数据ID,与所述编码ID对应的编码值设置为第二编码
值;
基于多个所述编码ID对应的编码值确定所述编码数据。
4 .根据权利要求3所述的方法,其特征在于,基于多个所述编码ID对应的编码值确定所
述编码数据,包括:
将每个所述编码ID对应的编码值存储在编码数组中,以作为所述编码数据;
将所述数据ID存入预设映射表中。
5 .根据权利要求2所述的方法,其特征在于,根据所述数据ID匹配情况对位于所述编码
区间内的各所述数据ID进行位图编码,得到编码数据,包括:
若所述分布密度不满足预设条件,获取位于所述编码区间内的数据ID的ID数量;
若所述ID数量小于预设阈值,将位于所述编码区间内的数据ID分别确定为编码值,得
到所述编码数据。
6 .根据权利要求2所述的方法,其特征在于,根据所述数据ID匹配情况对位于所述编码
区间内的各所述数据ID进行位图编码,得到编码数据,包括:
若所述分布密度不满足预设条件,确定位于所述编码区间内的数据ID的最大值和最小
值;
若所述最大值和最小值位于所述编码区间的局部子区间内,以所述最大值作为最大边
界值,以所述最小值作为最小边界值,确定新的编码区间;
基于所述新的编码区间确定多个编码ID;
根据多个所述编码ID对位于所述编码区间内的所述数据ID进行位图编码,得到编码数
权 利 要 求 书
1/2 页
2
评论