1 .一种数据检索的方法,其特征在于,数据库中保存N个数据,将所述数据库中的N个数
据划分为第一类数据和第二类数据,N≥2,所述方法包括:
在所述第一类数据中确定第一检索范围,并在所述第一检索范围中检索待检索数据,
获得第一检索结果,其中,所述第一检索范围中的数据为所述第一类数据的子集;
在所述第二类数据的全部范围中检索所述待检索数据,获得第二检索结果;
从所述第一检索结果和所述第二检索结果中确定所述待检索数据最终的检索结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
按照聚类算法将所述N个数据划分为M个簇,每个数据对应一个簇,每个簇有一个中心
点,每个数据的值与其所归属的簇的中心点具有接近的相似度,M≥2,每个簇的簇索引用于
唯一标识一个簇;其中,所述第二类数据为各个簇的边缘点的数据的集合,所述第一类数据
为所述原始数据库中除第二类数据以外的其他数据的集合。
3 .根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
按照预置算法将所述第一类数据划分为多个层,每个层中包括至少一个第一类数据,
每个第一类数据归属于一个层,每个层的层索引用于唯一标识一个层。
4 .根据权利要求3所述的方法,其特征在于,将所述N个数据划分为第一类数据和第二
类数据包括:
从所述M个簇中选择比对簇;
从所述N个数据中选择z个参考数据,1≤z≤N;
针对每个参考数据执行下述数据分类处理:
根据当前参考数据在所述数据库中检索得到待分类数据,所述待分类数据为与所述当
前参考数据相似度接近的数据;
确定所述待分类数据是否属于所述比对簇,如果是,将所述待分类数据划分至所述第
一类数据,如果否,将所述待分类数据划分至所述第二类数据。
5 .根据权利要求4所述的方法,其特征在于,在所述数据库中检索得到待分类数据,所
述待分类数据为与所述当前参考数据相似度接近的数据,包括:
计算所述当前参考数据与其它N-1个数据之间的相似度,根据计算出的相似度进行排
序,获得与所述当前参考数据相似度由高至低排序的m个数据,将所述m个数据作为所述待
分类数据,1≤m≤N-1;或者,
计算所述当前参考数据与M个簇的中心点之间的相似度,确定与所述当前参考数据相
似度由高至低排序的m个簇,将所述m个簇中的数据作为所述待分类数据,1≤m≤N-1。
6 .根据权利要求4或5所述的方法,其特征在于,还包括:
当所述z个数据中的每个数据分别作为当前参考数据完成一轮数据分类处理之后,再
次将所述z个数据的每个数据分别作为参考数据,执行下一轮数据分类处理,其中,每一轮
数据分类处理中选择的比对簇相同,下一轮数据分类处理所选择的比对簇的数量比上一轮
数据分类处理所选择的比对簇的数量多,且上一轮数据分类处理所选择的比对簇为下一轮
数据分类处理所选择的比对簇的子集,当比对簇的数量达到预先设置的最大值时,结束数
据分类处理。
7 .根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
预先设置所述第一检索范围的指示信息,所述指示信息用于指定所述第一检索范围包
权 利 要 求 书
1/3 页
2
评论