1 .一种向量数据库的近邻向量查询方法,其特征在于,包括:
建立索引的步骤,以及基于所述索引进行查询的步骤,其中
所述建立索引的步骤包括:
构建底层图,以在所述底层图设置各向量之间的邻接关系;
对各所述向量进行聚类以获取多个聚类簇,并获取各所述聚类簇的质心向量;
所述基于所述索引进行查询的步骤包括:
在获取到查询向量后,计算各所述质心向量与所述查询向量之间的距离;
将与所述查询向量之间距离最小的质心向量作为所述底层图的入口向量,以从所述底
层图中查询出所述查询向量的近邻向量。
2.根据权利要求1所述的近邻向量查询方法,其特征在于,
所述对各所述向量聚类以获取多个聚类簇的步骤包括:
获取各所述聚类簇的初始质心向量;
分别计算各所述向量与各所述初始质心向量之间的距离,并分别将各所述向量分配到
距离最近的初始质心向量所对应的聚类簇中。
3.根据权利要求1或2所述的近邻向量查询方法,其特征在于,
所述获取各所述聚类簇的质心向量的步骤,包括:
采用预设代价函数,计算各所述向量作为其所在聚类簇的质心向量的代价函数值,以
获取所述代价函数值最小的情况下各所述聚类簇的质心向量。
4 .根据权利要求1所述的近邻向量查询方法,其特征在于,
所述构建底层图的步骤,包括:
获取待加入向量,并按照预设加入规则将所述待加入向量加入在建图,并在将所有待
加入向量加入到所述在建图后,得到所述底层图;
其中所述预设加入规则包括:
从所述在建图中获取与所述待加入向量距离最近的第一设定数量个目标向量;
从所述在建图中获取各所述目标向量的邻居向量,并根据各所述目标向量与其各自的
所述邻居向量,获取所述待加入向量在所述在建图中的邻居向量;
将所述待加入向量加入到所述在建图,并建立所述待加入向量与对应邻居向量的邻接
关系。
5.根据权利要求4所述的近邻向量查询方法,其特征在于,
所述根据各所述目标向量与其各自的所述邻居向量,获取所述待加入向量在所述在建
图中的邻居向量的步骤,包括:
将各所述目标向量与其各自的所述邻居向量中,与所述待加入向量距离最近的第二设
定数量个向量加入到结果队列,以初始化所述结果队列,所述结果队列用于存储所述待加
入向量在所述在建图中的邻居向量;
将各所述目标向量与其各自的所述邻居向量分别存储到对应目标向量的候选元素队
列中;
从所述候选元素队列中依次获取候选向量,并在每次获取所述候选向量后:
计算所述待加入向量与所述候选向量之间的距离,以及所述结果队列中各向量与所述
候选向量之间的最大距离;
权 利 要 求 书
1/2 页
2
评论