1 .一种向量数据库的倒排索引构建方法,其特征在于,包括:
构建倒排索引,其至少包括:对各向量进行聚类以得到设定数量个聚类簇;
判断所述向量数据库中的向量是否发生变化;
若是,则获取构建所述倒排索引之后的向量变化量,并根据所述向量变化量判断是否
触发预设的索引更新条件;以及
在触发所述索引更新条件的情况下,返回所述构建倒排索引的步骤。
2 .根据权利要求1所述的倒排索引构建方法,其特征在于,
所述根据所述向量变化量判断是否触发预设的索引更新条件的步骤,包括:
获取构建所述倒排索引后的向量总量,并计算所述向量变化量与所述向量总量的比
值;
判断所述比值是否大于或者等于设定阈值;
若是,则判定为触发所述索引更新条件。
3 .根据权利要求2所述的倒排索引构建方法,其特征在于,
所述向量数据库设置有向量更新参数和/或总向量参数,其中所述向量更新参数用于
记录所述向量变化量,所述总向量参数用于记录所述向量总量;以及
在所述构建倒排索引的步骤之后,还包括:对所述总向量参数进行更新,和/或重置所
述向量更新参数;和/或
在所述判断所述向量数据库中的向量是否发生变化的步骤之后,还包括:若所述向量
数据库中的向量发生变化,则对所述向量更新参数进行更新。
4 .根据权利要求1所述的倒排索引构建方法,其特征在于,
所述对各向量进行聚类以得到设定数量个聚类簇的步骤,包括:
获取设定数量个初始质心向量,分别计算各所述向量与各所述初始质心向量之间的距
离,并将各所述向量分配到距离最近的初始质心向量所对应的初始聚类簇;
获取各所述初始聚类簇的质心向量,分别计算各所述向量与各所述质心向量之间的距
离,并将各所述向量分配到距离最近的质心向量所对应的聚类簇。
5 .根据权利要求4所述的倒排索引构建方法,其特征在于,
所述获取设定数量个初始质心向量的步骤,包括:
从各所述向量中选择出一个向量存入质心向量集;以及
在所述质心向量集中向量的数量小于所述设定数量的情况下:
计算各所述向量与所述质心向量集中各向量之间的距离,以分别得到各所述向量与所
述质心向量集中各向量之间的最小距离,并将各所述向量中所述最小距离最大的向量存入
所述质心向量集;
在所述质心向量集中向量的数量等于所述设定数量的情况下:
将所述质心向量集中的向量作为所述初始质心向量。
6 .根据权利要求4所述的倒排索引构建方法,其特征在于,
所述计算各所述初始聚类簇的质心向量的步骤,包括:
分别计算各所述初始聚类簇中各向量的平均向量,并将各所述平均向量作为对应初始
聚类簇的质心向量。
7 .根据权利要求1所述的倒排索引构建方法,其特征在于,
权 利 要 求 书
1/2 页
2
评论