暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
CN119322812A-向量数据库的倒排索引构建方法与相关产品_电科金仓.PDF
37
18页
0次
2025-02-10
免费下载
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号
(43)申请公布日
(21)申请号 202411310841 .2
(22)申请日 2024 .09 .19
(71)申请人 中电科金仓北京科技股份有限公
地址 100102 北京市朝阳区容达路7号院5
号楼13101内二层201
(72)发明人 韦丹妮 王建华 
(74)专利代理机构 北京智汇东方知识产权代理
事务所(普通合伙) 11391
专利代理师 胡向阳
(51)Int.Cl .
G06F
16/31
(2019 .01)
G06F
16/355
(2025 .01)
G06F
16/51
(2019 .01)
G06F
16/55
(2019 .01)
(54)发明名称
向量数据库的倒排索引构建方法与相关产
(57)摘要
本发明提供了一种向量数据库的倒排索引
构建方法与相关产品其中上述方法包括构建
倒排索引其至少包括对各向量进行聚类以得
到设定数量个聚类簇判断所述向量数据库中的
向量是否发生变化若是则获取构建所述倒排
索引之后的向量变化量并根据所述向量变化量
判断是否触发预设的索引更新条件以及在触发
所述索引更新条件的情况下返回所述构建倒排
索引的步骤本发明的技术方案可以自动更新向
量数据库的倒排索引并解决向量数据库由于频
繁构建倒排索引而影响数据库的可靠性的问题
权利要求书2页 说明书10页 附图5页
CN 119322812 A
2025.01.17
CN 119322812 A
1 .一种向量数据库的倒排索引构建方法其特征在于包括
构建倒排索引其至少包括对各向量进行聚类以得到设定数量个聚类簇
判断所述向量数据库中的向量是否发生变化
若是则获取构建所述倒排索引之后的向量变化量并根据所述向量变化量判断是否
触发预设的索引更新条件以及
在触发所述索引更新条件的情况下返回所述构建倒排索引的步骤
2 .根据权利要求1所述的倒排索引构建方法其特征在于
所述根据所述向量变化量判断是否触发预设的索引更新条件的步骤包括
获取构建所述倒排索引后的向量总量并计算所述向量变化量与所述向量总量的比
值;
判断所述比值是否大于或者等于设定阈值
若是则判定为触发所述索引更新条件
3 .根据权利要求2所述的倒排索引构建方法其特征在于
所述向量数据库设置有向量更新参数和/或总向量参数其中所述向量更新参数用于
记录所述向量变化量所述总向量参数用于记录所述向量总量以及
在所述构建倒排索引的步骤之后还包括对所述总向量参数进行更新/或重置所
述向量更新参数/
在所述判断所述向量数据库中的向量是否发生变化的步骤之后还包括若所述向量
数据库中的向量发生变化则对所述向量更新参数进行更新
4 .根据权利要求1所述的倒排索引构建方法其特征在于
所述对各向量进行聚类以得到设定数量个聚类簇的步骤包括
获取设定数量个初始质心向量分别计算各所述向量与各所述初始质心向量之间的距
离,并将各所述向量分配到距离最近的初始质心向量所对应的初始聚类簇
获取各所述初始聚类簇的质心向量分别计算各所述向量与各所述质心向量之间的距
离,并将各所述向量分配到距离最近的质心向量所对应的聚类簇
5 .根据权利要求4所述的倒排索引构建方法其特征在于
所述获取设定数量个初始质心向量的步骤包括
从各所述向量中选择出一个向量存入质心向量集以及
在所述质心向量集中向量的数量小于所述设定数量的情况下
计算各所述向量与所述质心向量集中各向量之间的距离以分别得到各所述向量与所
述质心向量集中各向量之间的最小距离并将各所述向量中所述最小距离最大的向量存入
所述质心向量集
在所述质心向量集中向量的数量等于所述设定数量的情况下
将所述质心向量集中的向量作为所述初始质心向量
6 .根据权利要求4所述的倒排索引构建方法其特征在于
所述计算各所述初始聚类簇的质心向量的步骤包括
分别计算各所述初始聚类簇中各向量的平均向量并将各所述平均向量作为对应初始
聚类簇的质心向量
7 .根据权利要求1所述的倒排索引构建方法其特征在于
权 利 要 求 书
1/2
2
CN 119322812 A
2
of 18
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜