暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
CN119336951A-向量数据库的近邻向量查询方法与相关产品_电科金仓.PDF
29
20页
0次
2025-02-10
免费下载
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号
(43)申请公布日
(21)申请号 202411365655 .9
(22)申请日 2024 .09 .27
(71)申请人 中电科金仓北京科技股份有限公
地址 100102 北京市朝阳区容达路7号院5
号楼13101内二层201
(72)发明人 韦丹妮 王建华 
(74)专利代理机构 北京智汇东方知识产权代理
事务所(普通合伙) 11391
专利代理师 胡向阳
(51)Int.Cl .
G06F
16/901
(2019 .01)
G06F
16/906
(2019 .01)
G06F
16/903
(2019 .01)
(54)发明名称
向量数据库的近邻向量查询方法与相关产
(57)摘要
本发明提供了一种向量数据库的近邻向量
查询方法与相关产品其中上述方法包括建立
引的步骤以及基于所述索引进行查询的步
骤,其中所述建立索引的步骤包括构建底层图
以在所述底层图设置各向量之间的邻接关系
各所述向量聚类以获取多个聚类簇并获取各所
述聚类簇的质心向量所述基于所述索引进行查
询的步骤包括在获取到查询向量后计算各所
述质心向量与所述查询向量之间的距离将与所
述查询向量之间距离最小的质心向量作为所述
底层图的入口向量以从所述底层图中查询出所
述查询向量的近邻向量本发明的技术方案可以
综合HNSW算法和IVF算法的优点在提高查询效
率的情况下提高查询结果的准确性
权利要求书2页 说明书10页 附图7页
CN 119336951 A
2025.01.21
CN 119336951 A
1 .一种向量数据库的近邻向量查询方法其特征在于包括
建立索引的步骤以及基于所述索引进行查询的步骤其中
所述建立索引的步骤包括
构建底层图以在所述底层图设置各向量之间的邻接关系
对各所述向量进行聚类以获取多个聚类簇并获取各所述聚类簇的质心向量
所述基于所述索引进行查询的步骤包括
在获取到查询向量后计算各所述质心向量与所述查询向量之间的距离
将与所述查询向量之间距离最小的质心向量作为所述底层图的入口向量以从所述底
层图中查询出所述查询向量的近邻向量
2.根据权利要求1所述的近邻向量查询方法其特征在于
所述对各所述向量聚类以获取多个聚类簇的步骤包括
获取各所述聚类簇的初始质心向量
分别计算各所述向量与各所述初始质心向量之间的距离并分别将各所述向量分配到
距离最近的初始质心向量所对应的聚类簇中
3.根据权利要求12所述的近邻向量查询方法其特征在于
所述获取各所述聚类簇的质心向量的步骤包括
采用预设代价函数计算各所述向量作为其所在聚类簇的质心向量的代价函数值
获取所述代价函数值最小的情况下各所述聚类簇的质心向量
4 .根据权利要求1所述的近邻向量查询方法其特征在于
所述构建底层图的步骤包括
获取待加入向量并按照预设加入规则将所述待加入向量加入在建图并在将所有待
加入向量加入到所述在建图后,得到所述底层图
其中所述预设加入规则包括
从所述在建图中获取与所述待加入向量距离最近的第一设定数量个目标向量
从所述在建图中获取各所述目标向量的邻居向量并根据各所述目标向量与其各自的
所述邻居向量获取所述待加入向量在所述在建图中的邻居向量
将所述待加入向量加入到所述在建图并建立所述待加入向量与对应邻居向量的邻接
关系
5.根据权利要求4所述的近邻向量查询方法其特征在于
所述根据各所述目标向量与其各自的所述邻居向量获取所述待加入向量在所述在建
图中的邻居向量的步骤包括
将各所述目标向量与其各自的所述邻居向量中与所述待加入向量距离最近的第二设
定数量个向量加入到结果队列,以初始化所述结果队列,所述结果队列用于存储所述待加
入向量在所述在建图中的邻居向量
将各所述目标向量与其各自的所述邻居向量分别存储到对应目标向量的候选元素队
列中
从所述候选元素队列中依次获取候选向量并在每次获取所述候选向量后
计算所述待加入向量与所述候选向量之间的距离以及所述结果队列中各向量与所述
候选向量之间的最大距离
权 利 要 求 书
1/2
2
CN 119336951 A
2
of 20
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜