基于缓存优化HNSW算法的向量数据查询方法的专利解读

原创爱可生 2024-07-25

385

背景信息

现有技术的近似最近邻搜索算法大多是基于内存的算法，基于内存的算法意味着是在进行查询操作前需要将存储区中所有的向量数据载入进内存。随着向量数据的爆炸性增长，需要向量数据库处理的向量数据量从百万级别上升到了亿级别，在这种情况下，将存储区中所有的向量数据载入进内存变得不现实，将现有技术的基于内存的搜索算法应用于硬盘上的向量数据会带来巨大的性能损耗，对硬盘I/O带来了巨大压力。

本发明的目的在于提供一种基于缓存优化HNSW算法的向量数据查询方法，可以减少在硬盘中进行查询向量的查询计算的步骤，从而，可以减少硬盘I/O压力和性能损耗。

技术方案

将所有待查询向量形成HNSW索引图；

输入第一查询向量，从索引图的最高层开始查询与所述第一查询向量距离最近的待查询向量，以作为下一层的入口，直到查找出所述索引图的最底层入口；

将所述第一查询向量和对应的最底层入口存储在缓存区中；

输入第二查询向量，在所述缓存区中查询是否存在与所述第二查询向量相同的查询向量；

如果所述缓存区中存在与所述第二查询向量相同的查询向量，则直接查找该查询向量对应的最底层入口，作为所述第二查询向量对应的最底层入口；

如果所述缓存区中不存在与所述第二查询向量相同的查询向量，则在存储区中，从索引图的最高层开始向下查询与所述第二查询向量距离最近的待查询向量，以作为每层的入口，直到查找出所述索引图的最底层入口，同时，将所述第二查询向量和对应的最底层入口存储在所述缓存区中或者使用所述第二查询向量和对应的最底层入口替换所述缓存区中的某一查询向量和对应的最底层入口；

在存储区中，进行以所述最底层入口作为起点，查询与所述第二查询向量距离最小的k个待查询向量的操作，k为大于1的整数。

可选的，在所述的基于缓存优化HNSW算法的向量数据查询方法中，所述缓存区中存储的查询向量的数量小于设定值时，将所述第二查询向量和对应的最底层入口存储在所述缓存区中。

可选的，在所述的基于缓存优化HNSW算法的向量数据查询方法中，所述缓存区中存储的查询向量的数量大于或等于设定值时，使用所述第二查询向量和对应的最底层入口替换所述缓存区中的未被访问时间最长的查询向量和对应的最底层入口。

#TensorDB

tensordb

最后修改时间：2024-07-25 14:49:26

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者

文章被以下合辑收录

TensorDB（共28篇）

TensorDB® 是上海爱可生信息技术股份有限公司研发的向量数据库企业版软件。该产品实现了亿级规模向量数据的高效组织，还利用 CPU/GPU 等异构计算平台资源优势，实现了 NVIDIA GPU 与国产 GPU（如：华为昇腾，天数智芯、海光等）的计算加速，此外，还实现了单机多卡，多机多卡的分布式任务调度，满足用户毫秒级时延要求。同时 TensorDB® 支持金融级高可用，满足用户对业务可用性的需求，TensorDB® 充分适配国产 ARM 架构、操作系统、 CPU 和 GPU 等生态环境，满足用户相关要求。TensorDB® 致力于为用户提供一站式非结构化数据的检索与处理解决方案。

基于缓存优化HNSW算法的向量数据查询方法的专利解读

背景信息

技术方案

文章被以下合辑收录

评论