向量索引是多模数据检索的关键技术,蚂蚁集团在 2024 年 7 月开源的向量索引库 VSAG,于今日发布 ANN-Benchmarks 性能测试结果。VSAG 算法在 GIST-960
数据集上表现出色,在 ANN-Benchmarks 测试中远超其他算法排名第一。在 90% 以上的召回率区间,QPS 超此前最优算法 Glass 100%,超基线算法 hnswlib 300%。

VSAG 是一个用于相似性检索的开源向量索引库(项目地址:https://github.com/alipay/vsag)。允许用户在各种规模的向量集合中进行高效搜索,尤其是那些无法完全加载到内存中的集合。VSAG 拥有高召回率、低内存使用、高性能、易于使用和混合搜索支持五个关键特性,并且提供了 CPP 库和 Python 包,使开发者无需了解算法细节即可快速上手获得性能收益。
ANN-Benchmarks 是一种用于评估近似最近邻算法性能的工具。该工具提供了一组标准接口,通过实现接口可以测试最近邻算法在不同标准数据集上的性能和质量。同时,工具的配置系统允许为算法设置多个参数,测试过程会自动允许一系列参数找到不同召回率下的最优值。工具中的绘图前端可以将测试结果可视化为图像、LaTex 绘图和带有交互式绘图的网站。
ANN-Benchmarks 作为 GitHub 上的活跃项目,持续提供 k-NN 算法当前技术状态下的不断更新概述,帮助用户为他们的相似性检索任务选择正确的 k-NN 算法和参数。
联合 VSAG 向量索引库,OceanBase 推出向量数据库能力

OceanBase 于今日发布向量数据库能力,在发布会上,OceanBase 对向量库能力进行了现场演示,在业内标准的 ANN-Benchmarks 基准测试中,对于 GIST-960 数据集表现出色,远超其他算法。
在向量融合查询能力上,4.3.3 新增向量检索能力,支持向量数据类型和向量索引,并基于向量索引提供强大的搜索能力。用户可通过 SQL 及 Python SDK 等方式灵活调用 OceanBase 的向量检索能力,同时结合对海量数据的分布式存储能力、多模数据类型及多类型索引的支持,极大简化AI应用的技术栈,助力企业高效构建 AI 应用。
分布式图数据库 TuGraph 与 VSAG 社区展开合作

近期TuGraph团队与VSAG团队展开技术合作,在 TuGraph-DB 上集成 VSAG(即将发布在TuGraph-DB v5.0,活动详情),提供了基于 TuGraph-DB 的向量检索特性,为全文索引+图索引+向量索引的 HybridRAG 能力建设夯实了基础。
TuGraph 是蚂蚁集团与清华大学联合研发的大规模图处理系统,构建了包含图数据库、图计算引擎、图机器学习、图研发平台的完善图技术体系。支持海量多源的关联数据的实时处理,显著提升数据分析效率,支撑了蚂蚁支付、安全、社交、公益、数据治理等 300 多个场景应用,多次打破图数据库性能基准测试 LDBC-SNB 世界纪录,并跻身 IDC 中国图数据库市场领导者象限。TuGraph 作为蚂蚁首个开源 Graph RAG 框架的图存储系统,也被应用于帮助减轻大模型幻觉问题。
云原生时序数据库 GreptimeDB 与 VSAG 社区展开合作

近期, VSAG 开源社区与 Greptime 团队在向量检索领域进行技术合作,帮助 GreptimeDB 构建向量检索相关能力。参见:跨越语言边界,Greptime 与蚂蚁向量数据库合作实现向量搜索性能 5 倍新突破
Greptime 专注于为物联网、车联网及可观测领域提供高效的实时数据存储与分析服务,帮助客户挖掘数据价值。GreptimeDB 是用 Rust 编写的云原生开源时序数据库,支持指标、日志、事件的联合分析,实时洞察从边缘到云端的数据。同时也提供边云一体化方案,通过多模态边缘数据库与云端 GreptimeDB 企业版协同,降低流量、计算和存储成本,提升数据实时性和业务洞察能力。
VSAG 库使用 C++ 编写,而 GreptimeDB 则是完全基于 Rust 自研的数据库。这种跨语言的集成带来了显著的技术挑战。为了解决这一难题,Greptime 团队开发了 VSAG 的 Rust Bindings,并将其开源。这项工作不仅成功提升了 VSAG 在 Rust 生态中的兼容性和适用性,还为其他 Rust 开发者提供了直接的支持与便利,大大降低了跨语言开发的复杂性。
加入 VSAG 开源社区
VSAG 不仅是一个强大的向量搜索算法库,更是一个充满活力的开源社区。在这里,你可以:
与全球开发者交流:与志同道合的朋友分享经验,共同成长。 参与开源项目:为 VSAG 贡献代码,提升自己的技术能力。 获得技术支持:在社区中获得专业的技术解答。
参与方式
GitHub 地址:https://github.com/alipay/vsag Discord 交流地址:https://discord.com/invite/JyDmUzuhrp 关注 StorageScale 公众号,获取 VSAG 最新进展。


欢迎关注TuGraph代码仓库✨
https://github.com/tugraph-family/tugraph-db
https://github.com/tugraph-family/tugraph-analytics




