暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Timescale发布高性能AI向量数据库扩展,助力PostgreSQL

通讯员 2024-06-12
1284

2024年6月11日,PostgreSQL云数据库公司Timescale Inc.宣布发布了两款新的开源扩展插件,这些插件显著增强了PostgreSQL在从向量数据库检索数据时的可扩展性和易用性,特别是在人工智能应用领域。

图片.png

新扩展插件:pgvectorscale与pgai

新推出的扩展插件pgvectorscale和pgai,使得PostgreSQL这一开源关系型数据库能够用于向量数据检索,这对于构建AI应用和专门的上下文搜索至关重要。

向量数据库的基本原理

向量数据库允许AI开发者将数据插入到高维数组中,这些数据根据它们之间的上下文关系相互连接。与传统的关系型数据库不同,向量数据库使用上下文化的含义存储数据,其中“最近邻”可以用来连接它们,例如,猫和狗在意义上(作为家庭宠物)比猫和苹果更接近。这使得当AI执行语义数据搜索,如关键词、文档、图像和其他媒体时,查找信息的速度更快。

Timescale的视角

Timescale的AI产品负责人Avthar Sewrathan在接受SiliconANGLE采访时表示,尽管大多数数据存储在非常受欢迎的高性能向量数据库中,但并非所有服务使用的数据都存储在向量数据库中。因此,有时同一个环境中存在多个数据源。

pgvectorscale:性能与成本的平衡

pgvectorscale扩展基于已经存在的开源扩展pgvector,帮助开发者以更低的成本构建更可扩展、性能更高的AI应用搜索嵌入。Sewrathan表示,它包括两项创新:DiskANN,一种能够将其一半搜索索引卸载到磁盘的能力,这些索引通常存储在内存中,对性能影响很小,这有助于大大节省成本;以及Statistical Binary Quantization,这是标准二进制量化的改进,有助于减少内存使用。

Timescale对pgvectorscale的基准测试显示,PostgreSQL在99%的召回率下,对于近似最近邻查询,其延迟比流行的Pinecone向量数据库低28倍,查询吞吐量高出16倍。与用C语言编写的pgvector不同,pgvectorscale是用Rust编程语言编写的,这将为PostgreSQL开发者提供更多构建向量支持的机会。

pgai:简化AI应用开发

pgai扩展旨在使开发者更容易为其AI应用构建搜索和检索增强型生成,或称为RAG的解决方案。RAG通过向大型语言模型(LLMs)提供实时、最新的权威信息,结合向量数据库的优势,帮助减少幻觉的发生,即AI自信地发出虚假陈述的情况。

这项技术是构建准确可靠AI应用的基础。pgai的初始版本支持快速创建OpenAI嵌入,并且版本正在PostgreSQL内部直接构建OpenAI聊天补全,例如GPT-4o模型。

OpenAI的GPT-4o是OpenAI的最新旗舰模型,提供强大的多模态能力,包括实时语音对话和视频理解。

易于使用的桥梁

Sewrathan表示,能够在PostgreSQL中使用向量创建了一个强大的“易用性”桥梁,这对于许多开发者来说可能非常强大,因为许多企业已经依赖PostgreSQL数据库或其他关系型数据库。

“通过扩展插件在PostgreSQL中添加向量存储等能力,简化了数据架构,”Sewrathan说。“你有一个数据库。它可以在同一个地方存储多种数据类型。这是一个巨大的优势,因为否则,你将面临数据同步、数据去重以及很多复杂性。”

文章转载自通讯员,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论