暂无图片
暂无图片
3
暂无图片
暂无图片
暂无图片

Pinecone将AI推理集成到其向量数据库中

通讯员 2024-12-04
349

图片.png

Pinecone向量数据库现在可以直接运行GenAI推理,以提升检索增强型生成(RAG)的性能。

Pinecone提供向量嵌入数据库,供AI语言模型在构建聊天机器人用户请求的响应时使用。向量嵌入是文本、图像、音频和视频对象在语义搜索中使用的多维符号表示,被大型语言模型(LLMs)和小语言模型(SMLs)所使用。该公司表示,其数据库现在包括完全托管的嵌入和重排模型,以及一种“新颖方法”的稀疏嵌入检索功能,与其现有的密集检索特性相结合。

img
Edo Liberty

Pinecone首席执行官Edo Liberty(前AWS和Yahoo研究总监)表示:“通过将内置的、完全托管的推理能力直接集成到我们的向量数据库中,以及新的检索功能,我们不仅简化了开发过程,还显著提高了AI驱动解决方案的性能和准确性。”

现在被称为平台的数据库增加了以下功能:

  • pinecone-rerank-v0专有重排模型
  • pinecone-sparse-english-v0专有稀疏嵌入模型
  • 新的稀疏向量索引类型
  • Cohere的Rerank 3.5模型集成
  • 新的安全特性,包括基于角色的访问控制(RBAC)、审计日志、客户管理的加密密钥(CMEK)和AWS PrivateLink专用端点的普遍可用性

GenAI语言模型在对向量数据库进行语义搜索时使用的密集检索,利用所有相关向量。稀疏检索是一种关键词搜索方法,其中只有特定的单词和术语被向量化,而向量嵌入中的所有其他维度被赋予零值。关键词可以被表示为稀疏向量,每个关键词对应向量空间中的一个维度。

img
Pinecone集成推理图

该公司表示,它已与Cohere合作,在Pinecone平台内原生托管Cohere Rerank 3.5,并且可以通过Pinecone API选择。它说Rerank 3.5擅长理解跨语言的复杂业务信息,使其成为全球组织在金融、医疗保健、公共部门等行业的理想选择。

Pinecone表示,其新的专有重排和嵌入模型,以及像Cohere的Rerank 3.5这样的第三方模型,为客户提供“快速、便捷的高质量检索”。这些增强功能显著简化了基于AI的应用开发。

“基于AI的应用”意味着不太可能产生幻觉或生成虚构的响应。

该公司表示,其研究表明,要从GenAI模型中获得最佳性能,需要结合三个关键组件:

  • 密集向量检索以捕捉深层语义相似性
  • 快速而精确的稀疏检索,使用专有的稀疏索引算法进行关键词和实体搜索
  • 一流的重排模型,结合密集和稀疏结果,最大化相关性

重排模型接收信息检索管道的第一个响应,并重新排序(重排)列出的条目,以确保更相关的条目排名更高,以提高检索效果。

Pinecone声称,通过在其数据库中结合稀疏检索、密集检索和重排能力,“开发者将能够创建端到端检索系统,比单独使用密集或稀疏检索提供高达48%,平均24%更好的性能。”它说:

  • pinecone-rerank-v0在Benchmarking-IR (BEIR)基准测试上,比行业领先模型提高搜索准确性高达60%,平均9%
  • pinecone-sparse-english-v0提高了基于关键词的查询性能,提供比BM25在Text Retrieval Conference (TREC) Deep Learning Tracks上高达44%,平均23%更好的归一化折扣累积增益(NDCG@10)

Pinecone通过其基础设施提供这些功能,通过单一API提供。它表示,开发者现在可以开发GenAI检索应用,“无需承担管理模型托管、集成或基础设施的负担”,“消除了担心向量或数据通过多个提供商路由的需求”。

客户可以通过AWS Marketplace访问Pinecone。

文章转载自通讯员,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论