向量数据库遇上ChatGPT，ChatGPT如何推动专业向量存储

原创通讯员 2023-05-04

1220

随着 ChatGPT 主导会话 AI 领域和快速、有用的响应投票率，以及 OpenAI 的革命性工具的开源检索插件，ChatGPT 将开始渗透到各种解决方案中，使人们和信息比以往任何时候都更加紧密。然而，这些令人兴奋的聊天解决方案需要一个强大的数据模型支持网络，该网络支持该工具具有最佳 ML 结果所需的准确性。

Zilliz的 ML 架构师 Frank Liu参加了DBTA的网络研讨会，“向量数据库已进入聊天——ChatGPT 如何推动对专业向量存储的需求”，探讨专用向量数据库如何成为成功与聊天集成的关键解决方案，以及关于自回归 LM、非结构化数据、向量和向量数据库如何交叉的解释性信息。

图片.png

Liu 阐明了非结构化数据、向量和向量数据库之间的关系；最终，非结构化数据（或任何不符合预定义数据模型的数据）的激增要求系统能够轻松地对数据进行分类和描述，以实现更简单的使用和管理。输入向量，这是 ML 中使用的数据对象的几何表示，可以指示各种属性，包括原点、方向和大小。

然后，向量数据库专门用于存储、索引和查询大量嵌入——一个低维空间，您可以将高维向量转换到其中以简化 ML 操作。

刘强调了专用向量数据库的重要性，而不是像向量搜索库这样的解决方案，因为它具有数据库功能。Liu 指出了包括高性能向量搜索、复制和故障转移功能、水平/垂直可伸缩性、自动索引以及大量向量输入的备份和恢复在内的优势，这是典型的向量搜索库无法实现的。

“一旦超过 1000 万个向量——如今许多组织都拥有如此大量的非结构化数据——你就需要一种能够轻松存储、扩展和复制这些数据的方法，”Liu 说。“你需要很多传统的数据库功能；这就是为什么专门建造如此重要的原因。”

最后，刘解释说，实现一个专用的向量数据库是一项艰巨的任务。与主要关注大规模数据管理的传统数据库不同，对于处于 AI、ML 和数据基础设施交叉点的向量数据库，还必须考虑大型计算需求。高查询负载、高插入/删除、全精度和全召回、加速器支持（GPU、FPGA）以及支持十亿级向量存储对寻求管理非结构化数据的组织构成了相当大的障碍。

自回归大型语言模型 (LLM)，例如 ChatGPT、Claude 和 Bard，已经引起了广泛的热潮，在其公开使用的短短时间内就保持了病毒式传播的一个方面。专门构建的向量数据库以及 ChatGPT 等 LLM 带来了一个严重的缺点，但会产生幻觉，或者听起来似是而非但实际上不正确的反应。利用 LLM 来驱动能够回答具有领域特异性和准确性的问题的算法可能相当难以实现；自回归 LLM 提供的小的、不正确的语义细节可能会完全毁掉它的生存能力。

Liu 认为，解决方案是通过将领域知识注入自回归 LM。领域知识的关键部分存储在向量数据库中，弥合了正确性、自回归 LM 和组织基础设施中已经存在的材料数据之间的差距。这个交叉点通过为模型提供大规模向量数据来限制幻觉的数量，提供填充空白的上下文，像 ChatGPT 这样的工具可能会自动填充不准确但似是而非的信息。

文章来源：《Vector Databases Have Entered the Chat - How ChatGPT Is Fueling the Need for Specialized Vector Storage》
https://www.dbta.com/Editorial/News-and-Features/Supporting-ChatGPT-with-Vector-Databases-for-Optimized-Efficiency-and-Accuracy-158499.aspx

zilliz

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者

向量数据库遇上ChatGPT，ChatGPT如何推动专业向量存储

评论