2024年7月30日,AI 原生向量数据库初创公司 Weaviate B.V. 推出一个新的“工作台”来扩展到人工智能开发领域,该工作台由面向开发人员的各种基于云的应用程序和工具组成,以及灵活的分层存储产品。

该公司表示,它受到充满活力的开发人员社区的启发,推出了自己的工具套件,这些开发人员已经开始依赖其开源数据库来存储数十亿个用于AI模型的基本“向量”。这些新工具旨在帮助开发人员加速 AI 原生应用程序开发,而其现成的应用程序则类似于常见 AI 用例的白标版本。
Weaviate 上一次成为头条新闻是在 2023 年 4 月,当时它筹集了 5000 万美元的资金,它是面向 AI 开发的开源向量数据库的创建者。它的数据库满足了对非结构化数据的需求,这对于为 ChatGPT 等生成式 AI 模型提供动力至关重要。
它将这些非结构化信息存储为向量,向量是表示从文档到购买日志,再到图像和音频文件的所有内容的数学结构。通过将数据存储为向量,AI 模型更容易理解和处理它。
这家初创公司表示,其数据库根据其相似性对其存储的记录进行分组。如果数据库收到两组分别讨论处理器和内存芯片的学术论文,它可以按主题将它们组织到两个单独的集合中。
据这家初创公司称,其数据库使用一种借鉴几何学领域的方法,按相似性对记录进行分组。每个文件都表示为空间中的一个点,代表相似文件的那些文件彼此靠近放置,而不同的数据点则放置得更远。
此功能对于许多 AI 应用程序至关重要。例如,基于 AI 的网络安全工具可以通过将新文件与已知的恶意软件类型进行比较来检查新文件是否为恶意文件。它还可以帮助执行搜索和数据分类任务。
Weaviate表示,其新的AI工作台现已在Weaviate云控制台中提供,其中包括一个查询工具,用于使用GraphQL接口查询其云中的数据,以及一个用于创建和管理集合的集合工具,而无需编写任何代码。此外,还有一个新的资源管理器工具,开发人员可以使用该工具通过图形用户界面搜索和验证对象数据。
第一个应用程序是 Weaviate Recommender 应用程序,开发人员可以使用它来快速构建和扩展定制的推荐系统。该公司表示,它为项目到项目、项目到用户和用户到用户推荐场景提供可配置的端点,支持图像、文本、音频和其他多模态数据类型。
除了工作台外,Weaviate还创建了一个专门的“实验室”部门,专注于测试“大胆的想法”,并将其转化为新产品,与其旗舰向量数据库一起提供。Weaviate Labs团队目前正在开发一种新的应用程序,使开发人员能够快速部署生产就绪的“生成反馈循环”,这有助于提高AI代理的智能。
这家初创公司表示,Weaviate的新分层存储产品对于AI开发人员来说可能更加有趣,使利用其数据库的应用程序能够针对速度、成本和性能进行优化。使用该服务,开发人员可以选择“热”存储(用于实时高性能读/写数据访问)、“热”存储(用于更均衡地访问不常用的数据)和“冷”(提供最具成本效益的长期数据存储,这些数据存储不经常访问)。
这家初创公司认为这种灵活性对开发人员来说很重要。例如,与收入密切相关的低延迟 AI 应用程序(例如电子商务搜索和推荐引擎)可以利用 Weviate 的热存储层来确保最佳性能,而具有更高延迟容忍度的应用程序(例如聊天机器人)可以利用冷存储来更有效地扩展。
这家初创公司声称,它是首批提供这种灵活性的专用向量数据库之一。该公司表示,其竞争对手的大多数产品都将所有数据视为“热数据”,以高价格提供快速访问。Weviate 认为,开发人员需要更大的灵活性,这样他们就可以根据它们的使用频率和产生的收入来扩展他们的 AI 应用程序。
联合创始人兼首席执行官 Bob van Luijt 表示,AI 原生堆栈需要不断发展,以便组织能够更快地构建 AI 应用程序并以更低的成本部署它们。
Van Luijt 说:“听取我们社区的意见,很明显,要采取下一步行动,开发人员需要一个具有灵活存储层的 AI 原生框架、用于与数据交互的模块化 GUI 工具,以及一系列新概念来激发他们的创造力。
原文作者:Mike Wheatley




