2023年4月21日,开源数据库初创公司 Weaviate BV 宣布,它已获得由 Index Ventures 领投的 5000 万美元投资。
Battery Ventures 以及回归支持者 NEA、Cortical Ventures、Zetta Venture Partners 和 ING Ventures 也参与其中。B 轮融资使 Weaviate 的外部融资总额达到 6770 万美元。该初创公司将使用新资金雇用更多员工,并加快产品开发计划。
诸如聊天机器人之类的人工智能系统以向量的形式存储它们用来回答问题的数据。矢量是一种数学结构,可以表示文档、购买日志和许多其他类型的信息。以这种形式存储记录可以让 AI 模型更容易理解它们的含义。

总部位于阿姆斯特丹的 Weaviate 提供了一个开源数据库,专门用于存储 AI 模型的向量。该数据库也称为 Weaviate,可以存储多达数十亿个向量。此外,它使它们更易于处理。
将业务文档等原始数据转换为向量需要开发人员使用专门的算法。Weaviate 包含一个预构建的矢量化模块,有望简化任务。此外,该初创公司的数据库使具有高级要求的公司能够在必要时使用他们自己的自定义矢量化软件。
Weaviate 根据相似性对它摄取的记录进行分组。如果数据库收到两组分别讨论处理器和内存芯片的学术论文,它可以按主题将论文组织成两个单独的集合。它对其他类型的信息采用相同的方法。
据这家初创公司称,其数据库使用一种利用几何领域的方法按相似性对记录进行分组。Weaviate 存储的每个文件都表示为空间中的一个点。表示相似文件的点彼此靠近放置,而不同的数据点则相距较远。
识别两条记录是否相似的能力对于许多 AI 用例至关重要。例如,人工智能驱动的网络安全工具通过检查文件是否与已知的恶意软件链相似来确定文件是否可能是恶意的。Weaviate 表示,其平台同样可以简化数据分类,这个术语涵盖了诸如按主题组织业务文档等任务。
这家初创公司承诺简化的另一个用例是搜索。开发人员可以使用它的数据库来构建 AI 驱动的搜索应用程序,这些应用程序可以快速筛选大量信息。在某些情况下,这家初创公司承诺亚秒级查询处理时间。
数据库使记录可通过 GraphQL 应用程序编程接口访问。GraphQL 是一种允许应用程序更有效地从数据库中检索信息的技术。它可以提高性能,并降低数据错误的风险。
“Weaviate 矢量数据库被用作新兴 AI 原生生态系统的核心基础设施,”联合创始人兼首席执行官 Bob van Luijt 说,“它允许用户,从初创公司到企业,创建新一波的应用程序,从定制-为 ChatGPT 插件制作搜索和推荐系统。”
这家初创公司表示,其数据库的开源版本已被下载超过 200 万次。为了进一步扩大其安装基础,Weaviate 将使用其新筹集的资金的一部分来加速进入市场的努力。几周前,另一家拥有针对 AI 应用程序优化的开源数据库的初创公司 Chroma Inc.筹集了1600 万美元的资金。
文章来源:https://siliconangle.com/2023/04/21/weaviate-reels-50m-ai-optimized-vector-database/




