图形数据库供应商 Neo4j 周三推出了一系列新功能,旨在帮助客户更有效地查询和分析数据,以推动实时决策。
其中包括更快的查询性能,能够在同一数据库中同时运行事务处理和分析处理,以及更改数据捕获功能,从而能够在数据更改发生时自动跟踪数据更改。
Neo4j 总部位于加利福尼亚州圣马特奥,是一家图形数据库供应商,其工具使用户能够以与传统关系数据库不同的方式连接数据点并发现数据点之间的关系。
关系数据库使数据点一次只能与另一个数据点连接,而图形数据库使数据点能够同时与多个数据点连接。因此,图数据库可以加快数据发现过程,从而加快决策速度。
其他图数据库供应商包括TigerGraph;AWS 和 Oracle 等科技巨头也提供图形数据库。
新功能
8 月下旬,Neo4j 更新了其数据库平台以包含向量搜索。
自 OpenAI 发布 ChatGPT 以来的 11 个月里,生成式 AI 势头强劲,标志着生成式 AI 和大语言模型功能的显着改进,矢量搜索变得更加重要。
生成式人工智能模型需要大量数据才能准确,包括结构化和非结构化数据。然而,非结构化数据(例如文本、音频文件和图像)需要先被赋予结构,然后才能与结构化数据结合使用。该结构以向量的形式出现,它是以前没有这种表示形式的数据的数字表示形式。
除了通过赋予非结构化数据结构来使其可用之外,向量还使用户能够找到数据中的共性,以便发现正确的数据并将其用于训练模型。
在添加矢量搜索功能两个月后,Neo4j 的最新更新重点关注供应商数据库的性能。
IT Market Strategy 负责人 Merv Adrian 表示,与此同时,性能对于图形数据库供应商至关重要。
通常,图形数据库对于某些专门查询来说速度很快,但不能为大量应用程序提供相同的查询速度。然而,根据用例的不同,关系数据库的性能不会出现同样的下降。
Adrian 说:“对于导航复杂的关系网络的查询来说,图形数据库非常有用且快速,而这些关系网络笨拙且难以使用典型的关系数据库架构进行建模和优化。” “但针对图形分析进行优化是一种特殊情况,其代价是为主导许多业务用例的更典型的分析进行优化。”
因此,图数据库供应商需要继续提高查询性能才能与关系数据库竞争,他继续说道。
Adrian 说:“图数据库要想与已经成熟并不断创新以提高性能的关系数据库竞争(有时需要数十年),它必须提高[广泛]用例的性能。” “否则,它将被视为一种利基产品,而不是通用解决方案。”
具体来说,Neo4j的更新包括以下内容:
- 跨多个 CPU 核心的不同处理类型的并行运行时,并采用称为基于碎片的并行性的技术来优化资源利用率,从而显着加快分析查询的速度。
- 新的变更数据捕获功能 (CDC) 可自动进行实时数据跟踪并通知用户数据库中存储的数据发生的更改。
- CDC 与 Neo4j 的连接器集成到流数据工具Apache Kafka和Confluence,以流式传输更改,以便可以在 Neo4j 之外的数据平台和应用程序中查看它们。
- 使用新的嵌入模型简化知识图的创建,自动发现数据之间的关系和连接。
- 新的寻路算法可自动识别图形上节点之间的序列和路径,使复杂的工作流程更加高效。
Adrian 表示,不同处理类型的并行运行时可能是最重要的新功能,因为它拓宽了 Neo4j 在图形数据库方面的潜在应用。
“Neo4j 增强的并行性消除了更一般分析的性能障碍,并使其更适合更多用例,”他说。“它代表着一种成熟,与十年前重新定义关系数据库分析效率的列式处理浪潮没有什么不同。”
此外,Adrian 还指出了对 Kafka 的新支持的重要性。
“对 Kafka 的支持有助于 Neo4j 与当今企业中已使用的主流事件处理技术保持一致,使其能够利用现有和新的用例,”他说。
与 Adrian 一样,Neo4j 的首席产品官 Sudhir Hasbe 也将不同处理的并行运行时称为对用户最有利的新功能之一。此外,他还重点介绍了变更数据捕获功能。
然而,两者都适合一个更大的整体,更好地使开发人员能够构建、维护和集成应用程序,以便 Neo4j 可以成为组织的主要数据库,他继续说道,并指出了连接器对 Apache Kafka 和 Confluence 的重要性。
“能够插入任何企业架构是我对[更新]的广泛看法,”哈斯贝说。“现在,您可以将 Neo4j 用于不同的用例,并将其集成到企业环境中......成为记录系统。”
他补充说,新功能的推动力主要来自与客户的对话。
Hasbe 指出,历史上复杂的分析和事务查询必须与用于运行分析查询的数据分开运行,这些数据从图表中提取并放入数据仓库或数据湖中,然后才能进行查询。
然而,用户希望能够在 Neo4j 中运行不同的查询类型,并且希望能够在不损失性能的情况下同时运行它们,他说。
Hasbe表示,类似地,客户来到 Neo4j 并表示他们希望收到数据变化的提醒,以便他们可以立即采取行动。

组织的数据集显示在 Neo4j 的图数据库中。
未来的计划
Hasbe 表示,随着并行工作负载、新的 CDC 功能和其他新的数据库功能现已推出,Neo4j 的路线图将集中在三个主要领域。
一是与主要云服务提供商更好的本地集成。其次是提高 Neo4j 数据库平台的可扩展性,以满足客户随着数据量和复杂性不断增加的需求。三是赋予用户更多的生成式AI能力,比如检索增强生成。
与此同时,Adrian 表示,改善对人工智能的支持不仅对 Neo4j 至关重要,对所有数据管理供应商也至关重要。
去年的大部分时间里,生成式人工智能一直是分析和数据管理领域的主导趋势,许多组织现在正在避开 ChatGPT 和 Google Bard 等公共大型语言模型 (LLM),转而开发自己的使用专有数据训练的LLM。
“与所有数据管理参与者一样,Neo4j 必须符合对人工智能支持的新兴期望,例如与法学硕士合作,”Adrian 说。“我预计其中许多将在 2024 年发生。”
文章作者:Eric Avidon
文章来源:https://www.techtarget.com/searchdatamanagement/news/366557115/Neo4j-updates-graph-database-to-improve-performance-speed




