由北京大学,浙江大学,蚂蚁集团,中国人大联合发表的首篇GraphRAG综述新鲜出炉!
Graph Retrieval-Augmented Generation: A Survey

论文概述
核心内容
2.1 GraphRAG 与现有方法的比较

直接LLM:在这种方法中,用户查询直接由LLM进行回答,可能会导致回答过于笼统或缺乏专业性。 RAG:RAG通过检索相关文本信息来增强LLM的回答,可以在一定程度上缓解直接LLM回答可能存在的问题。然而,这种方法不能挖掘数据之间的关联关系。 GraphRAG:与RAG不同,GraphRAG利用图数据中明确的实体和关系表示,通过检索相关结构化信息来实现精确回答。GraphRAG方法能够更有效地捕捉和利用实体间的连接关系,从而提供更准确和全面的答案。
2.2 GraphRAG 架构

G-Indexing(基于图的索引):这是GraphRAG流程的初始阶段,目的是识别或构建一个与下游任务对齐的图数据库G,并在其上建立索引。图数据库可以来源于公开的知识图谱、图数据,或基于专有数据源(如文本或其他形式的数据)构建。索引过程包括映射节点和边的属性、建立连接节点之间的指针,以及组织数据以支持快速遍历和检索操作。 G-Retrieval(图检索):继图索引之后,图检索阶段专注于根据用户查询或输入从图数据库中提取相关信息。给定一个用自然语言表达的用户查询,检索阶段的目标是从知识图谱中提取最相关的元素(例如实体、三元组、路径、子图)。 G-Generation(图增强的生成):图增强的生成阶段涉及基于检索到的图数据合成有意义的输出或响应。这可能包括回答用户查询、生成报告等。在这个阶段,生成器采用查询、检索到的图元素和一个可选的提示(prompt)作为输入,以生成响应。
总结
随着人工智能技术的不断进步,GraphRAG作为一种新兴的技术,其在提高语言模型的准确性和全面性方面展现出巨大的潜力。
👆 关注 AI 搜索引擎,获取更多专业技术分享 ~
文章转载自向量检索实验室,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




