点击蓝字,关注我们
5月24日举办的以“大模型开源开发生态全景与趋势”为主题的蚂蚁开源技术沙龙上,蚂蚁图计算团队戚仕鹏分享了「Graph + AI:大模型浪潮下的图计算」,以下为分享内容整理,亮点包含:
图计算在蚂蚁集团的应用分享 「AI for Graph」TuGraph 团队在大模型赋能图系统与应用的研究方向和成果介绍 「Graph for AI」TuGraph 团队在大模型时代图数据基建工作介绍 TuGraph 开源产品矩阵及社区架构介绍
一、图计算在蚂蚁集团的实践探索
图作为较高维数据结构,天然适配支付宝交易、蚂蚁森林、会员体系等具备关联关系的业务场景。通过构建图,可突破传统表模型的局限,实现深度关联分析。
应用场景案例:
1、实时查询需求:支付风控。通过分析账户关联关系,实时拦截异常交易。
2、离线分析需求:团伙挖掘。基于黑种子用户,通过社区发现算法,识别诈骗团伙。
3、流式计算需求:花呗反套现。针对多跳交易,通过流式计算系统实现跨交易链路的动态拦截(如第二笔交易触发对第一笔交易的再评估)。
4、图学习需求:芝麻信用。在芝麻信用评分中,通过构建社交、资金等网络,结合邻居特征,精准提升芝麻用户评分。
二、Graph+AI双向赋能
AI for Graph 大模型赋能的图系统与应用
1、Chat2Graph:图原生的智能体系统
TuGraph团队在4月份发布了业内首个开源图原生智能体系统Chat2Graph,旨在通过智能体技术高效解决用图问题,同时深度融合「Graph+AI」技术增强智能体的推理效果。Github 地址:https://github.com/TuGraph-family/chat2graph。
Chat2Graph架构设计:
架构:单主动-多被动的混合架构。 推理:快&慢思考结合的双LLM推理机。 规划:CoA式任务分解与图规划器。 记忆:分层记忆系统。 知识:支持 VectorRAG和 GraphRAG。 工具:利用图结构组织工具和行动。 SDK:智能体构建与服务API。 配置:一键配置智能体。 集成:支持 Neo4j 和 TuGraph图数据库。 界面:支持 RestfulAPI 和 WebUI。 可干预:支持任务的暂停和恢复。 持久化:作业状态和消息的持久化。
2、Graph Native 智能体设计
Graph Native 智能体设计的概念,其核心在于通过图结构对智能体系统的多个关键模块进行建模与优化。
1、Graph for 记忆 知识:通过图谱化方式实现知识的结构化沉淀,将专家经验以图谱形式存储,为智能体提供可复用的知识基础。
2、Graph for 工具:针对工具调用中存在的前后向依赖关系,采用图的方式进行管理,确保工具调用的逻辑连贯性与执行效率。
3、Graph for 推理 & 规划 & 协作:智能体的任务规划与协作机制本身即是一个图结构系统,通过图模型描述任务间的关联性、依赖关系及动态调整路径,实现多智能体间的高效协同。
3、能力基石:GraphRAG
GraphRAG采用图模态进行数据建模,区别于传统RAG以向量为基础的表示方法。
1、技术优势:
结构化信息抽取:通过图结构精准提取并存储文本中的结构化信息(如实体、关系、属性),相比向量表示更具精确性。 全局信息处理:基于图模型的建模能力,能够对文本中的全局信息进行总结与摘要提取,实现更完整的语义理解。
2、技术演进
0.5.6版本:完成GraphRAG的基础RAG框架开发。 6.0版本:支持Community Summary(社区摘要)。 6.1版本:实现文档分块优化,通过Chunking划分技术,建模文档中的点编结构与段落层次关系,增强信息密度与上下文关联性。 7.0版本:支持Hybrid Search(混合搜索),包含向量检索、关键词匹配、图检索等。
4、能力基石:Text2GQL
当前大模型(如LLM)的推理与交互均依赖自然语言。而关系型数据库依赖SQL(Structured Query Language)进行数据操作。图数据库依赖GQL(Gremlin Query Language)或类似语法进行图结构查询。自然语言与结构化查询语言之间存在显著差异,导致大模型无法直接高效调用底层系统。所以Text2SQL与Text2GQL优化将是未来智能体构建中很重要的一部分。
TuGraph 团队从去年就开始了 Text2GQL 的工作:
1、语料生成增强:通过传统 schema(数据结构)和其他异构数据生成训练语料。
2、训练框架优化:基于DB-GBT已有训练框架进行微调和评估测试,提升模型泛化能力。
Graph for AI 大模型时代的图数据基建
1、TuGraph-DB 图数据库( 单机 、TP、百亿 、Bolt)
2、TuGraph-Analytic 计算引擎 (分布式、AP、万亿 、流图)
3、Graph Universe:以图为数据基座的数据管理体系,解决企业数据碎片化问题。计划8月开源,欢迎大家关注。
4、miniGU:面向研究场景,相较Graph Universe更加轻量、高效易用的数据分析工具。
Graph+AI+Open Source 全方位的图智融合开源技术社区
1、蚂蚁内部的图场景应用:
支撑了蚂蚁支付、安全、搜推、社交、公益、数据治理等600多个场景应用,线上部署60多万核,构建了在/近/离线三线一致的能力
2、TuGraph 开源产品矩阵:
上层:开源图谱洞察工具OSGraph(https://osgraph.com)
中间层:包含业内首个开源图原生智能体系统Chat2Graph、DB-GPT-Hub/Text2GQL(图语言微调)、Awesome-Text2GQL(图语料生成)、DB-GPT/GraphRAG(图检索增强生成)。
底层:通过TuGraphDB(单机图数据库)、TuGraph Analytics(分布式流图引擎)、miniGU(图数据产学研平台)、GraphUniverse(统一图数据管理)全场景基建覆盖能力,提供完整的解决方案。

3、TuGraph 社区架构

TuGraph社区也会不定期举办或参加社群活动、行业会议、高校活动和竞赛活动,欢迎大家与TuGraph社区交流互动,共同探索发现图的无限可能。

·END·

欢迎关注TuGraph代码仓库✨
https://github.com/tugraph-family/tugraph-db
https://github.com/tugraph-family/tugraph-analytics




