
LDBC(Linked Data Benchmark Council)是图数据管理领域的国际权威组织,是国际上最活跃和集中的图技术社区,LDBC 的成员包括蚂蚁集团、Oracle、Neo4j、TigerGraph、Alibaba、创邻科技等全球图计算领域的代表公司和组织,致力于推动图计算产业的发展。LDBC下设若干工作组,主要负责定义和发布Benchmark、参与ISO GQL工作组的GQL制定与迭代工作。LDBC FinBench是由蚂蚁集团主导、联合国内外厂商共同建设的面向金融场景的Benchmark。
会议议程
首届TUC Meeting于2012年举办,TUC每年举办一到两次,今年已经是第18届。本次TUC Meeting由蚂蚁集团TuGraph团队、阿里巴巴GraphScope团队和创邻科技GalaxyBase团队联合主办,TuGraph团队成员戚仕鹏担任Chair。这是LDBC第一次来到亚洲举办TUC Meeting,来自全球的图领域的专家和标准机构代表相聚广州,围绕图技术领域最新的技术趋势和标准展开分享。除了国内外的图厂商和学者以外,LDBC主席、ACM Fellow、荷兰国家数学与计算机科学研究中心Peter Boncz教授1、副主席Alastair Green2也亲临现场。
本次TUC Meeting的主要议程覆盖GQL与SQL/PGQ、GraphRAG、RDF和LPG图模型的融合、LDBC各工作组的汇报等。
会议亮点
本次议程充分体现了当前图技术领域的发展趋势和技术热点。
2024年4月份,GQL(Graph Query Language)由国际标准组织ISO发布(推荐阅读),这是继SQL发布之后ISO发布的第二个数据库查询语言标准。第一天议程中的GQL Session有ISO GQL工作组召集人Keith对GQL第一版本的介绍和展望,有来自产业界的GQL和SQL/PGQ的实践,以及多位专家基于ISO GQL展开的圆桌讨论。
近些年随着大模型技术的兴起,图技术也在大模型技术浪潮中扮演了重要的角色,以图为基础的GraphRAG技术可以帮助解决大模型的领域知识问题(推荐阅读)。在第二天议程中的GraphRAG Session中,来自产业界的各位专家分别介绍了各自在GraphRAG方面的实践。
除了GQL图查询语言和GraphRAG图技术助力大模型以外,AWS的Neptune团队也分享了他们在RDF模型和LPG属性图模型融合方向做的一些探索。

TuGraph精彩演讲回顾
ISO GQL Panel(圆桌讨论)

在GQL Session的圆桌讨论环节,由LDBC副主席Alastair Green主持,圆桌讨论嘉宾包括ACM Fellow、LDBC主席、荷兰国家数学与计算机科学研究中心教授Peter Boncz,蚂蚁图计算产品影响力负责人林恒,TigerGraph高级副总裁Mingxi Wu,NebulaGraph高级技术专家程训焘。讨论内容包括从其他查询语言迁移到GQL过程中的问题与节奏、GQL以及SQL/PGQ的内容生态、未来GQL与SQL的关系、RDF与LPG的关系。
本次圆桌讨论中,Peter分析在数据库的市场上,基于SQL的关系型数据库仍然是绝对的主流,Oracle已经开始支持SQL/PGQ,但微软的SQL Server和Postgres尚未支持,无论是GQL还是SQL/PGQ都处于非常早期的阶段,也在迅速发展的阶段。林恒表示TuGraph在蚂蚁的生产实践中已有50多万核的部署,大幅增强了支付宝的反洗钱、反欺诈的风控能力,GQL作为查询语言在表达能力和性能上均受到了巨大的挑战,包括针对用户延迟容忍度的在线、近线、离线问题的图表示方法,GQL的输出其实是表而不是图等问题。Mingxi基于TigerGraph在北美、欧洲等地的应用实践,从用户需求角度指出基于预定义图特征的实时状态维护(流式能力),是目前GQL标准中最为欠缺的能力之一。包括程训焘在内的圆桌参与者,都同意RDF和属性图模型在未来很长的时间里会共存。
Panel回放:
Subgraph Retrieval Enhanced by Graph-Text Alignment

在GraphRAG Session环节,TuGraph团队成员彭泊词深入解读了发表在ECML-PKDD 2024上的论文。该论文提出了一种名为SEPTA(Subgraph REtrieval Enhanced by GraPh-Text Alignment3)的创新框架,旨在解决常识问答任务中的难题。SEPTA框架通过将知识图谱转化为子图向量数据库,并利用BFS和消息传递机制之间的相似性,采用类BFS的子图采样策略,避免信息丢失。同时,该框架还提出了一种双向对比学习方法,用于图文对齐,从而有效提升了子图检索和知识融合的效果。广泛的实验结果表明,SEPTA框架在五个公开常识问答数据集上展现出了出色的性能和鲁棒性。此外,彭泊词还简要介绍了蚂蚁集团联合北京大学、浙江大学等高校联合发布的全球第一篇GraphRAG综述:Graph Retrieval-Augmented Generation: A Survey4。
演讲回放:
LDBC Financial Benchmark

此外,TuGraph团队成员、LDBC FinBench Working Group Lead戚仕鹏还介绍了LDBC FinBench的最新进展,当前工作组成员在合力优化测试套件以支持更大规模的测试数据集生成,并基于FinBench的已有工作撰写相关论文。他还举例说明了FinBench场景中的覆盖查询语言、存储等方面的Chokepoints,并介绍了基于这些层面展开的研究合作成果。现场相关领域的学者们针对LDBC FinBench具有的时序图特征进行了热烈讨论。
演讲回放:
总结
本次TUC是LDBC首次来到亚洲/中国举办,各位学者专家齐聚广州展开交流,现场干货满满热闹非凡。我们很高兴地看到图技术随着大模型技术的兴起也越来越受到关注,国内的图社区也越来越成熟繁荣。
TuGraph团队一直秉持开放合作、协同共赢的理念,携手其他友商伙伴共建图技术生态,让图技术更好地服务业务,带来一些微小美好的改变。
关于本次TUC中亮点演讲的详细内容,我们将在后续文章中陆续发布。敬请期待!欢迎大家多多关注~
注释:
1. https://homepages.cwi.nl/~boncz
2. https://www.linkedin.com/in/alastair-green-65a861a7?originalSubdomain=uk
3. https://pub-383410a98aef4cb686f0c7601eddd25f.r2.dev/event/eighteenth-tuc-meeting/day2/11.%20SEPTA_tuc_pbc.pdf
4. https://www.arxiv.org/pdf/2408.08921


欢迎关注TuGraph代码仓库✨
https://github.com/tugraph-family/tugraph-db
https://github.com/tugraph-family/tugraph-analytics




