知识图谱的最大难题是什么?
大模型是否取代了知识图谱?
基于大模型的知识图谱能否统一?

本次会议的大规模知识存储与计算论坛由北京大学王选计算机研究所数据管理实验室2021年毕业生曾立博士出品;在读博士研究生庞悦同学分享,谢谢大家支持。

演讲提纲:
● 蚂蚁TuGraph计算引擎发展历程与建设背景。
● TuGraph计算引擎的架构设计与技术原理。
● TuGraph计算引擎的应用场景与建设规划。
听众收益:
● TuGraph图计算引擎的设计、实现和应用价值。
● 如何实现流计算、批处理、图计算一体化执行能力。
● 大规模图计算的典型应用场景与未来思考。
1. 背景:图计算的生态和文件存储
介绍GraphAr设计的背景和Motivation
2. 标准化图存储文件格式GraphAr
- 设计与特性
- 对比其他格式的优点(一些性能对比)
3. GraphAr 的应用与开源社区发展
4. GraphAr 在知识图谱下的应用前景
听众收益:
1. 了解大数据场景下图数据和知识图谱数据的存储
2. 专门用于大规模图数据和知识图谱数据的标准文件格式是什么样的?
3. 了解如何高效地提升数据湖中图查询的能力
个人介绍:庞悦本科毕业于北京大学元培学院计算机科学与技术专业,目前在北京大学王选计算机研究所数据管理实验室攻读博士学位,导师为邹磊教授。为国家自然基金会“大规模图数据管理与分析”、“大规模图的复杂性分析与高效计算”项目及与华为等公司合作多个项目的主要研究骨干,在SIGMOD、ICDE、CIKM等数据管理领域的国际高水平会议上以第一作者身份发表过论文,为开源图数据库gStore的主要开发者之一。
演讲题目:图上的高效路径查询
演讲提纲:图是一种聚焦于实体之间的关系的数据模型,通过将实体映射成节点、将关系映射成边来直接地刻画和存储关系,广泛应用于社交网络、金融和生物信息学等领域。由图上首尾相连的边构成的路径揭示了实体之间的间接关系。因此,返回满足特定约束条件的路径或其端点的路径查询是许多应用场景中的核心查询形式。真实图的动态性和对路径可施加的丰富约束条件给高效的路径查询带来了挑战。在本次演讲中,我将介绍几种受其他图问题和关系型查询优化的启发而设计的路径查询优化技术,包括一种基于社区检测的高效可达性查询算法、一种用于正则路径查询的物化视图选择算法和基于视图的查询计划选择框架。此外,我还将讨论未来在图数据库系统的查询执行流程中整合高效路径算法的机遇。




