本期将分享近期全球知识图谱相关
行业动态、会议课程、论文推荐
—--| 新闻动态 |--—
谷歌TensorFlow-GNN 1.0发布

https://blog.research.google/2024/02/graph-neural-networks-in-tensorflow.html
检索增强生成(RAG)是扩展大型语言模型功能最常用的技术之一。现在,微软的研究人员提出了 GraphRAG通过知识图谱来改进 RAG 的方法。

通过使用 LLM 生成的知识图,GraphRAG 极大地改进了 RAG 的“检索”部分,用更高相关性的内容填充上下文窗口,从而获得更好的答案并捕获证据来源。 微软表示,GraphRAG 已应用于社交媒体、新闻文章和工作场所生产力等场景。
人工智能和网络安全虚拟峰会
加利福尼亚州圣何塞,Trellix 宣布将于 2024 年 2 月 28 日至 29 日举行由 Amazon Web Services (AWS) 赞助的 AI 和网络安全虚拟峰会 The New Frontier in Cybersecurity:AI's Risk and Opportunity。峰会与会者将学习如何使用人工智能防御网络犯罪分子,为什么人工智能聊天机器人会带来风险,如何防止数据泄露,以及如何利用人工智能的力量来加快响应时间,提高SOC效率,并减少调查时间。

Lotan
本周推荐的是发表于VLDB 2023的论文:Lotan: Bridging the Gap between GNNs and Scalable Graph Analytics Engines,该文提出一个基于图分析系统的GNN系统Lotan,作者来自加州大学。

图神经网络(GNNs)训练的复杂性和可扩展性挑战激发了研究者社区的兴趣,他们努力构建效率更高的系统和降低成本的方案。然而,许多这样的系统基本上“重新发明”了数据库领域在可扩展图分析引擎上所做的大量工作。此外,他们经常将图数据处理的可扩展性处理与GNN训练的可扩展性处理紧密结合在一起,导致纠缠在一起的复杂问题和系统,这些问题和系统通常无法在其中一个轴上很好地扩展。
该文提出了一个基本问题:我们能在多大程度上融合现有的可扩展图分析和深度学习(DL)系统,而不是构建定制的GNN系统?对可扩展性和/或运行时间的妥协是不可避免的吗?该文提出了Lotan,用于全批量(all-batch)的GNN训练,具有解耦缩放功能,可以弥合迄今为止图分析系统和DL系统的孤岛世界。Lotan提供了一系列创新,包括将GNN训练重新想象为类似查询计划的数据流、执行计划重写、系统之间的优化数据移动、以GNN为中心的图划分方案以及第一个已知的GNN模型批处理方案。系统架构如下图所示。

该文在GraphX和PyTorch之上构建了Lotan原型。真实世界基准GNN工作负载上的实验表明,Lotan的可扩展性大大超过了最先进的定制GNN系统,而在某些情况下,其准确性时间指标通常与后者相当或仅稍有落后。该文还展示了系统优化的影响。总的来说,该工作表明,GNN确实可以从可扩展的图分析引擎中受益。Lotan新的可扩展性水平还可以支持对越来越大的图和GNN进行新的面向ML的研究。
更多链接
内容:袁知秋、唐静、王图图

诚邀您加入我们的gStore社区,我们将在群内解决使用问题,分享最新成果~
请在微信公众号图谱学苑发送“社区”入群


欢迎关注北京大学王选计算机研究所数据管理实验室微信公众号“图谱学苑“
实验室官网:https://mod.wict.pku.edu.cn/
微信社区群:请回复“社区”获取
gStore官网:http://www.gstore.cn/
GitHub:https://github.com/pkumod/gStore
Gitee:https://gitee.com/PKUMOD/gStore





