本期将分享近期全球知识图谱相关
行业动态、会议课程、论文推荐

美国国家自然基金与其他五个美国政府机构合作将为值得信赖的开放知识网络创建知识图谱,通过其构建原型开放知识网络(Proto-OKN)计划。该开放知识网络是一组可公开访问的、相互关联的数据存储库和相关知识图谱,它将为广泛的社会和经济挑战提供数据驱动、基于人工智能的解决方案。

—--| 会议讲座 |--—
CNCC2023将于10月26日至28日在沈阳举行,会议期间将举办129场技术论坛,涵盖人工智能、安全、计算+、软件工程、教育、网络、芯片、云计算等30余个方向。其中,“知识图谱+语言模型”赋能通用人工智能技术论坛将于10月26日举办。语言为“形”,知识立“心”,图谱作“骨”。本次技术论坛邀请到来自产学研各界专家,共聚商讨知识图谱和大型语言模型的融合之道,共同探索通用AI的发展新路径。

2023年第五届大数据服务与智能计算国际会议(BDSIC 2023)将于2023年10月20-22日在新加坡举行。

旨在为产学研政府的研究人员、从业者和专业人士提供一个探讨大数据服务和智能计算领域研究开发、专业实践的论坛。征稿主题包括但不限于大数据基础,大数据平台和技术,大数据分析和服务,大数据应用与体验,智能计算方法与应用等。所有经同行评审并接受的论文在提交后将发表在 ACM 国际会议论文集 (ISBN: 979-8-4007-0892-3)中,并由 Ei Compendex 和 Scopus 检索。
—--| 论文推荐 |--—
本周推荐的是发表于SIGMOD 2023上的论文:LightRW: FPGA Accelerated Graph Dynamic Random Walks,该文提出一种索引以解决动态图上的历史可达性问题(historical reachability query),作者来自新加坡国立大学。

图动态随机游走(Graph
dynamic random walks, GDRWs)在图嵌入和图神经网络等领域有广泛的应用。随机游走(random walk)始于一个顶点,然后接下来每一步都随机选择一个邻居作为下一个顶点;对于当前顶点,其每条邻边有一个转移概率(transition probability),在GDRWs中,转移概率和边权有关且边权在每一步会发生变化。
FPGA支持细粒度流水线(不同的硬件单元处理不同的任务),且通过FIFOs连接硬件单元,因此通过不同硬件单元的并行执行,可以提高并行度并减少DRAM访存;此外,FPGA支持自定义访存引擎,这意味着不需要使用CPU复杂的缓存层次而可以根据需要进行定制。
GDRWs的已有方法(比如state-of-art的ThunderRW和经典的MetaPath、Node2Vec等)大都基于多核CPU,存在随机访存多和同步开销大的问题。该文提出LightRW,基于FPGA解决上述问题:1. 提出一种采样方法,可以在每个周期处理多个顶点,从而能并行处理多个阶段,并在片上完成阶段间的交流而无需访存;2. 将度数很大的顶点相关的数据(比如邻居地址)缓存在片上,并设计了一个引擎来调整访存大小(access size)以最小化无用数据访问。实验结果表明,该文提出的方法在MetaPath和Node2Vec上分别达到9.55×和9.10×的加速效果。
更多链接
内容: 崔舒媛、袁知秋、王图图

诚邀您加入我们的gStore社区,我们将在群内解决使用问题,分享最新成果~
请在微信公众号图谱学苑发送“社区”入群


欢迎关注北京大学王选计算机研究所数据管理实验室微信公众号“图谱学苑“
实验室官网:https://mod.wict.pku.edu.cn/
微信社区群:请回复“社区”获取
gStore官网:http://www.gstore.cn/
GitHub:https://github.com/pkumod/gStore
Gitee:https://gitee.com/PKUMOD/gStore





