本期将分享近期全球知识图谱相关
行业动态、会议讲座、论文推荐
DeepSeek+知识图谱

LLM+知识图谱

https://sourl.cn/Bpk9FQ
2025GDC全球开发者先锋大会将以“模塑全球 无限可能”为主题,将于2月21日至23日在徐汇西岸召开。作为科技与文化交汇的前沿阵地,本次大会定位为“社区的社区”,将为科技界带来无限场景、产业活力与创新灵感。大会将发布多项重要成果,用崭新的姿态和面貌迎接更广泛的开发者们。大会将构建“1+1+N+X”的内容架构体系,即“1场开幕式+1场顶尖青年开发者交流会+N场企业讲坛+X场开发者活动”,开展互动体验、工作坊、开放麦、Demo Day、AIGC赛事等活动。

本周推荐的是SIGMOD 2023上的论文:Learned Data-aware Image Representations of Line Charts for Similarity Search,该文研究了线形图的相似度查询问题。作者来自清华大学和香港科技大学。

找到与给定线形图像查询相似的线形图像是数据探索和图像查询系统中的一项常见任务,例如在股市或医疗脑电图(EEG)图像中找到相似的趋势。现有的最先进方法要么考虑数据级相似度(当底层数据存在时),要么考虑图像级相似度(当底层数据缺失时)。
在该文中,作者研究了查询时只有线形图像可用的场景。作者的目标是训练一个神经网络,使其能够将这些线形图像转化为能够反映生成这些线形图的底层数据的表示,从而学习到更好的表示。作者的关键想法是,作者可以在训练阶段收集数据和线形图像,以学习这样的神经网络,而在查询(或推理)阶段,支持仅提供线形图像的情况。为此,作者提出了LineNet,一个基于视觉转换器的三重自编码器模型,用于学习数据感知的线形图图像表示以进行相似度搜索。作者设计了一种新颖的伪标签选择机制,以引导LineNet捕捉线形图的既包含数据感知又包含图像级相似度的特征。作者进一步提出了一种多样化的训练样本选择策略,以优化学习过程并提高性能。作者进行了定量评估和案例研究,结果表明,LineNet在搜索相似线形图像方面显著优于现有的最先进方法。
该文研究问题的应用场景例子如下:

LineNet的总体架构如下图所示:

该文源代码、数据和其他材料已在https://github.com/Thanksyy/LineNet-and-LineBench-SIGMOD2023上提供,感兴趣的读者可以关注。
更多链接
内容:袁知秋、程湘婷、王图图

诚邀您加入我们的gStore社区,我们将在群内解决使用问题,分享最新成果~
请在微信公众号图谱学苑发送“社区”入群~

微信社区群:请回复“社区”获取




