暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
异质信息网络分析与应用综述-石川,王睿嘉,王啸.pdf
326
24页
3次
2022-05-19
免费下载
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software, 2022,33(2):598621 [doi: 10.13328/j.cnki.jos.006357] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
异质信息网络分析与应用综述
1,2
,
王睿嘉
1,2
,
1,2
1
(北京邮电大学 计算机学院, 北京 100876)
2
(智能通信软件与多媒体北京市重点实验室, 北京 100876)
通信作者: 王啸, E-mail: xiaowang@bupt.edu.cn
: 实际系统往往由大量类型各异彼此交互的组件构成. 目前, 大多数工作将这些交互系统建模为同质信
息网络, 并未考虑不同类型对象的复杂异质交互关系, 因而造成大量信息损失. 近年来, 越来越多的研究者将这
些交互数据建模为由不同类型节点和边构成的异质信息网络, 从而利用网络中全面的结构信息和丰富的语义信息
进行更精准的知识发现. 特别是随着大数据时代的到来, 质信息网络能够自然融合异构多源数据的优势使其成
为解决大数据多样性的重要途径. 因此, 异质信息网络分析迅速成为数据挖掘研究和产业应用的热点. 对异质信
息网络分析与应用进行了全面的综述. 除了介绍异质信息网络领域的基本概念外, 重点聚焦基于异质网络元路径
的数据挖掘方法异质信息网络的表示学习技术和实际应用这 3 个方面的最新研究进展, 并对未来的发展方向进
行了展望.
关键词: 异质信息网络; 元路径; 网络表示学习; 图神经网络
中图法分类号: TP393
中文引用格式: 石川, 王睿, 王啸. 异质信息网络分析与应用综述. 软件学报, 2022, 33(2): 598–621. http://www.jos.org.cn
/1000-9825/6357.ht m
英文引用格式: Shi C, Wang RJ, Wang X. Survey on Heterogeneous Information Networks Analysis and Applications. Ruan Jian
Xue Bao/Journal of Software, 2022, 33(2): 598621 (in Chinese). http://www.jos.org.cn/1000-9825/6357.htm
Survey on Heterogeneous Information Networks Analysis and Applications
SHI Chuan
1,2
, WANG Rui-Jia
1,2
, WANG Xiao
1,2
1
(School of Computer Science, Beijing University of Posts and Telecommunications , Beijing 100876, China)
2
(Beijing Key Laboratory of Int elligent Commun ication s Software and Mu ltimedi a, Beijing 100876, Ch ina)
Abstra ct : Th e real-world systems usually cont ain different types of components that intera ct with each other. Most existing work models
these interaction systems as homogeneous information networks, which does not considerthe heterogeneous interaction relationships
among objects, resulting in lots of information loss. In recent years, more researchers model these interaction data as heterogeneous
information networks (HINs) and conduct knowledge discovery based on the comprehensive structural information and rich semantic
information in HINs. Specifically, with the advent of the era of big data, HINs naturally merge heterogeneous data sources, which make it
an important way to solve the variety of big data. Therefore, heterogeneou s information network anal ysis has quickly become a hot spot in
data mining research and industrial applications. This article provides a comprehensive overview of heterogeneous information network
analysis and applications. In addition to the basic concepts in h eterogeneous information netwo rks, the focus of this article is on the latest
research progress in meta-path b ased data mining, heterogeneous information networks r epresentation learning, and practical applications
of heterogeneous information networks. In the end, this article points out th e possible di rections of future d evelopment.
Key words: heterogeneous information n etwork; meta-p ath; network r epresentation l earning; graph n eural network
现实生活中形形色色的系统, 通常由大量类型各异、彼此交互的组件构成
[1]
, 例如生物、社交和计算机系
基金项目: 国家自然科学基金(61772 082, 61702296, 61806020); 国家重点研发计划(2018YF B1402600)
收稿时间: 2020-07-02; 修改时间: 2020-09-30; 采用时间: 2021-04-17; jos 在线出版时间: 2021-05-20
石川 : 异质信息网络分析与应用综述
599
统等. 在这些系统中, 相互作用的组件可以抽象为信息网络
[2]
. 信息网络无处不在, 已经成为了现代信息基础
设施的重要组成部分. 因此, 信息网络分析引起了学术界和工业界研究者的共同关注. 为了更好地进行分析
挖掘, 大多数工作将信息网络建模成同质信息网络(homogeneous information network, 同质网络), 即网络中
仅包含相同类型的对象和链接, 例如作者合作网
[3]
和朋友圈
[4]
. 同质网络建模方法往往只抽取了实际交互
系统中的部分信息, 或者没有区分对象及其之间关系的异质性, 从而造成不可逆的信息损失. 近年来, 更多的
研究者将多类型且互连的网络化数据建模为异质信息网络(heterogeneous information network, 异质网络),
现对现实世界更完整而自然的抽象. 例如, 文献数据中包含作者、论文、会议等不同类型的对象, 这些对象间
存在多种类型的关系: 作者和论文间的撰写/被撰写关系、会议和论文间的出版/被出版关系等. 利用异质网络
建模这种类型丰富且交互复杂的数据, 可以保留更全面的语义及结构信息.
相较于同质网络, 异质网络建模带来了两方面的好处.
(1) 异质网络是融合信息的有效工具, 不仅可以自然融合不同类型的对象及其交互, 而且可以融合异构
数据源的信息. 特别地, 随着大数据时代的到来, 大数据中许多类型不同的对象互联, 将这
些交互对象建模为同质网络很困难, 但可以很自然地利用异质网络建模; 同时, 不同平台产生的异
构多源大数仅捕获了部分甚至是有偏差的特征, 异质网络也可以自然融合这些异构数据源的信
, 从而全面刻画用户特征
[5]
. 因此, 异质网络建模不仅成为解决大数据多样性的有力工具
[6]
, 而且
成为宽度学习的主要方法
[7]
;
(2) 异质网络中多类型对象和关系共存, 包含丰富的结构和语义信息, 从而为发现隐含模式提供了精准
可解释的新途径. 例如, 推荐系统的异质网络中不再只有用户和商品这两种对象, 而是包含店铺、
品牌等更全面的内容; 关系也不再只有购买, 而是含有收藏、喜爱等更精细的交互. 基于这些信息,
利用元路径
[8]
和元图
[9,10]
等语义挖掘方法, 可以产生更精细的知识发现, 如提高推荐系统的可解释
性及准确率等.
基于以上信息融合优势, 异质网络分析迅速成为数据挖掘、数据库和信息检索等领域的研究热点
[6,11]
,
量论文发表在相关领域的顶级会议和期刊上, 且全面涉及了各类基本任务, 如分类、聚类、推荐等. 随着网络
表示学习的兴起, 异质网络表示学习也迅速激发了广大研究者的兴趣, 学得的低维向量表示在加速下游任务
的同时, 也可以提升性能表现
[12,13]
. 近年来, 异质网络建模被广泛应用到实际系统中, 如电子商务
[14]
和网络
安全
[15]
, 同样取得了显著的效果. 与此同时, 相关研究者举办了一些异质网络研讨会和讲习报告, 吸引了人
工智能从业者的广泛关注. 例如, 异质网络分析研讨会(HINA HENA) IJCAI CIKM 等会议联合举办了
多年.
本文全面总结了异质网络分析的工作, 特别是近几年来的研究新进展. 目前, 已有一些英文文献
[2,6,16, 17]
介绍了该方向的发展情况. 与现有工作相比, 本文的不同主要体现在两方面: (1) 文献[2, 16, 17] 侧重介绍作者
自身的工作, 而本文则通过系统调研已发表的 160 多篇异质网络相关论文, 总结了异质网络分析领域的总体
进展; (2) 文献[6]综述了 2017 年前异质网络的研究内容, 而本文全面涵盖了异质网络领域的最新发展和前沿
成果, 如加权元路径
[18]
、元图
[9,10]
和属性异质网络
[19]
. 特别地, 近几年, 随着网络表示学习的兴起, 本文着
重介绍了异质网络表示学习的研究进展情况, 且本文是第一篇系统介绍该研究方向的中文综述论文. 此外,
基于已有成果和发展趋势, 本文还指出了该领域未来的研究方向.
本文第 1 节介绍异质网络领域的基础知识. 2 节和第 3 节分别从基于元路径的数据挖掘和异质网络表
示学习这两个方面全面介绍异质网络的发展现状. 4 节介绍异质网络在实际问题中的应用. 5 节总结全
, 并展望未来发展方向.
1 异质网络基础知识
本节将介绍异质网络的主要定义和典型结构, 并进一步指出异质网络与其他网络模型的区别与联系.
of 24
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜