暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

图数据科学搭载GPU,赋能数据科学家洞察未来

原创 蓝海大脑GPU 2023-05-15
1464
图片

图数据科学 | 知识图谱 | 图算法

高性能计算 | 图数据库 | GPU服务器


图数据科学是一门综合了图查询、图算法、图可视化,在事物、关系上进行数据科学类研究和分析的技术。传统的关系型数据库不擅长处理关系,图模型是建立在关系之上的,基于关系进行建模和预测。图可以为机器学习模型提供高度可信和精准的特征预测。 


因此数据科学家借助图数据科学可以获得更好的数据分析和预测的结果,从而获得新的洞察也见解。在欺诈检测、客户360、药品研发以及物流运输等领域得到广泛应用。   


图数据一体机具备高性能计算能力,对于处理大规模图数据集非常有优势。传统的CPU服务器对于大规模图数据集的分析和挖掘需要耗费更多的时间和计算资源,而GPU服务器则可以利用其高效的并行计算能力和显存来加速计算过程。  


为了进一步提升图数据科学应用的性能,研究人员和工程师们也不断开发出支持GPU加速的图数据分析工具和算法,能够充分利用GPU服务器的优势,以更快的速度和更高的精度处理大规模图数据集,从而实现更高效的数据分析和挖掘。


将图数据科学部署在GPU服务器上,不仅可以提高图数据处理和分析效率,还可以扩展数据分析应用领域,适用于各种需要处理大规模图数据集的科学研究和工业应用。




经作者同意,特转载其近日发表的一篇图数据科学文章。


转载:周贞云,邱均平.一门交叉学科的兴起:论图数据科学的构建[J].图书馆论坛,2023,43(4):97-108.


一门交叉学科的兴起:论图数据科学的构建*


周贞云1,2,3 邱均平1,2,3 *

1.杭州电子科技大学 中国科教评价研究院,浙江杭州 310018;

2.杭州电子科技大学 管理学院,浙江杭州 310018;

3.杭州电子科技大学 数据科学与信息计量研究院,浙江杭州 310018



摘要


图无处不在,数据无时不有,科学无所不至,图数据科学的学科构建迫在眉睫。文章从产生背景与研究现状中追溯图数据科学的产生与发展,从理论、方法和应用的视角探究图数据科学的内容体系,在此基础上阐明图数据科学的发展趋势。研究发现,从图论到图建模、从关系数据库到图数据库、从大数据到图数据、从图到知识图谱、从行业应用到技术融合的历程,见证了图数据科学的学科兴起与发展。图数据科学是探索图数据及其现实世界的现象和规律的一门新兴学科,主要由数学、计算机科学、人工智能融合而成的一门交叉学科。图数据科学荟萃了图数据库、知识图谱、大图分析为核心的学科内容,在理论、方法和应用上形成了崭新的学科体系。图数据科学具有融合化、数智化、工程化的发展趋势,成为一门独立性与系统性、创新性与驱动性、工程性与管理性相统一的综合学科。


关键词

图数据科学 交叉学科 学科构建 知识图谱 图数据库

导言


图(Graph)是一种非线性的数据结构,用顶点(V)或节点(N)来表示实体,用边(E)或线(L)来表示关系,以此描述并揭示客观事物及其特定关系,源于18世纪欧拉提出的图论(Graph Theory)。图论正是以图为研究对象的科学,成为了数学的一个重要分支。在大数据、人工智能等新技术背景下,图有了长足的发展与全新的应用,知识图谱(Knowledge Graph)、图数据库(Graph Database)与大图分析(Big Graph Analytics)等应用日益广泛,图人工智能(Graph for Artificial Intelligence)、图机器学习(Graph for Machine Learning)与图神经网络(Graph Neural Network)等研究不断深入。


作为全球最具权威的IT研究与顾问咨询公司,美国Gartner公司研究并发现了数据与分析技术趋势;2019年,公布了“图”作为十大数据与分析技术趋势之一[1];2020年,提出“关系构成了数据和分析价值的基础”[2];2021年,再三指明“图将一切关联起来”[3]。实际上,图构成了许多现代数据和分析能力的基础,图技术(Graph Technology)成为了数据与分析的重要技术。作为图技术的世界引领者Neo4j公司的联合创始人,Emil Eifrem早在2015年就曾断言:“数据,应该出现在创新的层面......图和图数据库彻底颠覆了这一切......图无处不在,它们正吞噬着世界,其趋势已无法逆转。[4]”当前,基于图模型的数据与基于图分析的技术,已成为一个新兴的研究领域。图数据与图技术得以越来越多的研究与应用,由此催生了一门新的科学——图数据科学(Graph Data Science),或称图数据学(Graph-data-ology)。如同图论一样,图数据科学将成为一门科学,是关于图数据、图技术的科学。


目前,图数据科学或图数据学仍在形成发展中,尚未被国内外所公认。我国科学学先驱者赵红州、蒋国华主张,在科学交叉处探索科学,大科学小科学刚柔并进,大科学小搞,小科学大搞[5]。图数据科学正处在计算机科学与数学的一个新的交叉领域,或将成为一门荟聚人工智能与图论的“小科学”。科学是指长期进化而形成的客观存在的学问或知识。学科是指按照标准来划分的相对独立的学问分类或知识体系。谈及科学与学科,恰如“纲”与“目”的关系,举一纲而万目张,彼此依存且相互消长。鉴于图数据科学的兴起,现从学科视角率先探究图数据科学。文章对图数据科学的产生背景、研究现状、内容体系以及发展趋势等进行系统阐述,旨在厘清图数据科学的发展历程、试图构建图数据科学的现代内容体系、探究图数据科学的未来前景。通过研究,让图数据科学赋有交叉学科的价值、赋予新兴学科的内涵。


图数据科学的产生与发展


科学历史证明,任何科学的新发现和突破离不开时代背景和科学环境[6]。图数据科学的兴起,有其产生的时代背景和研究的科学环境。因此,现从产生背景与研究现状两个方面来阐述图数据科学的孕育而生及方兴未艾。


一、图数据科学的产生背景


图数据科学的科学产生,有其理论起源、技术变革、数据演进、工程应用以及业界推动,经历了从图论到图建模、从关系数据库到图数据库、从大数据到图数据、从图到知识图谱、从行业应用到技术融合的重要发展。


1、图数据科学的理论起源:从图论到图建模

图数据科学首先得益于图论的发展及其应用。图论的历史可以追溯到1736年,起源于哥尼斯堡七桥问题。1738年,瑞士数学家莱昂哈德·欧拉把这个谜题进行了抽象,并基于节点和关系创建了适用于任何连通系统的通用规则。图论由此诞生并不断发展,成为数学的一个重要分支[7]。人们常利用点和线构建图模型,使用这种结构模型来描述事物之间的关系。图建模是创建图模型的一个过程[8],用来解决复杂系统中的科学问题,特别是在自然科学、工程技术、经济管理等领域中应用。实际上,图论并不陌生,成为图数据科学的理论基础;图建模使用广泛,成为图数据科学的重要开端。


2、图数据科学的技术变革:从关系数据库到图数据库

图论是一门应用性很强的学科,广泛应用于计算机科学领域。作为计算机科学的重要内容,数据库先后经历了层次数据库、网状数据库、关系数据库以及NoSQL数据库等历程。目前,NoSQL数据库发展非常迅猛,特别是键值数据库、列式数据库、文档数据库和图数据库[9]。图数据库(Graph Database)是一种将数据和关系视为同等重要的数据库,存储于图(Graph)中的节点(N)和关系(R),而不是表格(Table)或文档(Document)。相比较关系数据库和其他NoSQL数据库,图数据库拥抱数据关联,并善于处理数据之间的关系。2007 年,第一款图数据库Neo4j诞生[10],预示着图数据科学的到来。全球知名数据库排行网站DB-Engines表明,图数据库发展与应用如火如荼,成为数据库增长最快的领域之一[11]。图数据库未来可期,将引领未来数据管理技术,推动着图数据科学的形成。


3、图数据科学的数据演进:从大数据到图数据

数据之所以拥有巨大价值,是因为实现了从传统数据到浅层数据的进化,并向深度数据的演变。图数据(Graph Data)就是一种图结构数据,即采用图结构的方式来表示、存储、分析大数据。大数据是一种浅层数据,注重数据规模和数据类型。图数据是一种深度数据,强调数据质量和数据完整性。大数据时代,图将起到极大的作用,图数据将扮演重要的角色[12]。图数据是“大数据+”,不仅从非结构化数据中获得更多的价值,并从数据关联中获得更高的价值,进而实现数据资源到数据资产的价值提升。简言之,大数据到图数据的数据演进,提升了数据挖掘与分析的价值。图数据时代,具有丰富数据关联价值的图数据,具有强大数据处理能力的图引擎,有利于图数据科学的发展。


4、图数据科学的工程应用:从图到知识图谱

数据转化为知识是一种趋势,更是一项挑战。从数据到图再到知识图谱,实现了数据赋能到知识赋能的转向和跨越。图以数据为原料,以实体和关系为元素,加以标签或属性,由此构建知识图谱。知识图谱(Knowledge Graph)是一种有向标签图(Graph),成为图数据库的底层应用,通过图处理引擎支撑各行各业的高阶应用[13],包括金融风控、药物发现、社交网络,推荐系统和问答系统等应用。因此,从图到知识图谱,是数据通往知识的重要历程,是图数据管理和分析的重要开端,也是图数据库融合知识工程的重要应用,为图数据科学积累了新理论、新技术以及新应用。进一步而言,知识图谱支撑着图数据科学的工程应用。


5、图数据科学的业界推动:从行业应用到技术融合

2012年,Google率先推出知识图谱,用图理解世界实体及其关系:事物而非字符串[14]。2017年,Neo4j推出首个图数据平台,致力于帮助世界理解数据意义进而使能组织释放数据价值[15]。以Google和Neo4j为代表的业界不仅开拓了图数据科学的应用场景,同时促进了图数据科学的技术融合。知识图谱实现了知识数据化和数据知识化的过程融合,实现了知识表示和图谱分析的技术互补[16]。图数据库成为知识图谱越来越重要的存储载体,成为现代数据和分析的新型利器[17]。特别是图论、数据库、数据挖掘、知识工程和机器学习等技术不断交叉与渗透,极大推动图数据科学的发展与应用。


综上所述,图数据科学的孕育与产生,实质上是图论在计算机科学中的交叉与综合的应用过程。国内知名情报学专家王知津教授认为,学科的形成与发展,需要遵循一定的演化规律;学科的综合或融合,需要多个学科的参与和介入[18]。对照《中华人民共和国国家标准学科分类与代码(GB/T 13745-2009)》[19],数学-运筹学-图论,分别促进了“计算机科学技术-基础学科-数据结构&算法理论、计算机科学技术-人工智能-知识工程&计算机神经网络&人工智能理论、计算机科学技术-计算机软件-数据库&程序设计及其语言”等交叉应用,逐渐形成了“图结构&图算法、知识图谱&图神经网络&图人工智能、图数据库&图查询语言”等知识体系;然后通过图建模、图存储、图计算、图分析、图学习等综合应用,使图数据科学融合成为一门崭新的交叉学科。从学科分类及其知识体系来看,图数据科学是一门具有鲜明的图技术的共性特征的独立学科,以计算机科学为主导学科,以图论为介入学科。


二、图数据科学的研究现状


1、图数据科学的研究进展

近年来,与图相关研究与日俱增;图驱动数据科学、人工智能的出版物数量,从十年前的200多篇增加到2021年的6500多篇[20]。然而,图数据科学的系统研究还相对欠缺。目前,学术界主要有网络数据科学、大图数据科学、图数据科学、复杂图数据科学等新议题。


追溯到2012年5月,聚焦“网络数据科学与工程——一门新兴的交叉学科?”[21],香山科学会议第424次学术讨论会在北京召开。中国科学院大学计算机专家李国杰院士讨论了网络数据科学能不能成为一门新的交叉学科,评述了网络数据科学的研究对象、内在机制、相关机理以及各种影响;与会专家认为,网络数据科学的共性理论基础来源于理论计算机科学、统计学、数据库理论、人工智能、机器学习以及社会科学等学科领域,大数据处理技术的进步将促进数据科学的诞生和发展[21]。为了有效应对大数据挑战,大数据科学的共性理论与方向,大数据工程的研究内容与目标,这些倡议大数据背景下呼之欲出,亟待于付诸实施开展国家计划,期待不远将来成为可能。在数学上,图(Graph)称为网络(Network),图分析(Graph Analytics)又称网络分析(Network Analysis);从这个意义,图数据科学与网络数据科学是相通的。纵观10多年,图数据处理技术日益成熟,图数据科学蓬勃发展,使交叉学科成为现实。


早在2014年8月,美国人工智能协会IEEE会士、加州大学圣克鲁斯分校D3数据科学研究中心主任Lise Getoor教授在PARC论坛上提出大图数据科学[22],尝试从图数据中得出有用推理,引领着数据科学计划。图通过机器学习更具有关联性和可解释性,避免我们淹没在大数据中。数据驱动技术时代,这种大图数据分析是负责任的数据科学[23]。实际上,大图数据科学日益成为计算机科学领域的研究热点。最新研究进展集中体现在两个方面:一是大图数据查询处理与优化,包括路径查询、图模式匹配、查询语言等研究;二是大图数据挖掘与分析,包括社区发现、频繁子图挖掘、影响力最大化等研究[24]。这些大图数据管理与分析的方法技术正在推动着图数据科学的研究发展。


2019年5月,作为全球图技术倡导者和分析师,英国Mark Needham与美国Amy Hodler使用了Neo4j图数据科学库,介绍了许多图算法及其应用实例[25]。2021年,Amy Hodler与Mark Needham再次合著并出版了《Graph Data Science (GDS) For Dummies®, Neo4j Special Edition》,专注于图分析和图增强机器学习的商业应用[26]。图数据科学是利用图来获取知识并改善预测的方法,涉及图统计、图分析、图学习等研究。数据科学家越来越多地把图整合到统计、分析和机器学习的实践中。当前,图统计和图分析成为提高机器学习的重要方法,特别是图分析成为人工智能跨越到新阶段的关键技术。因此,图数据科学将成为人工智能与机器学习加速创新的秘诀[20]


2020年10月,华东师范大学王伟研究员在数据科学与工程学院学术沙龙中提出了走向复杂图数据科学时代的新见解[27]。图数据越来越加普遍,图分析越来越有价值,图数据科学已然成为一个新兴研究领域。从数据管理领域来分析,图存储、图查询、图计算、图引擎成为图数据库的研究热词。从数据分析领域来分析,图机器学习、图神经网络、图嵌入成为图数据分析的研究焦点。从数据可视化领域来分析,大数据图可视化技术[28]成为图数据可视化的研究重点。此外,图数据科学还涉及同质图与异质图、知识图谱、时空图等研究领域。聚焦图数据的获取与集成、管理与分析、计算与可视化,图数据科学的研究领域日益壮大。


2、图数据科学的学科交叉

回顾图相关的研究进展,图的兴起正在加速数据科学、人工智能等学科进化[20]。反过来,图数据科学的兴起有赖于数据科学、人工智能等学科交叉。然而,关于图数据科学作为交叉学科的话题缺少专门探究,值得深入讨论。


从理论来看,图可追溯至欧拉图及其理论,图数据库是以图论为基础的NoSQL数据库,图数据在大数据时代具有更为关键的数据价值,知识图谱是图数据管理与分析的工程应用,图分析平台日益成为各领域数据处理的业务中台[13]。这些发展历程表明图数据科学与图论、数据库、数据科学、知识工程等理论是紧密关联的。


从方法来看,图数据科学是一种科学驱动的方法,采用图查询、图统计、图算法和图机器学习在内的多学科的工作流程[26]。图查询、图算法与图可视化等方法推动着图数据科学的融合发展,图分析、数据探索、特征工程等方法使能图数据科学的交叉应用。因此,图数据科学与图论、数据库、概率论、统计学、算法、机器学习等方法密切相关。


从应用来看,图数据科学概括为四个方面:运动、影响、群体与互动、模式,采用路径、中心性、链接预测、社区检测、相似度以及自定义图算法来处理不同场景各种类型的问题[25],正如关系评价、语义推断、行为预测、知识发现等。因而,图数据科学与图论、算法、软件工程、自然语言处理、机器学习、知识工程等应用紧密结合,并与领域知识息息相关。


通过理论、方法及应用的初步探究,图数据科学涵盖了图论、概率论、统计学、数据库、算法、软件工程、机器学习、自然语言处理、知识工程等理论知识,是由数学、计算机科学、人工智能等学科相互渗透、相互结合而成的一门崭新的交叉学科。


图数据科学的内容体系构建


1985年,我国召开了首届交叉科学学术讨论会;随后,中国管理科学研究院组织编写了中国首部交叉性的学科辞典《交叉科学学科辞典》[29]。该辞典系统介绍了1040余门交叉学科,其中有的学科业已成熟,有的尚待形成,有的还存争议。每门学科具体内容不仅涉及学科起源、发展与现状,并且包括学科定义、性质、研究对象、研究内容以及研究意义。有鉴于此,现进一步探究图数据科学的概念、研究对象和研究内容等。


一、图数据科学的概念和研究对象


Amy Hodler和Mark Needham认为,图数据科学是一种从数据的关系和结构中获取知识并改善预测的方法[26]。这个定义是基于方法的视角,不是基于学科的视角。作为一门学科,图数据科学是关于图数据的科学,就是研究图数据及其现实世界的各种现象和规律的科学。图数据科学之所以成为一门学科,依赖于两个因素:一是图数据在现实世界中具有广泛性,适用于物理实体、人与自然、人类之间、人与虚拟空间等多领域,如为潜在客户提供精准内容、为病患者提供有效药物、为银行客户提供欺诈检测、为社交网络提供图数据推理等;二是图数据在研究领域中具有相通性,适用于各种各样图技术,如图建模、图存储、图遍历、图分类、图计算以及图可视化等。


正值我国处在第二次交叉学科发展的高潮期,北京大学原常务副校长王义遒教授 指出,无论什么学科,都不能自我封闭,学科交叉比交叉学科更重要;而形成交叉学科要有相对固定、共同且比较复杂的科学或技术研究对象[30]。图数据科学的研究对象是图数据及其现实世界。从狭义上讲,图数据科学的研究对象是图数据。图数据科学主要包括两个方面:一是用图数据的方法研究科学,主要包括图数据库、知识图谱、图数据分析、图数据特征工程、图嵌入和图神经网络等[31];二是用科学的方法研究图数据,主要囊括概率论、统计学、数据挖掘、数据库以及机器学习、自然语言处理等。从广义上讲,图数据科学的研究对象,不限于图数据本身,还涉及图数据相关的现实世界。在现实世界中,地理空间、社交网络、推荐平台、防诈系统等越来越广泛使用图。图将无处不在、无时不有,在现实世界中扮演着极其重要作用,在科学研究中推动着问题更佳解决。图具有强大优势和巨大价值,用图模型构造现实世界的实体与概念,用图数据理解现实世界的节点与关系,用图技术挖掘现实世界的知识与规律。因此,图数据科学不仅要揭示图数据本身的各种类型、状态、数量、属性、关系以及变化规律,并通过图数据为自然科学和社会科学揭示自然领域和社会领域的现象和规律。


为进一步诠释图数据科学,采用不同概念的组合及其维度来全面阐释。第一种方式是“图”+“数据科学”,使用图的方法研究数据科学问题,有别于数据科学的其它方法,也不止于传统图的方法,而是采用大规模图的方法。当前,图数据科学的研究,已从通用知识图谱向领域知识图谱广泛拓展与构建,在此基础上进行深入分析与应用。第二种方式是“图数据”+“科学”,运用科学的方法研究图数据问题,涉及图数据采集、图数据存储、图数据分析。图数据的获取集成、数据结构、分析算法,都是至关重要的。第三种方式是“图”+“数据”+“科学”,强调大规模图、大规模数据、大规模科学决策。大数据时代,图技术将越来越广泛应用,为数据分析提供更精准的预测效果,为科学决策提供更直观的解决方法。第四种方式是“图数据库”+“科学”,强调图数据库作为图数据科学的基础地位,关系着知识图谱的底层构建,并关系着科学研究的前端应用。这些独特的诠释,进一步阐明了图数据科学的外延与内涵。从外延来看,图数据科学与图论、数据库、知识表示等紧密联系,而与数据科学、知识工程、数据挖掘等有所异同。从内涵来看,图数据科学与图数据、图模型、图算法等息息相关,则与图数据库、知识图谱、大图分析等密切关联。


二、图数据科学的研究内容


图数据科学是探索图领域中图数据奥秘的理论、方法与应用的学科。理论是学科的基础,方法是学科的手段,应用是学科的目的[32]。图数据科学的研究内容,可以从理论、方法和应用三个维度来构建。图数据科学的理论、方法与应用相互作用、共同影响,由此形成了一门新兴学科的完备的内容体系。


1、图数据科学的理论研究

图数据科学的理论研究,可以从理论基础和基本理论两个方面[33]来具体分析。图数据科学的理论基础,是指图数据科学的外部来源及其支撑理论。图数据科学的基本理论,是指图数据科学的内在源泉及其核心理论。


从理论基础来讲,数学、计算机科学、人工智能、领域知识为图数据科学的发展与应用提供了坚实基础。一经成功运用图论、概率论和统计学等数学理论,图数据科学就真正成为一门以图数据为中心和基于图数据处理的学科。数据库、算法和软件工程等计算机科学领域的重要理论,推动着图数据科学的兴起与发展。知识表示、机器学习、自然语言处理等人工智能的学科理论,促进了图数据科学的发展与应用。在特定业务应用中,领域知识必然成为图数据科学不可或缺的理论基础。简而言之,图数据科学离不开数学的运用、计算机科学的支持、人工智能的结合以及领域知识的嵌入。


从基本理论来讲,图数据库、知识图谱、大图分析是图数据科学的核心理论。图数据库是采用图模型的NoSQL数据库,主要有两类[11]:一类是图数据库管理系统,如Neo4j、JanusGraph和TigerGraph等;一类是RDF存储,如Apache Jena - TDB、RDF4J和4store等。这些图数据库的理论正推动着图数据科学的发展。图数据库日益成为知识图谱的首选数据库,知识图谱成为图数据库最基本的领域应用。知识图谱涉及基于图的知识表示、图数据存储、知识抽取、知识融合、知识推理、知识问答、图算法与知识分析等研究[16]。知识图谱一旦成为数据基础设施,大图分析将成为现代数据与分析的基础。所谓大图(Big Graph)就是指使用图(Graph)技术来存储和表示大数据(Big Data),简言之,Big Graph = Graph + Big Data;大图分析(Big Graph Analytics)本质上是大数据中知识发现的一种重要而有效的工具[34]。对数据分析而言,大图分析是一个令人兴奋的新领域,涉及大图数据的查询处理与优化、挖掘与分析以及大图数据系统等研究[13]。图数据库、知识图谱、大图分析等重要理论,将成为图数据科学的基本理论。


2、图数据科学的方法研究

根据图数据处理的分析技术,图数据科学的方法研究可以从传统方法、现代方法和新兴方法来深入探究。图数据科学的传统方法是基于图论的预测分析方法[4],可归纳为两类,一类是图遍历或图搜索,具体算法包括广度优先搜索和深度优先搜索;另一类是路径发现,具体算法涉及最短路径、最小权重生成树和两两最短路径。这些传统方法常用于局部查询或实时查询[13],成为了图数据科学最基础的研究方法。


图数据科学的现代方法是面向应用场景的复杂分析方法,大致分三类:一类是社群发现,具体有Louvain算法和标签传播算法;一类是中心性,有佩奇排名、中介中心性、紧密度中心性以及调和中心性;一类是图挖掘,有频繁子图和数三角形。这些现代方法适用于全图分析或离线分析[13],成为了图数据科学最常用的研究方法。


图数据科学的新兴方法是融合人工智能的高阶分析方法,主要有两类:一类是图嵌入[35],具体有因子分解、随机游走、深度学习等方法;一类是图神经[36],具体有图卷积网络、图注意力网络、图自编码器、图生成网络和图时空网络等方法。这些新兴方法结合了机器学习、深度学习、神经网络等技术,适用于大图分析[22]或复杂图分析[27],成为了图数据科学最活跃的研究方法。


3、图数据科学的应用研究

图数据科学的应用研究,是利用图技术如何增强决策的科学性、提高预测的准确性、提升学习的精确性的实践研究。结合基本理论和主要方法,图数据科学的应用研究,伴随着三个演进历程[31]。第一进阶是实现从图数据库到知识图谱。图数据库是图数据科学的应用工具,知识图谱是图数据科学的应用基础。面向现代数据集成和数据结构体系,知识图谱要做两件事:一是利用图如何表示业务数据,二是利用图如何表示领域知识[37]。通过图技术进行数据和知识表示,知识图谱使工作流程现代化,使业务响应自动化,使管理决策智能化。


第二进阶是实现从图数据分析到图特征工程。构建知识图谱之后,开始进入图分析阶段。图分析基于关系和拓扑结构[26],采用图查询和图算法,以此回答特定的问题,并推断潜在的意义。图分析涉及四类任务:节点分类、链接预测、图聚类及图可视化[38]。图数据特征工程将图分析的结果应用到机器学习中,以此提升预测的准确性;同时把更有价值的新特征存储到图数据库中,以供组织后续使用。图数据分析和图特征工程成为图数据科学的高阶应用。


第三进阶是实现从图嵌入到图网络。图嵌入是高维图的低维向量表示,通常用于更高级的图特性工程。对节点进行分类、相似性计算、分布可视化时,一般采用节点嵌入;对路径进行跨图遍历时,一般采用路径嵌入;对整个图进行预测或者预测整个图结构时,一般采用图嵌入[39]。相比图嵌入,图网络通过图原生学习实现全图学习和多任务预测[31],使用更少的业务数据和更短的训练周期获得更为丰富、更具可解释性的预测结果。图嵌入和图网络是图数据科学更为高阶的重要应用,成为图数据科学未来研究的重要前沿。


时任全国人大常委会副委员长、中国科学院院长路甬祥院士认为,学科交叉是学术思想的交融、交叉思维方式的综合、系统辩证思维的体现,正是众多学科之间相互作用而交叉形成的理论体系,进而构成交叉学科[40]。对照国务院学位委员会印发的《交叉学科设置与管理办法(试行)》[41],图数据科学主要源于计算机科学(数据结构、算法理论、知识工程、计算机神经网络、人工智能理论、数据库、程序设计及其语言)与数学(图论)的学科交叉,整合了图数据库、知识图谱、大图分析以及图神经网络、图机器学习、图人工智能等主要内容,荟聚了图结构、图数据、图技术、图算法、图网络、图特征工程以及图建模、图存储、图遍历、图挖掘、图分析、图处理、图分类、图聚类、图预测、图计算、图补全、图核、图嵌入、图学习、图可视化等一系列比较新的概念、理论、方法与应用,并展示了一种关于图数据的新的认识论,构架出一类关于图技术的新的知识结构,初步形成了一个关于图数据学的新的更丰富的知识范畴,基本具备了交叉学科的各种特征。


图数据科学的发展趋势


进一步挖掘学科的理论、方法和应用,有助于揭示图数据科学的发展趋势及其学科特征。伴随学科交叉不断发展,图数据科学在理论上呈现融合化,在方法上呈现数智化,在应用上呈现工程化。在学科分化与学科融合中,图数据科学成为了一门独立且系统的学科;在传统方法与新兴技术中,图数据科学成为了一门创新和驱动的学科;在工程实践与管理决策中,图数据科学成为了一门工程与管理的学科。随着交叉学科不断成熟,图数据科学体现出各种学科特征:独立性与系统性,创新性与驱动性,工程性与管理性。


一、理论融合化:日益成为独立性与系统性的学科


图数据科学在学科分化中发展,在学科融合中壮大。一方面,数据库、知识工程、数据挖掘等学科理论不断分化。数据库是计算机科学的一个重要分支,图数据库由此进化而来[38]。知识工程是人工智能的分支学科,知识图谱由此演进而来[42]。数据挖掘是一门涉及数据库、人工智能等领域的交叉学科,大图分析由此演变而来。以图数据库、知识图谱、大图分析为核心理论的图数据科学,是由计算机科学、人工智能等学科分化而成的独立学科。


另一方面,图数据库、知识图谱、大图分析日益融合。图数据库融合了图论和数据库等学科理论,是图数据科学的应用基石。知识图谱融合了图数据库和人工智能等学科理论[16],是图数据科学的底层应用。大图分析融合了知识图谱、数据挖掘等学科理论,是图数据科学的高阶应用。以图数据库、知识图谱、大图分析为理论支撑的图数据科学,成为图数据时代基于图处理的系统学科。经过融合化的学科发展,图数据科学将成为一门关于图数据的新兴的独立的系统的学科。


二、方法数智化日益成为创新性与驱动性的学科


图数据科学在大数据领域中兴起,在人工智能领域中演进。一方面,图数据科学来源于图论,产生于大数据时代。图论是研究图的一门学科[43],以图为研究对象,孕育了图数据科学。图的结构非常复杂,涉及连通图与非连通图、循环图与非循环图、有权图与无权图、有向图与无向图、稀疏图与稠密图以及单偶图、双偶图与k偶图。大数据采用图结构来表示图数据,由此产生图数据科学。图数据是一种新的大数据,具有丰富的数据关联价值。图数据科学是研究图数据的一门学科,以图数据为研究对象。反过来,图数据科学的发展,加快了大数据时代的步伐,开启了图数据时代的征程。


另一方面,图数据科学受益于人工智能的发展,同时加速了人工智能的发展。图增强的机器学习,改善了预测效果,增强了洞察能力。正因如此,机器学习成为推动图数据科学的途径,图数据科学成为了加速机器学习的秘诀。近年来,图驱动的人工智能的相关研究逐年激增,图算法、图注意、图补全、图卷积、图嵌入、图核、图学习、图神经等[44-51]成为研究热题。AI/ML正在推动图数据科学蓬勃发展,图数据科学正在驱动AI/ML跨越发展[2052]。大数据、人工智能等新技术,促进了图数据科学的发展与应用。图数据科学是继承了图论的传统方法、融合了大数据、人工智能等新兴技术的一门富有创新、极具驱动的学科,呈现出鲜明的数智化的发展趋势。


三、应用工程化:日益成为工程性与管理性的学科


图数据科学在工程实践中落地,在管理决策中应用。一方面,图数据科学不单是理论性的科学问题,首先是应用性的工程问题[27]。图数据工程侧重图数据获取的技术工作,涉及图数据搜集、图数据加工。图数据科学指图数据处理的所有工作,着重图数据管理、图数据分析和图数据应用。从图数据的生命周期来看,工程问题一旦顺利完成,将有助于科学问题的深入开展;工程问题每当遇到阻滞,通常需要寻求科学问题的理论突破。图数据科学就是一门通过图技术让数据变得更有科学价值的工程学科。


另一方面,图数据科学不仅是工程化的技术问题,并且是决策化的管理问题。在技术上,图数据科学强调利用图技术对图数据进行工程应用,采用图数据库来构建知识图谱,为专家和学者提供工程实践。在管理上,图数据科学则强调结合业务管理对图数据开展决策分析,使用知识图谱来挖掘关联数据,为组织和人员提供决策支持[42]。无论从技术上来讲,还是从管理上而言,图数据科学是一门实践性很强的学科。图数据科学具有典型的工程化的发展趋势,将集中体现在知识图谱的当前广泛应用;并朝着智能的决策化的发展趋势,突出体现在图原生机器学习的未来高阶应用。


归根结底,图数据科学是一门应用性很强的学科,突出表现在图数据库、知识图谱与大图分析等不同进阶应用。近年来,以图数据库、知识图谱、大图分析为核心内容的图数据科学的研究与应用,在国内外呈现出日益俱增的发展态势。图数据库(Graph Database)在图书馆[53]、文献资源[54]、考古挖掘资料[55]、宋代镇江诗词[56]以及商业[,57]、专利[58]、产品分类[59]、人物关系[60,]中的应用场景不断丰富。实际上,图数据库可为不同行业提供各具特点的高级应用,而最为基础应用莫过于知识图谱。知识图谱(Knowledge Graph)与知识地图(Knowledge Map)、科学知识图谱(Mapping Knowledge Domains)不同[,61] ,在标准文献[62]、民国报纸[63]、非物质文化遗产[64]、口述历史档案资源[65]以及可移动文物[66]、图情学术[67]、新冠肺炎政策[68]、医学[69]等众多领域中得以构建与应用。研究发现,我国知识图谱研究论文,以 CSCD 和 CSSCI作为来源期刊,高度集中于“计算机科学与技术”和“图书馆、情报与档案管理”2个领域[61] ;以中图分类号作为学科分类,高度集中于计算机的应用(TP39)、情报资料的处理(G353)、人工智能理论(TP18) 3 个领域[70]。许多现代数据用图(Graph)或网络(Network)表示[71],大图分析(Big Graph analytics)与网络分析(Network Analysis)具有相通性,都是使用图来描述实体及其关系,利用图模型来分析与预测。在文章中,大图分析就是采用图数据库或者基于知识图谱进行网络分析。传统的网络分析,常用于图书馆[72,73]、情报学[74,75]、文献[76,77]、专利[78,79]、信息计量[80,81]、学术评价[82]以及期刊排名[83]。从发展趋势来看,图数据库能够深度挖掘隐含关系,已成为大数据挖掘的可视化分析工具,可作为复杂网络分析的一站式解决方案[84]。从应用来讲,图数据库用来收集数据、表征数据、存储数据,知识图谱用来数据分析、智能搜索、智能推荐,大图分析用来智能预测、精准服务、支持决策,由此有机构成了图数据科学的各种应用。图数据科学的应用,正是采用了“图数据库-知识图谱-大图分析”,如同情报工作中“信息收集-信息分析-情报研究”[18],以“图”技术的方式塑造了独特的“耳目-尖兵-参谋”。在发展与应用中,图数据科学不断融合了不同科学的学科知识,交叉成为一个新学科的综合体;同时,整合了各自领域的业务知识,荟聚成为一个新应用的综合体。因此,图数据科学也是一门综合性的学科。


结语


图数据及图技术的应用实际上由来已久并且日益广泛。一方面,传统应用包括计算最优运输路线、预测疾病爆发路径、分析文献引用关系、挖掘生物网络信息等“小图”数据的应用;另一方面,新兴应用包括社交网络分析、知识图谱构建、万维网数据共享、人脑网络模型构建等“大图”数据的应用[24] 。大数据环境下,“大图”技术与应用既带来了新的挑战,又迎来了新的机遇。Gartner公司预测,从2019年到2022年,全球图处理与图数据库的应用将以每年100%的速度增长;到2023年,图技术将在全球30%的组织中促进决策的快速场景化;再到2025年,图技术将用于80%的数据和分析创新[1-3]。因此,图技术的蓬勃发展及广泛应用,必将赋能更复杂和更适应的数据科学[1]


图数据时代,交叉学科已来。图数据科学成为了一门新兴的交叉学科,涉及数学、计算机科学、人工智能、领域知识等多个学科。研究发现,图数据科学正是以图数据及其现实世界为研究对象的一门综合学科,在理论、方法和应用研究中形成了崭新的学科体系,并构建了以图数据库、知识图谱、大图分析为核心的学科内容。研究表明,通过学科分化与学科融合,图数据科学成为一门独立性且系统性的学科;结合传统方法与新兴技术,图数据科学成为一门创新性和驱动性的学科;经过工程实践与管理决策,图数据科学成为一门工程性与管理性的学科。鉴于融合化、数智化、工程化的学科发展趋势,图数据科学将会成为一门应用性极强的综合学科。


然而,图数据科学是一门年轻的学科,仍处于学科初创阶段,还需要进一步荟聚和整合,也需要进一步认同和推动。中国科学院和工程院院士路甬祥专家早在2005年就曾指出,在中国科学发展中,学科交叉与交叉科学显得相对滞后;为此,中国更要加强科学交叉和交叉科学[40]。以学科交叉融合与新文科建设协同创新为例,中国人民大学原校长专门探究,从学科交叉到交叉学科如何进档升级[85]。因此,图数据科学的兴起与发展,有赖于领域专家在学科交叉中不断实现破圈——使科研共同体充分地起到“催化新科学”的作用,有赖于图情学者在交叉学科中持续推动升级——经有组织科研积极地发挥“传递新知识”的功能。学科交叉时代,图数据科学已来。


参考文献

[1] Gartner Inc.. Gartner Identifies Top 10 Data and Analytics Technology Trends for 2019[EB/OL]. [2022-02-04]. https://www.gartner.com/en/newsroom/press-releases/2019-02-18-gartner-identifies-top-10-data-and-analytics-technolo.

[2] Gartner Inc.. Gartner Identifies Top 10 Data and Analytics Technology Trends for 2020[EB/OL]. [2022-02-04]. https://www.gartner.com/en/newsroom/press-releases/2020-06-22-gartner-identifies-top-10-data-and-analytics-technolo.

[3] Gartner Inc.. Gartner Identifies Top 10 Data and Analytics Technology Trends for 2021[EB/OL]. [2022-02-04].  https://www.gartner.com/en/newsroom/press-releases/2021-03-16-gartner-identifies-top-10-data-and-analytics-technologies-trends-for-2021.

[4] 罗宾逊,韦伯,埃弗雷姆.图数据库(第2版)[M].刘璐,梁越,译.北京:人民邮电出版社, 2016: 1-2.

[5] 赵红州,蒋国华.在科学交叉处探索科学——从科学学到科学计量学[M].北京:红旗出版社, 2002: 385-387.

[6] 方锦清,汪小帆,郑志刚,等.一门崭新的交叉科学:网络科学(上)[J].物理学进展, 2007, (3): 239-343.

[7] Smart J. Graph Theory and Applications[J]. JOURNAL OF THE OPERATIONAL RESEARCH SOCIETY,  2011, 62(11): 2047-2047.

[8] Noa Roy-Hubar, Lior Rokach, Bracha Shapira, et al. Modeling Graph Database Schema[J]. IT Professional,  2017, 19(6): 34-43.

[9] Ian Robinson, Jim Webber, Emil Eifrem. Graph Databases[M]. O'Reilly Media, Inc., 2013: 9-22.

[10] Neo4j Inc.Neo4j: A Quick History[EB/OL]. [2022-02-11]. https://neo4j.com/company/.

[11] Solid IT. DB-Engines Ranking[EB/OL]. [2022-02-21]. https://db-engines.com/en/ranking.

[12] Ian Robinson, Jim Webber, Emil Eifrem. Graph Databases(2nd Edition)[M]. O'Reilly Media, Inc., 2015:1-2.

[13] 中国信息通信研究院云计算与大数据研究所. 图数据库白皮书[R].大数据技术标准推进委员会, 2020: 1-37.

[14] Google Inc. Introducing the Knowledge Graph: things, not strings[EB/OL]. [2022-02-25]. https://www.blog. google/products/search/introducing-knowledge-graph-things-not/.

[15] Neo4j Inc.. We Help the World Make Sense of Data[EB/OL]. [2022-03-06]. https://neo4j.com/company/.

[16] 陈华钧.知识图谱导论[M].北京:电子工业出版社, 2021: 16-20.

[17] 张帜. Neo4j权威指南[M].北京:清华大学出版社, 2017: 9-10.

[18] 王知津.拓宽专业与学科融合:以MLIS为例[J].情报学报,2022,41(02):188-201.

[19] 中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.GB/T 13745-2009.中华人民共和国国家标准学科分类与代码[S].北京: 中国标准出版社, 2009.

[20] Alicia Frame. Graph Data Science:The Secret to Accelerating Innovation with AI/ML[EB/OL]. [2022-03-09]. https://neo4j.com/blog/graph-data-science-the-secret-to-accelerating-innovation-with-ai-ml/.

[21] 香山科学会议. 网络数据科学与工程——一门新兴的交叉学科?[EB/OL]. [2022-03-10]. http://www. ncmis.cas.cn /kxcb/jclyzs/201211/t20121106_101511.html.

[22] Parc. Big Graph Data Science[EB/OL]. [2022-03-12]. https://www.parc.com/parc-forum/big-graph-data- science.

[23] Lise Getoor. Big Graph Data Science: Making Useful Inferences from Graph Data[EB/OL]. [2022-03-12]. https://www.msra.cn/zh-cn/news/video/big-graph-data-science-making-useful-inferences-from-graph-data.

[24] 袁野, 王一舒, 王国仁. 大图数据管理与分析技术[R]. 2017-2018中国计算机科学技术发展报告, 2018: 70-100.

[25] Mark Needham, Amy Hodler. Graph Algorithms[M]. O'Reilly Media, Inc., 2019: 27-28.

[26] Amy Hodler, Mark Needham. Graph Data Science (GDS) For Dummies®, Neo4j Special Edition[M]. John Wiley & Sons, Inc., 2021:3-8.

[28] David Haglin, David Trimm, Pak Chung Wong. Big graph visual analytics[J]. INFORMATION VISUALIZATION, 2017, 16 (3): 155-156.

[29] 姜振寰.交叉科学学科辞典[K]北京:人民出版社,1990.12

[30] 王义遒.学科“交叉”比交叉学科更重要[N].中国科学报,2021-12-14(07).

[31] 俞方桦. Neo4j图数据科学Graph Data Science (GDS)介绍[EB/OL]. [2022-03-29]. https://www.bilibili. com/video/BV1244y1Y7PV?spm_id_from=333.337.search-card.all.click.

[32] 邱均平,余波,杨思洛.大数据背景下一门交叉学科的兴起——论数据计量学的构建[J].中国图书馆学报, 2021, 47(11): 48-58.

[33] 朝乐门, 邢春晓, 张勇. 数据科学研究的现状与趋势[J]. 计算机科学, 2018, 45(01): 1-13.

[34] DK Singh, PKD Pramanik, P Choudhury, Big Graph Analytics: Techniques, Tools, Challenges, and Applicati ons [M] //M Ahmed and ASK Pathan, Data Analytics: Concepts, Techniques, and Applications, Boca Raton: CRC Press, 2018:171-198.

[35] Yao Ma, Jiliang Tang. Deep Learning on Graphs[M]. Cambridge University Presss, 2021: 75-106.

[36] Zhiyuan Liu, Jie Zhou. Introduction to Graph Neural Networks[M]. Morgan & Claypool Publishers, 2020: 19-21.

[37] Sean Martin, Ben Szekely,Dean Allemang. The Rise of the Knowledge Graph:Toward Modern Data Integration and the Data Fabric Architecture[M]. O'Reilly Media, Inc., 2021: 7-13.

[38] Dr.Jim Webber, Rik Van Bruggen. Graph Databases For Dummies, Neo4j Special Edition[M]. John Wiley & Sons, Inc., 2020: 3-10.

[39] Palash Goyal, Emilio Ferrara. Graph embedding techniques, applications, and performance: A survey[J]. Knowledge-Based Systemss, 2018, 151: 78-94.

[40]路甬祥.学科交叉与交叉科学的意义[J].中国科学院院刊,2005,(1):58-60.

[41]国务院学位委员会.交叉学科设置与管理办法(试行)[EB/OL].[2022-04-12]. http://www.moe.gov.cn/ srcsite/A22/s7065/202112/t20211203_584501.html.

[42] 肖仰光, 徐波, 林欣, 等. 知识图谱概念与技术[M]. 北京: 电子工业出版社, 2020: 8-10.

[43] Richard J.Trudeau. Introduction to Graph Theory[M]. Dover Publications, 2017: 1-24.

[44]Liu Zhiyong, Huang Kaizhu, Yang Xu, et al. Special issue on advances in graph algorithm and applications[J]. NEUROCOMPUTING, 2019, 336: 1-2.

[45] Xiong Zhaoping, Wang, Dingyan, Liu, Xiaohong, et al. Pushing the Boundaries of Molecular Representation for Drug Discovery with the Graph Attention Mechanism[J]. JOURNAL OF MEDICINAL CHEMISTRY, 2020, 63 (16) : 8749-8760.

[46] Chen Zhe, Wang Yuehan, Zhao Bin, et al. Knowledge Graph Completion: A Review[J]. IEEE ACCESS, 2020,8: 192435-192456.

[47] Hong Danfeng, Gao Lianru, Yao Jing, et al. Graph Convolutional Networks for Hyperspectral Image Classification[J].IEEETRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING,2021,59(7): 5966- 5978.

[48] Goyal Palash, Ferrara Emilio. Graph embedding techniques, applications, and performance: A survey[J]. KNOWLEDGE-BASED SYSTEMS, 2018, 151: 78-94.

[49] Airola Antti, Pyysalo Sampo, Bjoerne Jari, et al. All-paths graph kernel for protein-protein interaction extraction with evaluation of cross-corpus learning〔J〕. BMC BIOINFORMATICS, 2008, 9(S11): 1-12.

[50] Qiao Lishan, Zhang Lime, Chen Songcan, et al. Data-driven graph construction and graph learning: A review[J]. NEUROCOMPUTING, 2018, 312: 336-351.

[51] Wu Zonghan, Pan Shiru, Chen Fengwen, et al. A Comprehensive Survey on Graph Neural Networks[J]. IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2021, 32 (1): 4-24.

[52] George Anadiotis. Graph-Based Data Science, Machine Learning, and AI[EB/OL]. [2022-05-28]. https:// dzone.com/articles/graph-based-data-science-machine-learning-and-ai-t.

[53]李金阳.图数据库在图书馆的应用研究[J].图书馆,2020(11):109-115.

[54]王莉.基于图形数据库技术的文献资源关联网络构建[J].数字图书馆论坛,2014(05):59-65.

[55]高劲松,韩牧哲.考古发掘资料图数据库的语义关联构建研究[J].图书情报工作,2021,65(09):105-116.

[56]李永卉,周树斌,周宇婷,卢章平.基于图数据库Neo4j的宋代镇江诗词知识图谱构建研究[J].大学图书馆学报,2021,39(02):52-61.

[57]王仁武,袁毅,袁旭萍.基于深度学习与图数据库构建中文商业知识图谱的探索研究[J].图书与情报,2016(01):110-117.

[58]翟东升,刘鹤,张杰,蔡力伟.基于图形数据库的专利语义知识库构建技术研究[J].现代图书情报技术,2016(12):66-75.

[59]黄奇,钱韵洁,袁勤俭,陆佳莹.基于图形数据库的产品分类本体存储研究[J].情报学报,2019,38(08):849-859.

[60]于娟,黄恒琪,席运江,朱正祥.基于图数据库的人物关系知识图谱推理方法研究[J].情报科学,2019,37(10):8-12.

[61] 周贞云,邱均平.面向人工智能的我国知识图谱研究的分布特点与发展趋势[J].情报科学,2022,40(01):184-192.

[62]杨跃翔,涂新雨,刘文玲.标准文献知识图谱构建与应用研究[J].数字图书馆论坛,2022(06):22-30.

[63]沈旺,陈玖瑜,潘梦雅.数字人文视域下民国报纸知识图谱构建研究[J].图书馆杂志,2022,41(09):105-112.

[64]范青,史中超,谈国新.非物质文化遗产的知识图谱构建[J].图书馆论坛,2021,41(10):100-109.

[65]邓君,王阮.口述历史档案资源知识图谱与多维知识发现研究[J].图书情报工作,2022,66(07):4-16.

[66]高劲松,张强,李帅珂.可移动文物的知识图谱构建及关联数据存储——以湖北省博物馆为例[J].现代情报,2022,42(04):88-98.

[67]张云中,祝蕊.面向知识问答系统的图情学术领域知识图谱构建:多源数据整合视角[J].情报科学,2021,39(05):115-123.

[58]霍朝光,钱毅,祁天娇.基于开放公文的新冠肺炎政策知识图谱构建与分析[J].档案学通讯,2021(02):53-62.

[69]翟姗姗,潘英增,胡畔,郑路.基于医学知识图谱的慢性病在线医疗社区分面检索研究[J].情报理论与实践,2021,44(01):195-203.

[70]周贞云,邱均平.中图分类号的学科应用及其可视化——以我国知识图谱研究为例[J].现代情报,2022,42(05):3-12+68.

[71] Selin Aviyente, Abdullah Karaaslanli. Explainability in Graph Data Science Interpretability, replicability, and reproducibility of community detection[J]. IEEE SIGNAL PROCESSING MAGAZINE, 2022, 39(4): 25-39.

[72]杨巧云,苏海潮.图书馆人际网络分析[J].图书与情报,2008(02):94-97.

[73]邵玉河,董振平.图书馆微博的社会网络分析[J].图书馆工作与研究,2015(03):28-32.

[74]裴雷,马费成.社会网络分析在情报学中的应用和发展[J].图书馆论坛,2006(06):40-45.

[75]陈迪,吴亚平,赵怡然,姚玲苗,王继民.复杂网络分析方法在情报学中的应用研究综述[J].数字图书馆论坛,2015(09):42-47.

[76] 宋歌.网络分析方法在引文分析中的整合研究[J].中国图书馆学报,2011,37(04):106-114.

[77]徐晨飞,赵文娟.我国数字人文研究领域作者合著网络分析[J].图书馆论坛,2019,39(11):14-24.

[78]方曙.社会网络分析方法在专利分析中的应用研究进展[J].图书情报工作,2012,56(04):90-95.

[79]刘玉林,菅利荣.中美电商数据技术演化异同比较研究——基于动态专利有向网络分析视角[J].情报杂志,2022,41(08):201-207+193.

[80]赵蓉英,李飞.基于社会网络分析方法的国内外信息计量比较研究[J].情报科学,2013,31(02):7-12.

[81]吴江,董克,杨玉洁,易梦馨.信息计量领域网络分析方法应用研究综述[J].情报学报,2021,40(10):1118-1128.

[82]徐菁,程冕,王绍兰,明书旭,邵洲,唐杰.一种基于网络分析的学者学术影响力计算方法[J].情报科学,2021,39(03):101-106.

[83]刘佳雨,虞为,陈俊鹏.基于社会网络分析的图情领域期刊排名研究[J].情报理论与实践,2020,43(02):129-136.

[84]刘春江,李姝影,胡汗林,方曙.图数据库在复杂网络分析中的研究与应用进展[J].数据分析与知识发现,2022,6(07):1-11.

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论