暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

图计算如何为万物互联时代搭建智能 “解码中枢”?

XAI嬴图 2025-06-30
117
图数据库(图计算)应对的是当今一个宏观商业世界的大趋势,它凭借对海量、复杂、动态的数据的挖掘、分析和关联而获得洞察力。事实上,虽然其本身还无法在短时间内完全替换那些已经被用户充分认识和使用的数据平台,但市场对该技术的需求在不断激发着图数据库(图计算)的内生动力。
在现实生活中,我们每天都会产生海量的数据:电商平台的用户购买记录、社交软件的聊天互动、金融机构的交易流水…… 这些数据不仅数量庞大,而且彼此之间存在着千丝万缕的联系。传统的数据平台,如关系型数据库,擅长 “按表排列”,它虽然能清楚看到每个人的基本信息,却很难快速找出 “谁和谁有共同好友”“哪类人群喜欢同一类商品”等等信息……
图数据库则另辟蹊径,它专注于捕捉数据之间的关系。无论是社交网络里的好友链,还是金融交易中的资金流向,它都能像拼图一样,把看似零散的数据“节点用 “边” 连接起来,形成一张动态的 “关系网络”。比如,银行可以用图数据库快速识别出可疑的洗钱网络 —— 当多笔小额转账最终都流向同一个账户时,系统能瞬间发现这种隐蔽的关联;电商平台则能通过分析用户的购买行为和浏览记录,精准推荐出 “你的好友都在买的商品”等等。
图1:使用图进行网络分析,它将高于所有其他类型的数据源

上图展示了使用图进行网络分析,区别于其他类型的数据源,其可敏捷应对变化、未知的数据关系与类型以及能高效处理海量数据。在实时图数据库和图计算引擎的帮助下,我们可以实时的在不同数据间找到深度关联关系。举例来说,基于百科全书的知识体系而构建的知识图谱数据集中(一张大图,图中的顶点是一个个的知识点,而边则是知识点之间的关联关系),通过图引擎可以实时计算出以下路径:

图2:实时搜索最短路径:从牛顿至成吉思汗(表单模式)

图3:实时搜索最短路径:从牛顿至成吉思汗(图模式)

与传统的搜索引擎不同,当你搜索时,你所期待的返回结果不再是单一的网页、连接排序,而是更为复杂、多边甚至全面的关联关系,搜索引擎不会返回为空、答非所问或无实际意义的答案,在实时图计算引擎的支撑下,它可以返回最优的、人脑都无法企及的智能路径!如果你仔细观察图3中的这些路径,其中一条(位于下方的灰色路径),可以用以下方式解读:

  • 成吉思汗开始对欧洲进行征战(13世纪初)。

  • 蒙古征战欧洲导致黑死病的爆发(原因之一)。

  • 黑死病的绝唱(17世纪):伦敦大瘟疫。

  • 当时就读于剑桥大学的牛顿为躲避伦敦大瘟疫回到了家乡(随后发明了微积分、光学和牛顿定律……)。


所有过程在图数据库支撑下都是实时完成,返回最优(注:不一定是最短)路径。如果用户更感兴趣展望未来,他可以改变筛选过滤和调整条件,例如设置相关顶点(或节点)与边的参数(或属性)等。如果你是求知欲较强的用户,你可能会尝试扩展到更大范围(深度)的搜寻:

图4:实时动态图过滤与剪枝(通过图搜索过滤)


很显然,随着过滤条件变得更苛刻,路径搜索返回的结果中的路径变得更长了(从5层增长为7层),但是搜索的时间并没有指数级增长。这是实时图计算引擎的一个很重要的能力——对子图的动态剪枝的能力,一边搜索,一边过滤(剪枝)(见4。缺乏这种能力的图数据库绝无可能成为有商业应用场景的实时图数据库。


下图展示了以上路径所形成的动态生成的子图的2D空间可视化效果:

图5:通过图过滤后牛顿与成吉思汗形成的多层关联


另外一个实例是通过对转账、汇款、取现等交易的数据流进行追踪来实现实时反洗钱监测。见下图:

图6:资金流向图 大红点:资金流出方;小红点:账户

图6中大红点资金流出方,经过10层的中间账号的不断转账转发,最终汇聚在小红点账户的位置。除非经过10层以上的深层挖掘,否则你很难发现数据(资金)的真正流向,以及它们背后的真正意图。对于各国的金融监管机构而言,实时图数据库与图计算的意义不言而喻——当犯罪分子在以图的方式规避监管的时候,他们会通过构造深层的图模型来逃避反洗钱追踪,而监管机构只有使用具备深度穿透分析能力的图数据库才能让罪恶无处遁形。

绝大多数人都知道“蝴蝶效应”,就是在数据和信息的海洋中去捉从一个(或多个)实体到遥远的另外一个(或多个)实体间的微妙的关联关系。从数据处理框架的视角上看,如果没有图计算的帮助,蝴蝶效应是极难被发现的。有人会说随着算力的指数级增强,未来总有一天我们会实现笔者以为,这一天已经到来!实时图数据库就是进行蝴蝶效应计算、查询的最佳工具!

知名数据分析公司Gartner曾提出了一个5层的数据分析模型,见下图:
图7:Gartner5层模型网络分析就是未来

上图中,数据分析的未来在于“网络分析”,或称为实体链接分析,建立这个系统只能依赖图数据库——本文前面部分揭示了其中的原因——图计算系统把数据以网络拓扑结构的方式构建,并搜寻网络内的关联关系,它的效率远超关系型数据库管理系统,后者通过表间的关联(table-join)来进行计算,它可能永远无法完成类似的任务。此外,区别于传统的复杂SQL代码查询的黑盒化问题,以及深度学习、人工智能算法中常见的黑盒化、不可解释性等问题,图数据库中的查询、算法整体的特点是计算(查询)的结果基本上是确定性的,每一步都是可解释、白盒化的。

数据分析(技术)的发展是商业发展的必然,它提高了数据处理的科技水平。从第1层到2层,你可以把它视为数据分析领域内从单机应用到互联应用的提升;第3层是渠道中心化数据分析,它经常发生在一个公司的渠道或部门的内部;第4层的特点是跨渠道,它要求大型公司内的不同渠道分享数据,从而最大程度挖掘数据的价值,你必须合并各个渠道搜集到的不同类数据,并把他们视为一个整体,由此来进行网络化分析(例如社交网络分析),这种通用需求级别的挑战,只有图数据库才能完美实现。


END


图库 | 基于图增强的智慧审计系统革新
专家观察 | AI价值链条:价值导向分析
图数据库知识点系列1 |图数据库与关系型数据库的区别
图数据库知识点系列2 | 图思维方式
图数据库知识点系列3 |图数据库解决了什么问题?
图数据库知识点系列4 |图计算与图数据库有区别吗?
图数据库知识点系列5 | 图数据库只存不算?
图数据库知识点系列6 | 高并发图数据库系统如何实现?
图数据库知识点系列7 |如何正确评测图数据库?
图数据库知识点系列8 | 大数据框架与图数据架构异同
图数据库知识点系列9 | 分布式存储和分布式计算哪个更适合作为工作方向深入发展?
图数据库知识点系列10 | 图算法与可解释性


文章转载自XAI嬴图,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论