
今年3月份,蚂蚁图计算平台TuGraph举办了第二期Meetup活动,主要内容是图技术的应用场景实践,会上讲了4个TOPIC,分别是《实时图计算在蚂蚁的应用》、《图引擎如何成为风控科技的新势力》、《知识图谱电力行业应用》、《TuGraph+G6VP让关系数据跃然纸上》,从技术、原理、可视化展示、实际应用等多个角度,来介绍了图技术如果服务蚂蚁集团内部、以及蚂蚁集团的客户。
几个议题中,最吸引我的就是实时图计算,分享嘉宾泰初老师(潘臻轩)详细的讲述了蚂蚁集团实时图计算平台的发展历程、系统架构、难点痛点、技术实践、以及云原生改造、DSL等细节,真的是一次诚意满满又充满干货的分享。
蚂蚁集团开源的分布式实时图计算引擎,项目名称叫GeaFlow,品牌名TuGraph-Analytics。为了简单,我们后面都简称GeaFlow。

GeaFlow的核心能力是流式图计算。流式图计算相比离线图计算提供了一种高时效性低延迟的图计算模式,它主要包含流式构图、流式图计算以及图计算结果后置处理等过程。
- 流式构图:是将外部数据源的数据通过一些ETL处理,转换成图的点边结构实时写入图存储中
- 流式图计算:是对图数据进行实时分析处理,包括图遍历计算和图算法计算
- 后置处理:是对图计算的结果做进一步的ETL等加工处理然后写入结果表
GeaFlow实现了一体化的Pipline运行方式实现整个处理过程。
相比传统的流式计算引擎比如Flink、Storm这些面向表数据的实时处理系统而言,GeaFlow主要面向图数据的实时处理,支持更加复杂的关系分析计算,比如多度关系实时查找、环路检查等;同时也支持图表一体的实时分析处理,能同时处理表数据和图数据。
和离线图计算引擎比如Spark GraphX等系统相比,GeaFlow流图计算能力能提供更好的时效性保证。


GeaFlow整体架构从上往下包含以下几层:
GeaFlow DSL: GeaFlow对用户提供图表融合分析语言,采用SQL + ISO/GQL方式.用户可以通过类似SQL编程的方式编写实时图计算任务.
GraphView API :GeaFlow以GraphView为核心定义的一套图计算的编程接口,包含图构建、图计算以及Stream API接口.
GeaFlow Runtime: GeaFlow运行时,包含GeaFlow图表算子、task调度、failover以及shuffle等核心功能.
GeaFlow State: GeaFlow的图状态存储,用于存储图的点边数据.同时流式计算的状态如聚合状态也存放在State中.
K8S Deployment :GeaFlow支持K8S的方式进行部署运行.
GeaFlow Console: GeaFlow的管控平台,包含作业管理、元数据管理等功能.

在常规的离线图计算中,通常是将图数据库的数据离线导出到Hadoop平台,然后利用Spark GraphX分布式图计算的能力,进行图数据的分析和挖掘,也就是常规意义的OLAP分析。但是这种模式有几个天然的弊端:
技术架构复杂,需要引入一整套大数据平台,增加方案复杂度、增加了用户成本
数据时效性差,当然图技术的应用,以金融、风控、社交网络、知识图谱等为主,尤其是金融和风控,对数据的时效性要求非常高,离线的OLAP分析不能满足实际业务需求
产品割裂、维护成本高,用户买一套图平台,需要引入两个以上产品,使用和维护的成本都非常高
基于这几个想法,我对TigerGraph的实时大图、Ultipa的实时图计算一直很感兴趣,也一直在思考,未来图数据库是不是也会OLTP、OLAP融合,走向HTAP的方向?我个人是比较认同HTAP的,尤其是云原生时代下,存算分离技术在云上有大量的优秀实践。
GeaFlow的出现,让我对实时图计算有了更深入的了解,我也更坚定的认为HTAP会是未来的主流,以后图数据库、图计算就是一个产品,部署简单、使用方便、实时性好,同时具备OLTP和OLAP的能力。


在3月份的Meetup上,我还问过泰初老师GeaFlow是否会开源,我记得当时还没有确定。

不到3个月的时间,就完成GeaFlow的开源,除了感叹神速外,我也看到了TuGraph坚定开源的信念,以及做好开源社区的决心。也希望对图数据库和图计算感兴趣的同学,可以多多关注TuGraph,使用TuGraph,并回馈开源社区。
开源地址:https://github.com/TuGraph-family/tugraph-analytics
参考:
1 GeaFlow简介
https://github.com/TuGraph-family/tugraph-analytics/blob/master/docs/docs-cn/introduction.md
2 2023开放原子全球开源峰会,蚂蚁图计算平台开源业内首个工业级流图计算引擎
https://mp.weixin.qq.com/s/dVzo6mZqXc9LIa0ASjzhRA




