暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

金融科技产业大会:图计算将数据可视化,执行效率更高

TuGraph 2023-11-22
400

11月17日,由中国信息通信研究院联合相关单位举办的2023(第六届)金融科技产业大会在北京召开。本次大会旨在汇聚金融科技最新成果和成功案例,分享金融科技产业前沿创新实践与探索,搭建金融科技跨领域交流合作平台,共促金融数字化转型发展,共探数智金融创新未来。

蚂蚁图计算事业部总经理洪春涛应邀出席分享《蚂蚁图计算系统TuGraph实践》主题演讲。以下为演讲内容提炼:

图计算将数据可视化,使人类更容易理解

下图的左右两种数据呈现形式,哪个更容易看出人与人的关系?例如,张大妈跟马小扁是否有关联?

这是支付宝支付风控的一个典型场景。假设有一位用户,她叫张大妈,需要向另一位用户马小扁转账一笔款项。这时触发支付风控系统,试图判断这笔支付是否存在潜在风险,从而需要进一步提示用户。

策略之一,就是判断这两个用户之间是否存在关联关系。例如,我们会考虑张大妈和马小扁是否是朋友,或者他们之间是否有过历史转账记录。在这个判断中,我们假设任何可能的联系都被视为线索。如果他们之前有过联系,尤其是有过转账记录,我们可能会认为这笔支付的风险稍微降低一些。相反,如果两者之前完全没有关联,而突然出现一笔较大金额的转账,这可能被视为较高风险的支付情景,用户有可能遇上了诈骗。

这项分析判断的背后,就是图计算技术。

在传统的表数据系统中,数据以二维表的形式存储,导致难以发现深层次的信息,对数据关系的分析处理效率低。图计算系统将数据存储成图的形式,即实体为点,实体间关系为边,提供更自然、灵活的抽象。通过以图为抽象的数据结构进行计算,图计算具有更高的执行效率。其优势在于直观的将数据可视化,使人类更容易理解;更容易发现深层次的数据信息,包括路径、关系、群体、特征等,相对于传统的表数据系统有显著的优势。

蚂蚁为什么要用图计算?

蚂蚁选择采用图计算,可以追溯到2015年,主要是服务于自己的业务。因为蚂蚁有很多的数据,它来源于自己的业务,包括支付、社交、公益等业务,并且是一个异构的数据,比如支付可能有支付、有转账、有人跟手机之间的登录关系、有注册的关系,很多异构的数据,我们要对它进行分析,才能更好地服务我们的客户,所以我们需要用到图计算这个技术。经过多年的建设,图计算已经深深地扎根在蚂蚁集团的业务里面。

图计算的典型应用场景示例

支付风控场景

在支付风控中,我们处理着大约百亿级别的点或者说实体,包括个人账户、手机、设备、Wi-Fi等,涉及到万亿级别的关联关系,其中大多数是支付和转账的关系。在“双11”高峰期,整个系统的吞吐能达到千万笔/秒的级别,而在这种情况下,通过图计算来进行数据分析,我们能够将实时查询的延迟控制在20毫秒以下。

花呗反套现场景

在这类情景中,我们需要检查花呗支付是否存在套现的嫌疑,其中一个典型的验证是观察是否构成资金回路。通过图计算查询,我们能够在百万级查询/秒的情况下,检测十度以内的关系,数据延迟控制在1分钟内。

数据血缘场景

除了金融领域,我们也在蚂蚁的业务中发现了许多其他场景可以很好发挥图的作用。举例来说,其中一个是数据血缘。在数字化时代,数据量庞大,经常会对数据进行分析生成新的数据,形成大量数据以及数据的拷贝。

了解这些数据之间的关系变得非常重要,因为这牵涉到改变一份数据是否会影响下游业务以及数据隐私问题。对于用户来说,知晓他们的隐私数据究竟被哪些业务使用也是至关重要的。通过数据血缘,我们可以轻松地标识出每份数据最终被哪些业务使用,以及在进行更改时是否会影响相关业务。这对于用户的隐私授权也提供了明确的信息。

经过多年的发展,图计算在蚂蚁内部已经应用了300多个不同的场景,涵盖了安全风控、商家服务、会员关系等多个业务线。在这个过程中,我们逐渐打磨并积累了一个名为TuGraph的图计算系统,包括实时图查询数据库、流式图计算系统、图分析系统和图学习。该系统已经部署在蚂蚁的5000多台物理机上,并获得了多方业内认可,包括2021年世界互联网大会的“领先科技奖”、电子协会的“科技进步一等奖”等。

除了为蚂蚁内部提供服务,TuGraph也被推向了更广泛的市场,目前已经为金融、工业、互联网、政企、电信等客户提供商业化服务。相对于竞品,TuGraph的主要优势在于它是在蚂蚁内部大型业务中经过系统打磨的,稳定性、规模和吞吐都得到了验证,并多次在国际图数据库benchmark测试中打破记录。在业务成熟度上,经过业务团队的打磨,包括零代码和业务性考量。

图计算是一项非常有用的技术,虽然仍处于新兴的发展阶段,但生态发展至关重要。标准化是生态发展中的重要一环,因此蚂蚁积极参与各种标准化工作建设,比如国际标准ISOGQL的查询语言标准,蚂蚁是国内唯一一家深度参与并有提案被接受的厂商,还包括国内的行业标准和国标建设。目前,蚂蚁正在牵头建设金融图数据库测试标准项目,旨在帮助金融机构测试不同的图数据库,为图数据库的选型提供参考。

我们认为开源是整个软件发展的趋势,因此愿意将核心系统包括图数据库、流式图计算、图学习等开源,并邀请大家一起共建图计算技术。


 欢迎关注TuGraph代码仓库~

TuGraph-DB 图数据库 GitHub
https://github.com/tugraph-family/tugraph-db
TuGraph-Analytics 流式图计算引擎 GitHub
https://github.com/tugraph-family/tugraph-analytics
TuGraph-AGL 图学习引擎 GitHub
https://github.com/tugraph-family/tugraph-antgraphlearning



END


往期回顾
→ 权威报告:蚂蚁集团TuGraph跻身中国图数据库市场“领导者”象限
→ 蚂蚁图计算平台开源业内首个工业级流图计算引擎
→ 洪春涛:图数据库厂商的新机遇在深海中等待


文章转载自TuGraph,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论