
基础软件国产化替代系列之五:谁会最先在图数据库应用中获益呢?毫无疑问是能创造高价值的金融机构。面对银行的新型应用场景,用自研的分布式图数据库代替开源的单机图数据,不但在处理关联关系上性能提升上千倍,而且能够深挖关联关系,释放数据潜在的价值,在数据库国产化替代上率先成为赢家。
图数据库原理虽然高深莫测,但是其应用场景却日渐丰富,应用效果出奇得好,不管是新冠疫情溯源、案件侦破、监管机构风险防范、医疗服务中病情诊断等等。
那么谁会最先在图数据库应用中获益呢?毫无疑问是能创造高价值的金融机构。随着金融领域数据挖掘分析的日益深化,银行对于利用海量结构化或非结构化数据,构建全行级的特定场景知识图谱需求日益旺盛,赋能业务,帮助业务人员构建深度关系拓扑,并借助图分析和图算法,提升业务洞察效率。
某银行采用星环科技的分布式图数据库StellarDB和知识图谱平台Sophon KG,替代开源的图数据库,构建关联关系图谱和小微事件图谱等,应用于资金断点分析、异常图模式探索、异常交易识别、交易轨迹模型等场景,落地业务创新,享受到国产图数据库发展第一波红利。

1.对于这些新场景图数据库事半功倍

利用企业之间各种关联关系,如集团关系、实际控制人关系、股权投资关系、上下游关系、交易关系、担保关系、事件关系等,搭建企业社交图谱,直观立体展现企业关联,充分挖掘企业“社交”资源,利用图数据库建立社交图谱,开展多种业务,如风险评估、风险预警、智能搜索、智能营销、欺诈监测、投资荐股等。
利用图数据库,可以更快速防范金融欺诈,适用于信用卡申请、贷款申请、透支欺诈等欺诈情形,快速查看申请者之间是否共用多个实体,是否构成欺诈环。
图数据库在揭露关系上有天然的优势,而对用户的刻画不仅仅在于用户的自身属性,更多地存在于其与外界的“关系”,图数据库能根据用户固定特征、兴趣特征、社会特征、消费特征、动态特征等“关系型”特征上进行分群标记,帮助企业完善用户画像,从而达到精准营销效果。
在投资领域,经常关注突发事件对公司产生的影响,这时可以利用图数据库对实体之间“关系”的显式存储,高效快速查找相关的企业,并检索出哪些基金投资了这类企业,从而协助银行投资专家提醒其客户适当规避风险,达到提前预警功能。
传统的搜索引擎是基于关键词或字符串相似度进行的,而图数据库能够描述真实世界中存在的各种实体和概念,以及实体、概念之间的关联关系,基于图数据库的智能搜索引擎,可以得到更加精准的检索结果。
与此相同的应用场景还有很多。对于这些新型应用场景,传统的关系型数据库一般无能为力,或者性能表现不佳,让用户不得不舍弃。而图数据库在处理关联关系上性能提升上千倍,能够深挖关联关系,释放数据潜在的价值。
IDC报告认为,从长远来看,中国先进的移动互联网环境、巨大的社会和市场规模,未来对图数据库的应用需求将远超其他国家。
随着数据经济的发展,在数据量增加的同时,市场上对处理海量、复杂、关联、多变的网状数据的需求不断增加,而传统的关系型数据库产品已经很难胜任这种海量复杂的分析需求。
在这类场景下,图数据库成为众多用户的首选工具,在发现和分析数据间关联关系方面,图数据库的性能远远高出传统的数据管理和分析手段。


2.试水时用的开源图数据库商用时不够用了

IDC报告显示,从全球来看,图数据应用仍处于早期阶段,市场饱和度不足5%。且大多数用例是在银行、金融服务等先行者。
在开展商业应用前,一些金融机构在应用探索阶段采用了开源的图数据库,如Neo4j。
首先,Neo4j分为社区版和企业版。社区版本利用单机处理图关系,企业版支持分布式,但是为收费版本。
其次,Neo4j企业版选择闭源。2018年Neo4j宣布从Neo4j 3.5版本开始,企业版不再提供开源版本,仅提供商业许可。
专家分析认为,Neo4j选择闭源一大原因是为了解决企业版和开源版本之间混淆不清的关系,避免出现多个版本在多个许可证下开源的情况,建立一个行业标准化的“open core”许可模式。
另一个原因则是为了避免云提供商只从开源中“薅羊毛”,而不为这些项目作贡献。
第三,Neo4j企业版闭源切断了用户从开源试用过渡到企业版的途径。这对于采用开源版本的商业用户而言是一个损失,没法享受更多企业级性能,也会增加其他安全问题。
实际上Neo4j是众多选择闭源的企业之一,此前包括 MongoDB、Redis在内的企业都陆续变更了一些开源项目的许可协议。
调查数据也支持了用户的担忧。根据相关调查,Neo4j小型企业用户占比达到41%,中端企业市场31%,中小企业开源版选用比较多。
因此,用自研的国产图数据库替代开源的图数据库,成为众多用户特别是金融用户的一个选择。

3.替代开源软件,树立三大应用场景标杆

某商业银行虽然利用开源图数据库开展了一些应用探索,但是知识图谱平台与应用的痛点主要包括:
第一,平台管控较差。权限管理和资源管控能力较差,高可用和健壮性较差,无法满足实际场景中的图谱构建与查询权限分离与资源适配等需求。
第二,可视化效果较差。需要通过增加支持图谱的对比分析、可视化统计、时序分析、多种布局和样式的设置、3D大图展示等功能,增强银行知识图谱平台与应用的可视化水平,提升服务效率。
第三,缺乏自然语言处理(NLP)能力。无法支撑文本标注、实体关系抽取、舆情传播、智能问答等NLP能力,无法将知识图谱能力拓展到更多应用场景。
第四,应用场景不够丰富。目前,银行用户急需基于知识图谱平台挖掘更多的业务应用场景,并且对业务部门赋予基于图谱分析管理平台业务创新的能力。
如何应对这些挑战?该商业银行基于星环科技自主研发的分布式图数据库StellarDB与知识图谱平台Sophon KG,替代开源的图数据库,构建图谱中台,实现知识获取、图谱构建与存储、图谱更新迭代、图谱计算与分析等功能,并且通过星环科技平台的高可用和健壮性,满足客户高可用、资源管控、可视化效果、NLP能力等的需求。
该商业银行在金融行业树立三大应用场景标杆,包括:
1)构建企业知识图谱,实现贷后资金穿透管理。

其中,星环StellarDB具有海量图数据存储能力,原生支持的图算法使得批量分析更为简单,其支持的openCypher图检索语言易学易用,有助于提高交互分析的效率。
星环Sophon KG提供丰富的查询分析能力,用户只需要输入该领域内的关键词或者自然语言,即能映射为知识图谱中客观世界的概念和实体,搜索结果直接显示出满足用户需求的结构化信息内容,并且自动进行数据关联和分类排列、自动配出紧急或优先的信息。
2)构建企业关联关系图谱,提升风险防范水平。

企业关联关系图谱发展经历两个阶段,首先基于对公客户信息数据,构建企业关联关系图谱,挖掘对公客户股东、担保、投资、交易、任职、法人、集团、实控等关联关系,打造全行对公客户关系网络。
其次打造交互式知识图谱应用。将图分析与NLP自然语言处理结合,仅需以自然语言输入,就可实现基于图数据的分析及展示效果。
运用图算法,结合星环自研的分析风险传导模型,支持3D可视化直观查阅,显著提升风险分析水平。
3)构建小微企业风险事件图谱,服务事件的风险预警、评估、处置和分析监控管理。


星环科技StellarDB作为一款自主研发多年的分布式图数据库,其产品能力已通过中国信息通信研究院《图数据库基础能力评测》测试,并拥有多项专利。在国产化适配方面,可兼容银河麒麟、中标麒麟等国产操作系统。
从商用化程度上来看,星环科技自主研发的国产分布式图数据库StellarDB克服了海量关联图数据存储的难题,通过自定义图存储格式和集群化存储,实现了传统数据库无法提供的低延时多层关系查询,已经用于金融、政府、交通等众多行业,用于反洗钱、风险控制、营销等多种场景。
星环科技是国内同时具备图数据库、知识图谱平台、图挖掘应用开发能力的企业,其全栈能力,可以助力金融机构等快速构建知识图谱应用。
参考资料:
·https://mp.weixin.qq.com/s/zzMisAURiJCMjSjyYEDVBQ
·https://mp.weixin.qq.com/s/tVo6BDR-hAeGqHqhXXiqgg
·https://mp.weixin.qq.com/s/ZJdGCT8fkp1pM8mu1y-3pQ
·https://www.zhihu.com/question/32476681/answer/160997725

春天来了!!

扫码关注
大数据应用
从现在开始

End




