暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

了解图数据库系列之——异常交易识别

RegTech未来 2021-07-26
684


了解图数据库系列之

异常交易识别

 RegTech 未来 


。。。。。。

以新技术与海量数据为驱动的风险管理的模式已经得到快速发展,但在实际的风险管理中,互联网客户的欺诈行为也较为严重,其中比较突出的现象之一,是以贷款归集现象为表现的异常交易行为,为商业银行的风险管理带来了新的挑战。

 

如何从海量的数据中筛选出异常交易的数据呢?异常交易的突出特征是资金的异常归集行为,通过挖掘海量的数据中蕴含的特征信息,对人工分析难以捕捉的价值信息进行自动化识别,可提高精确识别能力。


可疑交易网络的构建


通过对某行四个地区的某年度共计7495.78万的数据进行分析挖掘,各地区交易流水数据量及占比如下图所示,可以看出交易流水数据量已达到千万级别,因此传统的数据分析及挖掘方法已难以解决,需要利用计算机大数据分析方法,基于海量数据的挖掘算法对数据进行进一步清洗、建模与挖掘分析。



第二步为对海量数据的清洗,清洗原则包括将资金流入、资金流出、交易时间、交易对手、交易金额、交易频率、交易分类等十几个维度纳入考量,整理出三十五项清洗规则,从海量的资金交易流水中筛选出异常的交易,通过多维度的考量数据相关性、交易对手特征、交易时间范围、交易金额特征等,捕捉其中高风险的交易。最后,从高风险的异常交易流水中清洗出可疑的交易流水。


数据量变化范围如下图所示,可以通过趋势线看出,经过复杂数据关联后,数据量由原始流水最初的7495.78万迅速增长了5倍,达到了3.75亿的数据量,通过清洗模型的清洗,异常交易的数据被筛选出来,最终获得的可疑流水约0.53万。流水的清洗工作是通过SAS工具完成的,得到了字段含义清晰、完整且规则的数据,为下一步构建可疑交易网络模型做准备。



欺诈网络分析模型构建


根据清洗模型的清洗结果,依据社交网络中的流-组算法(Stream-Group)进行建模和分析,并通过可视化的工具进行展示,以便更加直观的展示给风险管理人员,为其判断客户的风险提供数据上的支撑与依据。


模型的构建与可视化


根据每一个账户之间的转账关系进行聚类,为了更加直观的对数据进行展示,再根据已经处理好的数据中的每一个节点的入度和出度,以及边的权值,对节点与边进行处理。



通过Fruchter Atlas算法对可疑数据进行重新布局,获得了可直观展示资金流向的布局图,如下图:



另外,通过可疑交易数据可以获得可疑客户的地址范围信息,下图中,左半部分为A地区的可疑流水热图,右半部分为C地区的可疑流水热图:



可疑交易案例分析


可疑交易分为两种情况,其一为一对多的归集行为,其二为多对一的归集行为。

如下图所示,为多对一归集资金的一个案例。以姚某为主等11人,在贷款每月还款日前均得到了姚某的转账用来归还其贷款本息,而且资金量较为庞大,该可疑归集圈共计归集资金约为1513万,若该可疑交易圈的资金归集确认为欺诈或者贷款挪用行为,其资金链一旦断裂,其可能在商业银行产生逾期或者造成不良记录,以至于造成损失。



多对一(如下图所示)进行资金归集的特征相对较好确认,因为其归集方式较为直接,通过交易直接进行归集,其特点是客户在获得贷款后,对放款金额进行转移,且转移的方式简单直接,可以通过数据直接建模获得。




由此,我们可以通过构建自动化模型的方式,以关联交易为线索,自动化的捕捉海量的数据中的线索资源,识别可疑的异常交易,大大降低手工工作量,解放人力、降低成本,而且模型的准确性也大大高于手工筛选,工作效率远高于人工处理。通过将经验模型化落地,也将大大的降低操作风险。



结语


通过对海量交易数据的整理与分析,结合社交网络、知识图谱等前沿理论,可构建一个具有实际应用价值的欺诈网络分析模型,以捕捉在银行信贷中的异常交易行为,和识别欺诈性的资金归集的群体。对目前一般银行已具备的数据基础来说,具有一定的应用价值。



RegTech 未来


文章转载自RegTech未来,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论