客户资金链大数据引擎分析平台项目
商业新知 09/29

 

随着以移动互联网、云计算、大数据和物联网的信息革命兴起,农村金融机 构正面临重大挑战,市场竞争激烈。为推进思维和战略的变革,充分利用内部数 据的资源优势,深挖大数据的价值,推动行内风险管理、经营转型,产品创新、 服务创新和管理提升,我行科技发展五年规划中制定了的大数据发展战略,遵照 规划我行在 2016 年逐步开展大数据技术创新探索之路,培养大数据人才,为日后 大数据平台搭建奠定基础。

为扎实做好我行大数据平台建设之路,结合我行业务数据分析的迫切性要求,我行在风险管理数据挖掘主题上先行引进了大数据技术,将客户资金链数据引擎 分析平台项目作为我行大数据技术研究的切入点。利用数据仓库数据基础,通过 高效的数据关系链追索分析技术,挖掘高风险交易数据及复杂交易关系链,为反 洗钱可疑交易分析、资金交易异常分析、电信诈骗、员工异常行为等风险排查提 供数据支持。通过本项目,探索我行大数据建设的可行性,搭建大数据分析原型, 为有效挖掘其他主题领域数据资源,拓展金融大数据应用场景,推动数据应用创 建奠定基础。以此提升我行对复杂关系网络数据分析技术处理能力,培养我行大 数据技术团队,培养我行科技自主创新能力。

资金链分析平台在模型建立、架构设计、数据算法、图形画像等方面采用了 创新性技术,从而实现了系统性能提升,建模方便快捷等功能。

一、创新性表现

(1)模型灵活配置。模型支持多维度配置,可以针对个人、企业、大额、高 频度交易建立不同模型,形成闭环、集中转入、分散转出等多种资金链图形输出, 满足多种业务需求。

(2)先进的数据关联模型。通过数据建模,分析交易习惯模式,总结洗钱特 征建模,实现特征数据自动提取,通过参数化与阈值配置,灵活支持系统的报警 准确度。

(3)高效分析方法。具有高容错性的分布流式计算平台架构,其并行计算和 数据处理方式可大大提高计算速度,其存储策略可保证各个存储节点的动态平衡, 实现数据的高效存取。

(4)高性能计算。准实时或实时计算,有效保证风险数据识别时效。

 

(5)共享知识库平台具有丰富的案件库及风险特征模型库,满足各种风险管 理需求。不断增加的共享风险信息,保证了模型库的持续完善。

(6)针对风险识别和风险排查主题的风险特征多样性及复杂性的特点,项目 采用了非传统的“原型 + 迭代”模式,这种模式贯穿于整个软件的开发过程,通 过这种开发模式,节省了很多的需求确认和整理的时间,最重要的是,开发出来 的产品经过不断改良、不断升级,变得越来越完美。这种项目开发管理模式的采 用和成功验证为我行以后的分析型系统的建设累计了经验,实践证明,“原型 + 迭 代”模式非常适合分析类系统的开发和运行。

(7)根据客户资金链分析结果形成动态图,形象地展现客户资金流向路线。

 

(8)高效的图形展示和动画效果,增加了系统的可视化功能,便于追溯分析 账户的交易行为模式。

 

二、功能描述

 

为提高系统的计算能力和性能水平,快速响应业务需求,资金链分析平台采

用了诸多现代前沿技术,包括算术算法、系统架构、图形可视化等方面,包括交 易链追溯算法技术、汇聚模型算法技术、并行计算技术、高效的内存计算技术和 可视化技术。针对交易链模型,本项目开发出一套快速算法,具体功能描述如下。

(1)解决传统模型计算能力不足,效率低问题。原模型的计算求解本身是一 个 NP(non-polynomial)问题,也即计算量随交易链深度呈指数级增长。当每天 进入和进出一个账户的资金笔数均超过 100 笔的时候,每天的计算量高达 1000 亿 次,一般机器难以完成,估计需要几天甚至几周的计算时间。资金链分析平台采 用了并行计算技术和高效的内存计算技术后大幅提高系统性能和计算能力,由原 先几天甚至几周的计算时间缩短至小时级。图  4—15  为平台架构。

(2)采用独特的大数据快速算法,该算法具有以下特性:①数据变换,从数 据库模型转换到有向网络图模型;②图计算的快速搜索算法,使用长记忆与短记 忆的马尔科夫模型方法;③快速数据寻址算法;④动态规划的快速算法;⑤图节 点的特殊类型定义方法,如类型节点等。

(3)模型计算速度明显提升,识别 1200 笔交易的时间为 3~5 分钟。

(4)模型结果准确率高,能够发现所有交易链,几乎不会出现漏报现象。

三、社会效益

资金链分析平台投产运行后,根据平台对客户财务交易数据分析,并且通过 数据模型结果分析和验证,达到了项目预期。由此,我行加大了资金链分析平台 实验范围和推广力度,根据各业务部门不同业务场景和业务需求,结合平台自身 技术优势,实现面向不同场景多维度建模,完成多类型数据模型设计,在大额数 据分析、客户异常交易行为分析、洗钱和恐怖融资、客户风险监测与预警等方面 已经取得一定效果。项目社会效益表现在以下几个方面。

(1)由于资金链分析平台本身技术特点,节省了系统资源,降低了运营成本。

(2)在资金链分析平台投产前,传统数据分析工具在模型设计和运行效率方面存 在先天不足,影响了模型结果数据准确性,而且数据验证过程繁杂且效率低下,需要 投入大量人力才能完成相关工作;而在资金链分析平台投产后,提高了数据准确率从 而大大降低人力成本,并且防范错报、误报和漏报风险。

(3)反洗钱黑名单确认和验证。业务部门根据反洗钱大额报送报告结果,通过资 金链分析平台对部分洗钱疑似客户交易数据进行建模分析验证,进一步验证确认反洗 钱黑名单,上报中国人民银行。

(4)客户风险监测和预警。通过资金链分析平台对某客户交易情况模型分析,了解客户资金情况,提前获悉客户是否出现风险可能性,提前做好风险防范措施,如向 各支行下属风险提醒,做好重点监测客户的风险防范,避免风险发生。

(5)贷款风险监测与预警分析。通过资金链分析平台分析客户交易情况,分析 客户关联账户资金交易情况,可以了解贷款用途是否合法,贷款资金是否流入民间借 贷、股市、赌场等其他非法场所。

(6)业务部门根据客户资金运转状态分析报告能提前了解客户需求,为客户订制 专属服务,从而提高客户满意度和黏度。

四、应用效果

从项目立项到项目落地实施,我行各级领导予以高度支持,经过项目组成员

努力,资金链分析平台于 2017 年 1 月成功上线至今,项目实施效果显著,具体 如下。

第一,降低系统资源,提升系统运行效率。资金链分析平台具有系统性能稳 定、系统配置要求低、存储空间少,能大幅降低硬件成本,同时数据接口简单清 晰,采用文本交互,运行效率高,千万级交易数据能在分钟级完成。

第二,降低洗钱和恐怖融资误报率,提高从业人员工作效率。资金链分析平 台采用大数据最新算法引擎(包括闭环法和聚类式),支持多维度数学建模、高效 的计算机算法运算,在提高系统效率的同时提高命中率。

第三,降低风险,提高我行资产质量。资金链分析平台根据客户日常交易行 为分析,跟踪掌握客户贷款资金用途、客户资金动向,提前预测客户资产变动状 况,预测风险和客户需求。

第四,发掘银行产品销售客户群体,提高跨部门交叉营销水平。资金链分析 平台根据客户日常交易行为分析,提前预测客户需求,根据客户需求设计专属产 品,提高客户满意度和客户黏度。

第五,通过资金链分析平台技术研究,建立我行大数据技术团队,培养我行 科技自主创新能力,提升我行对复杂数据分析技术处理能力。

作者:广东顺德农村商业银行      郭海文

本文由新知号原创发布,转载请注明来源。
联系方式:system@shangyexinzhi.com
2000+知识点 7000+案例
商业新知助力数字化转型
下载