银行数据挖掘(银行数据挖掘的运用及效用研究)

文/昆仑银行运营服务中心郭扬琴现代商业银行的竞争日益激烈。为了争夺客户资源,提高经营效率,银行在降低人力成本的同时,提高了业务办理效率和服务水平。随着金融科技的

文/昆仑银行运营服务中心郭扬琴

银行数据挖掘(银行数据挖掘的运用及效用研究)插图

现代商业银行的竞争日益激烈。为了争夺客户资源,提高经营效率,银行在降低人力成本的同时,提高了业务办理效率和服务水平。随着金融科技的深入发展,银行在柜面业务中引入集中业务处理机制,逐步将前台业务搬到后台,并在后台建立了一套标准化、流程化的处理模式,进一步提高了集约化的业务操作水平。

银行采用集中业务后台处理后,业务处理效率大大提高。但在操作过程中,发现部分处理流程耗时较长,影响了业务的高效运行。为了完善和深化集中业务处理模式,有必要分析问题产生的原因,寻找解决办法,采取积极的管理对策。

理论来源

关联规则算法主要用于发现数据集中项目之间的关联关系,揭示数据项之间的未知关系,并基于样本的统计规则挖掘关联规则。根据挖掘出的关联关系,可以从一个属性的信息中推断出另一个属性的信息。当置信度达到某个阈值时,该规则可以被认为是有效的。

本文通过对业务集中运营项目的分析,提取影响业务耗时的相关因素,采用关联规则算法探索业务耗时与业务因素之间的关系,制定有针对性的解决方案,提高业务办理效率。

具体做法

1.整体分析法

这个耗时的业务分析的整个过程如图1所示。提高业务处理效率,找出影响业务处理的关键规则,为改善业务耗时提供参考。此挖掘建模的主要目标如下。

图1 业务耗时分析建模流程图图1业务耗时分析建模流程图

首先,根据集中业务处理过程中的相关因素,挖掘因素与耗时之间的相关性。二是进行关联分析,提取最有效的关联信息,提出优化分析建议。

2.具体的分析方法和过程

(1)数据采集。一是从集中业务系统中提取近一年个人存款开户和综合合同业务交易近80万笔,筛选出耗时6分钟以上(全过程平均时间约3分钟)的异常交易9000笔。二是通过业务集中系统导出前台柜员与后台业务集中处理中心工作人员因业务错误产生的通信数据。第三,通过集中业务系统查询9000名客户的年龄、职业等相关数据。

为了论证这个案例,敏感数据被变形了。

(2)经营形势分析。分析个人存款开户和综合合同业务的数据。

第一,耗时7分钟以上的业务仅占1.6%,该业务整体办理效率较高。二是对异常业务的分析(耗时6分钟以上):业务处理包括全录入、全审核、错误处理、前后台沟通等环节。第三,上述异常业务中,前后台平均沟通时间为201秒,其他环节合计最长不到110秒。

综上所述,个人存款开户和综合签约异常业务之所以耗时较长,主要在于沟通时间长。接下来我们就来深挖一下沟通时间长的原因。

(3)数据预处理。一种是对提取的通信数据进行处理,计算每个任务号的通信时间,通过任务号匹配耗时业务。二是分析业务日期、办理时间、机构、年龄、职业、沟通时长等数据。,并消除不完整的数据。

(4)数据失真。由于Apriori关联规则算法不能处理连续的字符集数据,为了将原始数据格式转换成合适的建模格式,对数据进行了离散化处理。通过聚类和分类的方法将记录中的属性离散化:业务日期分为三类:工作日、休息日和节假日;处理时间点聚类为四类:早高峰(8-10点)、早低峰(10-12点)、中午低峰(12-14点)、下午高峰(14-19点);和机构都聚集到东北和东北。年龄段分为四类:未成年客户(18岁以下)、中青年客户(18-35岁)、中年客户(35-51岁)、老年客户(51岁以上)。职业分为三类:低知识顾客、中等知识顾客和高知识顾客。将沟通时间分为短、长两类(以5分钟为限),并对每一类的数据进行分析。利用关联规则算法,挖掘上述属性的关联关系。对原始数据进行预处理后,根据聚类标识形成建模数据。

表 1? 聚类数据代码表1表聚类数据代码表

(5)模型构建。这种耗时的业务关联规则建模的流程图(参见图2)。

图2 关联规则模型流程图图2关联规则模型流程图

该模型主要由输入、算法处理和输出组成。输入部分包括建模样本数据和建模参数的输入。处理部分是Apriori关联规则算法,输出部分是关联规则的结果。

模型的具体实现步骤是:首先设置建模参数的最小支持度和置信度,输入建模样本数据,然后利用Apriori关联规则算法对建模样本数据进行分析,以模型参数的最小支持度、最小置信度和分析为条件。如果所有的规则都不满足条件,就需要重新调整模型参数,直到关联规则的结果输出。

对于如何设置最小支持度和最小置信度,目前还没有统一的标准。根据业务经验设定初始值,然后经过多次调整得到符合业务的关联规则结果。本次挖掘经过多次调整,结合实际业务分析,选定模型的输入参数为:最小支持度10%,小置信度0.95。模型运行完成后,关联规则的结果如表2所示。

表 2? 关联规则结果表2表关联规则结果表

(6)模型结果分析。根据上述运算结果,得到若干条关联规则,并提取出有意义的关联规则。通过分析可以得出以下结论:第一,工作日、客户知识水平低、北疆、沟通时间长等属性关联度较高,支持率为14.5%;二是工作日、早高峰、中青年客户、沟通时间长等属性关联度较高,支持率为13.5%;第三,工作日、早高峰、陕西地区、沟通时间长等属性关联度较高,支持度为13.5%。

实施效果及推广应用

通过关联规则的挖掘结果,对银行网点提出以下建议:一是在时间上,各网点应在工作日早高峰时段(8-10点)增加柜台人力资源的配置;二是区域方面,加大北疆地区网点柜员培训力度;第三,在客户方面,尽量将知识面较低的中青年客户(如28岁的环卫工人或农民)分配给有经验的柜员。

关联规则可以广泛应用于企业经营、挖掘经营风险的关键因素等诸多方面。为优化业务流程、完善业务系统功能指明了方向,为提高业务效率提供了数学理论支持。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/128743.html

发表回复

登录后才能评论