德胜云资讯,添加一些关于程序相关的内容,仅供大家学习交流(https://www.wxclwl.com)

网站地图

搜索
德胜云咨询
人工智能分类 机器学习 数据分析 图像处理 语言模型
热门标签:
最新标签:

风控数据分析主要是做什么信贷多头数据的维度介绍与风控应用风控数据分析主要是做什么工作硬核推荐,

日期:2023/04/05 13:17作者:荣姿康人气:

导读:在金融信贷领域中,数据是风控体系的最核心元素,无论是策略规则的开发,还是评分模型的建立,都是围绕众多维度数据进行搭建的。在常用数据的系列体系中,...

在金融信贷领域中,数据是风控体系的最核心元素,无论是策略规则的开发,还是评分模型的建立,都是围绕众多维度数据进行搭建的。在常用数据的系列体系中,多头数据是一类应用价值比较大的维度,在信贷风险识别、用户群体分类等方面具有非常好的效果。

多头数据具体是指多头借贷数据(Multiplatform Loan Data), 反映了借款人在两家及以上机构申请借贷的行为,在实际业务中也可以称为多头负债数据。因此,通过用户的多头数据,可以很直观地判断用户后期还款能力的高低,除了欺诈特殊情况外,借款人的申请机构数或借贷金额越多,其还款风险也就越大。

1、多头数据维度

多头数据在实际风控应用中,有多个常用类别维度,包括申请机构数量、借贷成功数量、借贷失败数量、还款成功数量、借贷逾期数量、借贷平台类型、借贷金额、逾期金额等。对于每个类别,根据具体时间窗口又可以进一步构造更多指标,常见的有近1个月、近3个月、近6个月、近12个月、近24个月、历史等维度。现通过多头借贷的申请、放款、还款、逾期四个环节,分别介绍下多头数据的具体字段。

(1)申请环节:

申请多头字段主要根据注册、申请、通过、拒绝等流程节点进行变量构造的,同时围绕行为频次、平台机构又分为两个大的维度,这也是其他阶段字段的共同之处。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图1 申请多头字段

(2)放款环节:

放款多头字段主要包括放款次数、放款机构数、放款金额、验证码次数等维度,其中放款金额可以进一步区分放款总金额、单笔最大金额、单笔最小金额、单笔平均金额等。对于验证码相关信息,不仅仅在放款阶段具备,在申请阶段也是存在的,因此可以扩展更多维度的验证码通知次数、验证码通知平台数等字段。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图2 放款多头字段

(3)还款环节

还款多头字段主要从还款提醒次数、还款金额大小、还款成功/失败状态等子维度进行指标构建,其中对于还款金额,可以进一步加工出最大、最小、平均等统计学维度的字段。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图3 还款多头字段

(4)逾期环节

逾期多头字段主要从逾期金融、逾期时长、逾期还款状态共三个维度进行扩展,对于逾期金融与逾期时长,同样可以采用最大、最小、平均等进行量化;对于逾期还款状态可以包括逾期未还、逾期已还部分、逾期已结清等情况。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图4 逾期多头字段

2、多头数据衍生

从前边介绍可知,多头字段的类别与数量是比较多的,但在实际场景应用中,尤其是风控模型的建立,往往在特征工程阶段,会根据基础变量会进一步衍生加工,从而得到更多维度的字段,不仅有利于模型区分效果的提升,而且可以扩大模型的业务信息维度。

根据前边对多头字段的描述,我们从申请环节多头类型中,选取某一个子维度字段为例(图5),给大家简单介绍下特征衍生加工的常用统计学方法,主要是平均、占比、差分、差比等方式。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图5 特征基础字段

从申请次数、申请被拒绝次数两个子维度,并结合不同时间窗的划分,可以衍生加工出图6所示的新变量,数量是原来基础字段的2倍多。假设在数据建模流程中,初始变量池的字段共有100个,经过特征工程的衍生加工后,可以扩大为300+个字段,这样可以有效提升模型训练拟合的效果。如果基础变量的维度较多,衍生得到具有业务解释性的特征字段会更多,这种思路无论对策略开发,还是模型建立都是非常有意义的。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图6 特征衍生字段

当然,在多头字段的具体使用过程中,难以避免的部分字段的相关性较强,因此需要对变量池的所有字段进行相关性分析,例如pearson、spearman系数等,从中将相关性较强(例如corr>0.7)的特征进行剔除,从而避免最终模型的区分度较差、共线性较强等问题。

3、风控特征应用

在信贷产品的风控体系中,主要由策略与模型两个模块构成,对于每个模块的架构,都需要根据特征变量的逻辑进行搭建。对于多头字段的应用,同样适用于或策略或模型的开发。由于多头借贷数据的业务特殊性,可以直观反映出用户的风险信息,因此多头字段在很多金融机构的实际业务场景中,会优先考虑将其作为策略规则字段来使用。现举几个例子进行说明,具体如图7所示。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

图7 多头字段的策略应用

根据多头字段加工的风控策略规则,很多情况下可以直接作为准入条件来使用,例如近3个月逾期次数、近6个月逾期金额等。无论所属策略是刚性规则(直接拒绝),还是柔性规则(保留标签),多头特征在风控策略模块中发挥着很好的效果,贷前环节可以有效识别申请用户的风险,贷中环节可以对存量用户风险进行监测分析。

除了策略规则的应用,多头字段在评分模型方面也有很好的价值。一方面可以作为基础字段,与其他维度字段(消费、设备等)形成模型拟合的变量池,另一方面可以将所有多头字段集中在一起,单独开发多头信息评分模型。但是,建立多头模型的过程中,为了体现模型后期上线的应用效果,在数据建模的特征工程阶段,务必要对特征变量的信息值(IV)、相关性(pearson)、共线性(VIF)等指标进行多维度分析,从而筛选出相对更有贡献效果的字段。

综上所述,多头字段在金融信贷业务的风控体系中,具有非常重要的应用价值,采用多个维度的评估分析思路,以及特征工程方法,可以较大程度地发挥多头字段的效果,从而为实际业务带来很好的效益。

....

~原创文章

排行

网站地图

Copyright © 2002-2022 香港德胜云网络 版权所有 | 备案号:蜀ICP备2023007363号-5

声明: 本站内容全部来自互联网,非盈利性网站仅供学习交流