风控闭环搭建方法（风控决策矩阵的开发与场景应用）是怎么回事？

cht 2023-07-11 5次阅读

风控决策流程是信贷风控的主心脉络，这套风控框架的设计往大了说决定了后续风控的种种流程，往小了决定了后续策略调优的各种细节，关于决策流程以往的文章，相关有：

基于串行规则流的黑名单跟准入

信贷策略中的决策矩阵

...

今天，会根据风控中的决策流程，再跟大家讲解风险流程中的决策矩阵的实操内容。

我们知道金融产品大多的风控决策流程会由策略、模型两部分构成（也有只有策略或仅有模型的决策流）。

用户进件申请先后会通过策略、模型的串行节点，并根据对应模块的策略规则、模型分数的阈值，决定用户后续授信环节的通过与拒绝。但是在这种单向评估用户的风险程度对准确率均有一定影响，为了更有效地对用户风险进行评估，现探究策略与模型的并行交叉结果，综合分析用户的风险程度，于是我们引入目前较为常用的模式：策略&模型的决策矩阵分析的分析方法。

串行决策：

风控闭环搭建方法（风控决策矩阵的开发与场景应用）(1)

编辑切换为居中

添加图片注释，不超过 140 字（可选）

并行决策：

风控闭环搭建方法（风控决策矩阵的开发与场景应用）(2)

编辑切换为居中

添加图片注释，不超过 140 字（可选）

在具体的实操案例中，我们以模型1跟策略2进行具体的举例说明：

模型1中，根据风险评分划分的客群风险得分为：A、B、C、D、E（这些风险是由低到高排序：A—高风险、B—较高风险、C—中风险、D—较低风险、E—低风险）。根据model_score区间阈值设定如下：

风控闭环搭建方法（风控决策矩阵的开发与场景应用）(3)

编辑

添加图片注释，不超过 140 字（可选）

在策略2中，根据策略划分的风险等级也可划分为：N、L、H、D（风险由低到高，其中N—正常、L—低柔、H—高柔、D—刚性，取规则集rule_01-rule_10最高风险等级），各规则等级根据rule区间阈值设定如下：

风控闭环搭建方法（风控决策矩阵的开发与场景应用）(4)

编辑

添加图片注释，不超过 140 字（可选）

风控闭环搭建方法（风控决策矩阵的开发与场景应用）(5)

编辑

添加图片注释，不超过 140 字（可选）

于是根据以上模型与规则的二维交叉矩阵，就能得到规则&模型的内容，我们称之为风险决策矩阵。

风控闭环搭建方法（风控决策矩阵的开发与场景应用）(6)

编辑

添加图片注释，不超过 140 字（可选）

(相关课程中涉及的其中一种模型)

...

在风险决策矩阵中，除了以上最基础的模型外，有时候我们还将用到一些深度化的内容如风险的二级、三级矩阵，比如在授信或者定额场景中，二级矩阵更是比一级矩阵常用些。

决策矩阵的思想，也就是将两个离散化处理后的特征进行二维交叉，然后根据每个组合单元的数据表现来决定是否可以作为规则，其中数据表现与单维度分析方法一样，也是通过单元组合下样本的坏账率（badrate）与占比（percent）来分析。二维特征交叉组合的原理结构如图1所示，这里需要注意的是，在选取某个组合作为策略规则时，最好是矩阵表的边角组合，可以是单个多区间，例如示意图中的X1-bin1与X2-bin1组合、X1-bin4与X2-bin4组合等，其原因是为了保证规则的业务解释性与分布稳定性。

风控闭环搭建方法（风控决策矩阵的开发与场景应用）(7)

编辑

添加图片注释，不超过 140 字（可选）

图1 二维交叉组合原理

这里我们以特征X03（在我司贷款逾期最高天数）与X08（欺诈风险等级）为例，来介绍下二维特征交叉规则的原理逻辑。输出分布结果如图2所示。

风控闭环搭建方法（风控决策矩阵的开发与场景应用）(8)

编辑

添加图片注释，不超过 140 字（可选）

图2 二维特征交叉结果

由以上特征X03与X08的交叉结果指标（badrate与percent）分布可以看出，X03=5与X08=3交叉组合下样本群体的坏账率badrate达到55%，约为整体样本坏账率（18.65%）的3倍，而且样本占比仅有1%，满足二维特征规则开发的指标分布条件。同时，此区间对应X03与X08取值，在场景理解上也是完全满足业务逻辑的，也就是X03（在我司贷款逾期最高天数）与X08（欺诈风险等级）的取值越大风险表现越高。综上分析，根据特征X03与X08开发出的二维规则为“在我司贷款逾期最高天数（X03）>=5，且欺诈风险等级（X08）>=3，拒绝”。

对于其他特征二维组合，可以按照以上分析逻辑来实现，其中有个细节需要说明，针对连续型特征的交叉组合，在构建矩阵之前一定要对特征进行分箱离散化处理，然后根据离散区间来实现二维特征的决策矩阵。

多维特征决策树模型

多维特征的综合策略开发，决策树模型是非常有效一种实现方式，不仅原理逻辑简单，而且实现过程也较为方便。但是，在特征变量较多的情况下，采用决策树开发策略规则时，模型参数max_depth（树的深度）不要设置太大，主要原因是这样的规则虽然从区分度结果表现来看是比较好的，但在后期应用过程中很容易出现波动的情况，这是由于规则的特征复杂度引起的。因此，通过决策树模型算法开发规则时，参数max_depth最好定义在3~10范围之内。此外，模型训练拟合的特征变量，最好是经过特征工程筛选后的性能较优字段。

这里我们采用决策树回归算法来实现多维特征策略规则的开发，模型训练的拟合变量为X01~X10，具体实现过程参见第79期会员直播课程，最终输出的决策树结果通过可视化展示如图3所示。

风控闭环搭建方法（风控决策矩阵的开发与场景应用）(9)

编辑

添加图片注释，不超过 140 字（可选）

图3 多维特征决策树结果

根据决策树可视化结果，我们可以很方便的归纳出合适的策略规则，图中每个粪桶的samples代表当前区间的样本数量，value代表当前区间样本的坏账率，每个叶子单元的颜色代表了响应率的程度，颜色越深说明坏账率越高，也就是更适合作为策略。此外，需要注意的是，图中字段名称仅代表特征索引，以X9为例，X9具体是指样本数据的第10个特征（X0为第1个特征）。按照以上决策树分布结果与分析思路，可以得到相应的策略规则分别如下：

（1）当贷前申请信用风险评分（X10）<=491，拒绝；

（2）当贷前申请信用风险评分（X10）>491，且近6个月手机APP卸载次数（X05）>183，拒绝；

（3）当贷前申请信用风险评分（X10）>491，且近6个月手机APP卸载次数（X05）<=183，且近1年信贷违约账户数（X02）>5，拒绝。

综合以上内容，我们围绕实际业务场景，给大家全面介绍了风控策略的探索开发与测试评估等重要内容，欢迎各位童鞋来番茄课堂来听取第78期与79期课程，课程部分资料参考如下：

编辑

添加图片注释，不超过 140 字（可选）

风控闭环搭建方法（风控决策矩阵的开发与场景应用）(11)

编辑

添加图片注释，不超过 140 字（可选）

以上内容参考至课程：

第78期《信贷场景多维特征交叉策略的实战分析》

第79期《信贷风控策略体系效果评估与全面调优》