大厂风控策略是如何做收紧的？

科技 2024-11-20 23:06 北京

风控策略调优是策略分析师必备技能，本篇对收紧策略的方法论，以及一些步骤、操作方法进行了汇总，内容节选自《100天风控专家》策略调优篇。

一、策略收紧调优的方法论

D类调优可分为宏观和微观两个层面的。

1）宏观层面：对“整体风险客群”的收紧，而非某个具体维度的客群；

2）微观层面：对某个维度的客群（非整体）进行策略收紧，以达到优化策略效用的目的，具体方法包括了策略收紧、策略替换、策略新增。

本篇重点介绍策略规则的收紧。

二、策略收紧

1）概念理解

策略收紧（狭义上理解）这里特指，对规则或模型的阈值进行收紧调整，将原通过的客群进行一定比例的拒绝，以达到降低逾期率的目的。注：这里的策略收紧指的是狭义上的理解，一种具体的方法，仅对规则或模型本身的阈值进行调整，不借助其他变量（比如策略新增、策略替换）。

2）适用对象

策略收紧的分析方法同时适用于规则和模型（因为模型本身就是一个强规则）。规则是微观的调整，调整范围小，而模型是宏观调整，收紧的调整范围更大，比如对主模型融合模型的风险等级进行收紧拒绝一类风险客群，那将会大幅度的降低通过率和逾期率。

3）方法特点

策略收紧是通过有贷后表现的样本分析后制定的，和A类调优的阈值放松相比，有更好的量化分析条件基础，分析过程更容易。

1. 阈值收紧的分析步骤

1）调优需求：政策指导、市场变化导致资产质量变差、监控报表发现逾期率升高等

2）提取样本：挑选合适的历史样本（代表性、充分性、数据可回溯性、时效性），并且回溯数据（具体可参考模型篇“样本设计”内容）

3）寻找风险：一般遵循“从大到小”的顺序向下拆解逐个分析和排查出风险点（寻找可优化点）

4）量化分析：对分析对象(规则或模型)进行分箱，统计分箱下的样本数量、区间坏账率（bad rate ）和Lift值等评估指标，确定可调优的对象。

5）制定策略：执行策略调整方案(可能有多个)，对比分箱下bad rate和大盘风险指标，制定阈值收紧策略

6）效果测试：在“历史样本、近期样本”上执行收紧策略，对通过率、逾期率进行效果测算，与收紧前对比。如效果未达预期需重新调整策略后再进行评估，直到满足要求为止，完成最终调整方案的确定。

7）策略上线：决策引擎配置策略后，进行灰度测试或者AB测试，最后再正式上线

2. 量化分析

策略分析人员通过监控报表发现，近期FPD7+的首逾指标不断升高，达到风险预警线需要进行策略调整。假设经过分析发现了贷前策略的“规则集”在通过样本上的风险较高，此时我们需要对该规则集内部的规则进行量化分析。

对规则集内部所有的单个规则进行分箱处理，并计算分箱下的区间坏账率 bad rate 和Lift，对比找出 Lift 值较大的，结合业务逻辑来确定可调优的规则对象。比如下面是其中一个xx类的规则，它在线上已有的判断逻辑是：>=4时命中拒绝，否则未命中通过。分析后发现已通过样本的 [3,4)区间对应的 Lift=3.87>3，在所有规则中最高（bad rate接近31%，远高于大盘平均风险水平7.95%）。

3. 制定策略方案

制定策略优化的方案是一个分析的过程，确定好之后需将策略用代码在当前离线分析环境下执行。

右侧的函数ruleset_calc为执行策略的Python代码，将调整后的策略执行后计算规则集的综合命中率、单一命中率、自然命中率，主要用于反映规则集命中的变化情况、以及内部规则互相之间的影响。

4. 效果测算

效果测试主要是评估，调整前后策略对于“通过率、逾期率”的变化影响。理论上来说，做规则阈值收紧的D类调优后，通过率和逾期率会同步下降，如何去评估调优后的效果呢？

可以“对比通过率和逾期率下降的幅度”来评估是否有效。因为通过率和逾期率的量纲不一致，对比绝对值是没有意义的，因此可对比相对值。比如收紧调整后，逾期率下降幅度为20%，通过下降幅度为6.79%，说明逾期率下降的程度更多，即牺牲了少部分好客户拒绝了更多的坏客户。

此外还要注意，如果是日常策略调整（微调），业务上不允许大幅度的下降通过率，这会直接导致业务不稳定；如果是做大规模的收紧调整，通过率下降幅度较大的情况，则需要更详细的效果测算。

可以从“成本收益”的角度进行测算。按照“其他成本(资金成本、人力成本、投放成本、运营成本、数据成本等)+风险损失成本>=利息+罚息”的公式，如果策略收紧调整后，增加拒绝的客群中，成本总和超过了收益总和，则认为策略是有效的。不过该测算过程需要额外补充和匹配还款相关的数据，另外其他成本项也需要进行合理的预估。

三、策略新增

D类调优可分为宏观和微观两个层面的。

1）概念理解

策略新增就是，在不改变已有策略的基础上（保持不变）额外增加新的策略，来达到策略调优的目的，一般应用在D类的收紧策略中。

2）使用场景

使用策略新增，通常的需求是 “已有策略没有收紧的空间，即通过已有策略的调整无法满足业务要求，需要其他维度的信息补充”。比如贷前场景中发现近期的风险逐渐升高，需要做收紧的调优策略，但经过通过样本的量化分析后发现没有调整空间，此时可考虑接入新的三方数据源作为补充。基于新的数据维度制定规则策略，补充到决策流程中。因为已有策略不变，额外增加了新的审批策略，通过率会下降。

1. 分析步骤

1）调优需求：政策指导、市场变化导致资产质量变差、监控报表发现逾期率升高等

2）提取样本：挑选合适的历史样本（代表性、充分性、数据可回溯性、时效性），并且回溯数据（具体可参考模型篇“样本设计”内容）

3）策略开发：单变量规则、二维交叉规则、决策树生成多维规则组合（具体可参考策略开发篇内容）

4）制定策略：将新增策略融入旧策略中，执行策略

5）效果测试：在“历史样本、近期样本”上执行策略，对通过率、逾期率进行效果测算，与新增前对比。如效果未达预期需重新调整策略后再进行评估，直到满足要求为止，完成最终调整方案的确定。

6）策略上线：决策引擎配置策略后，进行灰度测试或者AB测试，最后再正式上线

2. 策略开发

1）规则策略的几种形态

策略新增的过程其实就是“策略开发”，即分析变量区分效果并制定规则的过程。

以规则为主的策略形式主要包含基于单变量的规则、二维交叉的规则、基于决策树生成的多维交叉规则这几种。如右侧所示，从上到下，其特点可以归纳为：“随着维度更多，复杂度增加，同时命中率更低，识别能力更加精准”。

最终需要综合考虑对“逾期率、通过率”这两者的影响来决定使用哪种形式。

2）二维交叉规则示例

下面是一个二维交叉的规则组合，评估交叉格子中的区间坏账率(Lift)和样本数量占比，反映对于逾期率、和通过率的影响。

3. 制定策略&效果测算

在策略调优的需求下，新策略开发只是其中一环，能否融入旧策略中，还需要测算整体策略的效果，主要的关注点是新策略能否带来增益，一是额外命中的比例有多少？二是评估新增后对“逾期率、通过率”的影响。

在进行效果测算时，需要注意以下几点：

1）要将已有策略和新策略的数据，用“同一批样本”进行分析。这样制定新策略后才能与旧策略融合，以进行综合效果评估。

2）新策略风险区分效果好不一定就可以对旧策略带来增益。可能二者的相关性较高，或者重叠度较大，大部分是重复命中的，那么新增后也不会有多大提升效果。因此，该部分的数据分析流程：可先进行相关性的分析，或者做二维交叉的决策矩阵，看分布下是否“互有单调性”，最后再通过命中率的测算来看最终效果。

四、策略置换

1）概念理解

置换策略，又叫“swap-in-swap-out”置入置出策略，是通过设计一个全新的策略来替代已有旧策略的优化方法。它与规则阈值收紧、策略新增不同，不是在已有策略上做调整、新增或者收紧，而是完全替换。该优化方法在策略的优化迭代中频繁使用，是策略分析师必备的技能之一。

2）业务场景

置换策略既可以应用在A类调优，也可以应用在D类调优场景中。通过置入置出，可以实现“保持通过率不变，降低逾期率”或者“保持逾期率不变，提高通过率”的目的。

3）置换对象

置换对象可以是以规则为主的策略，也可以是以模型为主的策略。例如，模型策略的置换，近期通过监控报表发现，线上主模型KS指标持续下滑，为此模型团队迭代了一版新模型，交付给了策略团队。策略团队需要做一件事情：从业务角度，对新/旧模型进行离线对比测试，此时就需要用到置换策略，即对模型的置换分析。

1. 什么是置入置出？

所谓“置换”，包括置入和置出两部分，什么是置入置出呢？

举例说明下。右侧是模型迭代前后的置换分析示例，展示了新旧模型在通过和拒绝状态下样本的浓度，其中绿色样本代表好客户，红色样本代表坏客户。

置入：旧模型(策略)拒绝的，而新模型通过的
置出：旧模型(策略)通过的，而新模型拒绝的

在这个示例中，置换就是新旧模型在决策上的“差异部分”，可以看到，置入部分的坏客户浓度要低于置出部分。

2. 置入样本坏账率预测—离线预估

经过前面计算后，获取了置入部分的坏账率预估，结果如下。

1）通过率对比

新模型通过率为86.29%，旧模型通过率为80.81%；

2）逾期率对比

新模型置入部分的坏账率为6.65%，置出部分的坏账率为37.79%；

新模型通过部分的坏账率为4.84%，旧模型通过部分的坏账率为7.79%。

3. 代码实操（节选）

--end--

以上内容节选自👉《100天风控专家》策略调优篇（如下所示）。

左可试看，右可咨询

Python数据科学

以Python为核心语言，专攻于「数据科学」领域，文章涵盖数据分析，数据挖掘，机器学习等干货内容，分享大量数据挖掘实战项目分析和讲解，以及海量的学习资源。

最新文章

快速学会登上nature的热门算法，LSTM！

被导师放养，后果可能很严重。。。

245个目标检测开源项目合集，建议收藏！

评分卡模型变量分箱体系（Python实操）