评分卡模型变量分箱体系(Python实操)

科技   2024-12-03 19:48   北京  

100天风控的评分卡模型篇已经进行一段时间了,分享下目前风控模型中常用的几种分箱算法,以及Python的代码实现。

1. 等频等距分箱

等频/等距分箱是最简单基础的分箱方式,定义如下:

  • 等频分箱:将整体样本量切成N等分,即每箱的样本数量相同。

  • 等距分箱:将变量按照固定的长度距离分箱,即每箱的区间范围大小相同。

2. 决策树分箱
3. KS分箱
1)原理
通过KS指标可以求得让好坏客户分布差异最大化的分箱点,而BestKS分箱方法就是基于KS指标实现的。
2)计算步骤
以连续型变量X为例,其具体做法是:
①先対变量值进行排序
②计算每个变量值对应的KS
③选取KS最大所对应的变量值XT,然后以XT将当前样本划分为两部分(X<=XT)和 (X>XT)
④对于每个样本循环重复步骤2-3,直到触发了停止条件的任何一条
3)停止条件
停止条件就是让以上步骤不再继续分箱的条件,一般可以包括:
①划分以后每个分箱的样本量占比小于一定的阈值,比如5%
②划分以后每个分箱对应的y标签全部为好客户或者坏客户
4. 卡方分箱
....
以上内容节选自👉100天风控专家》评分卡模型篇,分箱方法的理论+代码共80min,代码包括手动实现、模型算法包调用实操两部分(如下展示)。

历史风控精选文章:

基于交叉表制定风控规则

CART决策树制定风控规则

决策树生成规则可视化(升级版)

风控“规则集”的性能测试(Python实操)

风控“规则集”的A类调优(Python实操)

风控规则的A类调优:拒绝客户坏账预测

一文读懂风控策略调优方法体系

信贷风控中是如何做拒量回捞的?

信贷风控中是如何做策略收紧的?

信贷风控中如何平滑的做收紧?

信贷风控中的置入置出策略是什么?

大厂风控策略是如何做收紧的?

大行的额度策略是如何设计的?

大行的额度收入测算是如何做的?

--end--

以上内容节选自👉100天风控专家
从0到1的信贷风控训练营

Python数据科学
以Python为核心语言,专攻于「数据科学」领域,文章涵盖数据分析,数据挖掘,机器学习等干货内容,分享大量数据挖掘实战项目分析和讲解,以及海量的学习资源。
 最新文章