5个风控模型评估指标,风控人必知!!!

文摘   Science/technology   2024-09-02 08:32   广东  

模型评估是整个建模周期中基础且核心的部分。选择恰当的评估指标,可以使模型训练和测试事半功倍。


模型训练后,我们需要对刚训练出来的模型通过一系列指标进行关于稳定度、区别能力等效果的度量。


本文主要介绍以下常见评估指标:


  • 评估模型稳定度指标PSI、CSL;

  • 评估模型区别能力指标AUC、Gini、KS。


PSI (Population Stability Index)


可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。


PSI最早应用于评估评分模型的稳定性,但是,PSI指标在风控策略、产品利率等多方面也是有应用的。


其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化


PSI小于0.1时候模型稳定性很高,0.1-0.2一般,需要进一步研究,大于0.2模型稳定性差,建议修复。


PSI的计算公式=SUM((Actual % - Expected %)*(LN(Actual % / Expected %)。


CSICharacteristic Stability Index 


CSI用来衡量样本在特征层面上的分布变化,反映了特征对评分卡分数变化的影响。


能帮助我们理解入模特征变量对模型分数波动的影响以及背后的客群分布偏移原因。这对风控模型不稳定时追溯定位原因具有重要意义。


CSI的计算公式可以写成:


GINI指标基尼系数


Gini系数是国际上通用的,用以衡量一个国家或地区居民收入差距的常用指标,所以,应用在评分模型中它也是表征评分模型的区分能力。


Gini的计算公式:



cpY是收入排序后的累计比例,cpX是人口的累积比例,其结果是一个秩相关系数,很多统计软件包比如SAS提供的Some’s D,其实就是Gini系数。


在评分卡中,可以看下面表来理解下Gini的计算过程:



其中,G_num代表好客户数量,B_num代表坏客户数量,Retain代表累积。


KS指标


在金融风控领域中,常用于衡量模型对正负样本的区分度。通常来说,值越大,模型区分正负样本的能力越强,一般0.3以上,说明模型的效果比较好(申请评分卡)。


其定义如下:


KS=Max{|retain_bad_pct - retain_good_pct|}


AUC指标


说起AUC就不得不提ROC曲线。


ROC 曲线,显示分类模型在所有分类阈值下的性能的图表。该曲线绘制了两个参数: TP Rate和FP Rate。



AUC (ROC曲线下的面积),AUC测量整个ROC曲线下的整个二维区域。


  • AUC的值范围为0到1。

  • 预测错误100% 的模型的AUC为0.0

  • 具有100% 个正确预测的模型的AUC为1.0。


通常来说,AUC的值位于[0.5,1]上,在AUC>0.5的情况下,AUC的值越接近1,就说明其诊断的效果越好。


一般的,一个诊断方法的AUC在(0.5,0.7]时说明其有较低的准确性,AUC在(0.7,0.9]是就说起有一定的准确性,AUC的值大于0.9时就有较高的准确性。


当诊断方法的AUC=0.5时,其没有诊断价值,若AUC<0.5是不符合实际情况的,一般极少出现。其实说白了AUC就是一个评价一个分类器好坏的指标。


看到这里,如果你想学习更多指标的计算方式与计算逻辑如PSI 、GINI、KS、AUC等以及各指标之间的区别与应用场景;想更高效提升量化风控方向的模型技能

如果你想对上述提及的模型评估指标感兴趣,想更深入学习模型知识。可以看一下由FAL联合特邀科学助教团队和签约讲师(Ollie老师)共同研发此门--「量化风控模型机会创造营」3.0⬇️


添加小金老师微信免费咨询
课程难度、职业规划
量化风控模型机会实战营3.0


课程特色

1、特征工程最全解析(分析+辅助模型)


特征的构建决定了建模的成败,好的特征会让我们在建模的路上事半功倍。可以说建模的流程中大部分的时间都在做特征的构建和筛选。


通过学习单特征构建、多特征筛选、四类主流特征构造方法以及各种特征辅助模型构建特征,全面解析特征工程的“套路”,学会自己进行特征评估和特征构建。


2、二分类模型主流算法全流程精讲(带全流程案例实操)


没有代码基础?本课程包含纯干货的快速SQL、Python入门讲解,帮助您在学习途中扫清工具的障碍。


没有算法基础?本课程将带你从最简单的线性回归入手,逐一串讲各类风控模型常用算法。包括但不限于风控模型中最常用的逻辑回归、到更高级的GBDT、XGBoost、LBGM等。并且结合案例的实操,帮您从理论和应用两个层面完成学习的闭环。


3、全场景评分卡模型体系应用


本课程中囊括了全场景的风控评分卡模型种类,包括:

  • 申请类(贷前)评分卡与各种A卡子模型

  • 行为类(贷中)评分卡与各种B卡子模型

  • 催收类(贷后)评分卡与各种C卡子模型

  • 组合评分卡模型


结合实际的应用场景,无论您将来要进入哪个岗位,都有对应的内容帮助你更好的进行模型应用。


4、学一用三:细化场景建模案例实操(贷中支用)


通过对贷中支用模型开发场景的案例实操讲解,能够进一步细化对于信贷评分模型的理解,从而举一反三,彻底掌握评分卡建模,从样本设计到模型开发模型验证的全流程。从此无论面对何种场景化的模型变种,都可以用相同的“套路”解决。


没有模型体系知识

不论是面试还是工作中,模型体系的建立和掌握是至关重要的。尤其是在求职中,面试官对求职者有没有体系性的模型理解是极为看重,有体系性的理解代表着将来他能有无限的可能性。

通过全面课程学习,可以掌握不同场景下建模全流程开发与应用,包括分析思路与代码能力。具体课程安排如下:

△ 上下滑动查看更多


如果你想系统学习,入行模型岗
扫码添加课程顾问,解锁最适合你的学习方式
↓↓↓扫码↓↓↓

添加小金老师微信免费咨询
课程难度、职业规划
量化风控模型机会实战营3.0


没有项目实操经验

对于社招,最大的门槛不是学历、背景,而是有没有相关项目经验。这简直是所有转岗人士的死穴。FAL怎么为大家“解穴”呢?


1. 教你最实用的“经验”

  • 建模特征处理、构建与选择的经验;

  • 各类子模型的经验,应对各种业务细分场景下如何开发模型的问题;

  • 参数优化的经验,让你快准狠的调整核心参数,模型一步到位,让面试官都感觉到你“经验十足“。

2. 手把手带你过项目,走代码,项目实操就有了

通过FAL自建“鲸抖”大数据实操平台,配置统一实验环境,你可以上机实操项目,让你完整体验到模型开发监控的全流程,再也不怕面试官问细节。


更多这门课程广受学员好评,帮助了很多小伙伴的职业发展更清晰明朗。以下是专属课程学习群记录与学员反馈。



△ 上下滑动查看更多

经过课程优化调整后,新增安排了案例互动代码教学以及企业级数据模型结业作业项目互动实练。

△ 上下滑动查看更多

如果你想快速了解模型岗的行业现况
可以添加我们的顾问老师,解锁入行捷径
↓↓↓扫码↓↓↓

添加小金老师微信免费咨询
课程难度、职业规划
量化风控模型机会实战营3.0

金科应用研院
Make Fintech Easier And Smarter
 最新文章