常常有人问起来,模型和策略之间到底是个什么关系。其实往往,模型是策略流程中非常重要的一个环节:可以直接根据评分卡分数拒绝掉一部分客户,或着根据分数走不同的审批流程、使用不同的额度策略。
那么问题就在于,这个划分的切点到底应该定在哪里?到底违约概率高到什么程度的客户需要走人工电核?这个问题,可不是等频或等距切分就可以随随便便解决的了,下面介绍三种量化的方法。
通过违约率和通过率切分可以说是最简单粗暴的了,但是前提是已经有一个确定好的违约率or通过率。比如说,我就是希望会有30%的客户通过,那就可以找全量样本(需要是无偏的)的分数30%分位数的水平,作为一个切分标准;或者说我希望违约概率在5%以上的样本直接拒绝,那就寻找5%违约概率对应的分值即可。
大家都知道KS值的计算公式为累计坏样本比例 - 累计好样本比例的最大值,也就是说取到最大值的这个点好坏区分是最开的,这个点对应的分数可以说是一个很优秀的切分点了。
以上图为例,粗略来看,700分的时候累计坏 - 累计好达到了最大值,可以考虑作为一个切分点。但是这个点具体是高风险和中风险的分界线,或者是中风险和低风险的分界线,又或是用作其他用途,就要综合考虑通过率和坏样本率来决定了。
模型决策的过程通常是精准率和召回率的权衡,其中精准率precision = TP / (TP + FP),即被判定为坏中实际为坏的比例;召回率recall = TP / (TP + FN),即有多少坏样本被判断为坏样本,简单点说就是累计坏样本率。
而F-score,就是一个综合考虑了精准率和召回率的指标,是它们的加权调和平均值:
其中β是一个用于调整精准率和召回率权重的指标,在下面的例子中我们取β=1,认为两者权重是相等的。
可以看到在600分的时候,F-score取到了最大值,意味着这是在该衡量标准下最有效的切分点。
在本文的例子中,我们得到了600分和700分两个数据层面最优的切点,在实际运算的时候可以切分的更细,得到更加精确的值。然而在真正做决策的时候,用哪个,怎么用,都是要结合违约率和通过率以及其他业务逻辑综合考虑的。
1、特征工程最全解析(分析+辅助模型)
特征的构建决定了建模的成败,好的特征会让我们在建模的路上事半功倍。可以说建模的流程中大部分的时间都在做特征的构建和筛选。
通过学习单特征构建、多特征筛选、四类主流特征构造方法以及各种特征辅助模型构建特征,全面解析特征工程的“套路”,学会自己进行特征评估和特征构建。
2、二分类模型主流算法全流程精讲(带全流程案例实操)
没有代码基础?本课程包含纯干货的快速SQL、Python入门讲解,帮助您在学习途中扫清工具的障碍。
没有算法基础?本课程将带你从最简单的线性回归入手,逐一串讲各类风控模型常用算法。包括但不限于风控模型中最常用的逻辑回归、到更高级的GBDT、XGBoost、LBGM等。并且结合案例的实操,帮您从理论和应用两个层面完成学习的闭环。
3、全场景评分卡模型体系应用
本课程中囊括了全场景的风控评分卡模型种类,包括:
申请类(贷前)评分卡与各种A卡子模型
行为类(贷中)评分卡与各种B卡子模型
催收类(贷后)评分卡与各种C卡子模型
组合评分卡模型
结合实际的应用场景,无论您将来要进入哪个岗位,都有对应的内容帮助你更好的进行模型应用。
4、学一用三:细化场景建模案例实操(贷中支用)
通过对贷中支用模型开发场景的案例实操讲解,能够进一步细化对于信贷评分模型的理解,从而举一反三,彻底掌握评分卡建模,从样本设计到模型开发模型验证的全流程。从此无论面对何种场景化的模型变种,都可以用相同的“套路”解决。
对于社招,最大的门槛不是学历、背景,而是有没有相关项目经验。这简直是所有转岗人士的死穴。FAL怎么为大家“解穴”呢?
1. 教你最实用的“经验”
建模特征处理、构建与选择的经验;
各类子模型的经验,应对各种业务细分场景下如何开发模型的问题;
参数优化的经验,让你快准狠的调整核心参数,模型一步到位,让面试官都感觉到你“经验十足“。