关注“金科应用研院”,回复“礼包”
领取风控资料合集
在风控流程中,对于拒绝用户群可以单独过一个“拒绝捞回”评分模型,再根据用户的评分结果,从高到低选取一个较合理的阈值进行判断,高于阈值的便可以予以通过授信,这里的措施建议采用“模型”策略,不要用简单的且维度很少的规则,采用模型的最大好处是较大化的从多个维度的再次评估了拒绝用户的风险。
至于“拒绝捞回”模型怎么去开发,是选取存量拒绝样本来建立模型,里边最重要的怎么定义拒绝样本的好坏标签,可以采用通过样本数据建立的模型打分,然后根据分数阈值划分得到拒绝样本的标签,后边的建模过程和平时有监督模型是一致的。此外,也可以考虑对拒绝用户走一个客户聚类模型,看分布特点进行决策,当然这个效果没有前边说的有监督模型效果更好些。
考虑数据成本和策略效果,
先信息核验类,后信用风险类;先欺诈识别类,后信用评估类;先价格较低类,后价格较高类;先特征标签类,后模型分数类;先数据内部类,后数据外部类;先区分较好类,后区分较弱类......,这些原则不是绝对的,但都是考虑的原则。
在实际部署时,在同等情况下重点排序,此外还要考虑规则之间的覆盖情况。
测试数据从类型角度看,可以分为样本内测试数据和样本外测试数据。
如果是样本内测试,数据来源适合开发样本数据来源于同一个时间窗,只是拆分的时候是随机拆分得到的;
如果是样本外测试,数据来源要根据时间窗来选取,从风控应用角度说,务必要采用开发数据往后的时间窗数据,也就是离当前时间更近的样本,这样才能反映规则在未来应用效果的好坏。
决策树的生成过程是从根节点开始,选择对应特征变量,然后选择节点对应特征的分割点,再根据分割点分裂节点。其中,最重要的是如何选择节点的特征,以及特征对应的分割点,这里常见的衡量指标有基尼指数、信息熵、误分率等。
采用决策树进行规则开发时自然是围绕这个划分原则,针对省份等无序型类别特征,决策树是根据取值进行分裂,根节点会对应生成多个子节点,只是在选择哪些取值分裂时,那又回归到刚说的那些指标,通过取值分布体现的指标大小进行划分,这样最终生成包含类别特征区间的规则。
感谢JK的分享,如果你喜欢、想要看更多的干货类型的文章,可以把公众号设为星标🌟,顺便转发分享~
FAL长期对外征稿,邀请各大风控人士加入我们,在风控圈分享你的经验与知识👉征稿,快到碗里来,有稿费那种!