5个高频问题与解答(策略分析)

文摘   科技   2024-10-25 08:33   匈牙利  

关注金科应用研院,回复“礼包

领取风控资料合集


策略分析岗面试和工作中常遇到的5个问题的思路答案。

01


额度授信


额度授信是根据用户的风险情况,给予合适的借款额度。

在业务流程中一般都会有对应的额度定价模型,额度模型的加工原理,可以采用简单的策略制定思路(或简单交叉分析,或决策树分析),也可以采用模型算法训练拟合(回归或多分类模型,至于算法有很多,线性回归、逻辑回归、随机森林、XGBoostK近邻等),具体需要结合可选特征的数量与类型等情况。

额度模型一般单独开发最大的特点是模型的变量最好选择资产、消费等维度的字段,比如月收入、银行卡交易金额、电商平台消费金额等,多数指标可以从外部三方数据公司获取,因为这样的指标可以体现用户的消费资质能力,和授信额度是密切相关的,当然额度模型可以通过申请评分模型的结果(评分区间或风险等级)来划分规则,但效果绝对没有采用专有的额度模型应用好些,毕竟这样的结果多数只考虑了风险,要是风险模型和额度模型分别建立,并且一起使用,这样的授信过程是更加满足风控理念和业务需求。

02


拒绝回捞


在风控流程中,对于拒绝用户群可以单独过一个“拒绝捞回”评分模型,再根据用户的评分结果,从高到低选取一个较合理的阈值进行判断,高于阈值的便可以予以通过授信,这里的措施建议采用“模型”策略,不要用简单的且维度很少的规则,采用模型的最大好处是较大化的从多个维度的再次评估了拒绝用户的风险。


至于“拒绝捞回”模型怎么去开发,是选取存量拒绝样本来建立模型,里边最重要的怎么定义拒绝样本的好坏标签,可以采用通过样本数据建立的模型打分,然后根据分数阈值划分得到拒绝样本的标签,后边的建模过程和平时有监督模型是一致的。此外,也可以考虑对拒绝用户走一个客户聚类模型,看分布特点进行决策,当然这个效果没有前边说的有监督模型效果更好些。


03


数据源使用


考虑数据成本和策略效果,


先信息核验类,后信用风险类;先欺诈识别类,后信用评估类;先价格较低类,后价格较高类;先特征标签类,后模型分数类;先数据内部类,后数据外部类;先区分较好类,后区分较弱类......,这些原则不是绝对的,但都是考虑的原则。


在实际部署时,在同等情况下重点排序,此外还要考虑规则之间的覆盖情况。


04


测试数据的选用


测试数据从类型角度看,可以分为样本内测试数据和样本外测试数据。


如果是样本内测试,数据来源适合开发样本数据来源于同一个时间窗,只是拆分的时候是随机拆分得到的;


如果是样本外测试,数据来源要根据时间窗来选取,从风控应用角度说,务必要采用开发数据往后的时间窗数据,也就是离当前时间更近的样本,这样才能反映规则在未来应用效果的好坏。


05


无序类规则的决策树探索


决策树的生成过程是从根节点开始,选择对应特征变量,然后选择节点对应特征的分割点,再根据分割点分裂节点。其中,最重要的是如何选择节点的特征,以及特征对应的分割点,这里常见的衡量指标有基尼指数、信息熵、误分率等。


采用决策树进行规则开发时自然是围绕这个划分原则,针对省份等无序型类别特征,决策树是根据取值进行分裂,根节点会对应生成多个子节点,只是在选择哪些取值分裂时,那又回归到刚说的那些指标,通过取值分布体现的指标大小进行划分,这样最终生成包含类别特征区间的规则。





感谢JK的分享,如果你喜欢、想要看更多的干货类型的文章,可以把公众号设为星标🌟,顺便转发分享~


FAL长期对外征稿,邀请各大风控人士加入我们,在风控圈分享你的经验与知识👉征稿,快到碗里来,有稿费那种!


金科应用研院
Make Fintech Easier And Smarter
 最新文章