介 绍
随着大科技公司的崛起,它们的网上银行通过使用大数据及机器学习预测信贷违约概率给个人及小企业提供信贷服务,使得传统商业银行滋生潜在的危机会失去现有客户及市场份额,如果大科技公司将数据驱动的信贷预测模型扩展到商业银行目标客户群体。目前,传统信贷的评估方法并不会被大科技公司的数据驱动模型所取代。首先大科技公司模型主要使用从其科技平台提取的自身客户独有的特有信息变量,大科技公司的大数据库与银行传统信贷客户并不关联; 另外,大科技公司在收集到的客户财务信息质量的限制下,单笔贷款发放的金额较低,且其数据驱动模型尚未覆盖传统银行的信贷客户。原因是模型的建立基于数据库,如果数据库样本发生了变化,模型需要进行更新。即使是使用同一家咨询公司专家模型进行授信的传统商业银行,用历史信贷数据建立的风险模型对其它区域银行的客户,由于客户特征不同不具有识别风险能力。
尽管如此,很多研究提出和证明了基于机器学习的数据驱动模型在预测信贷违约正确率上优于传统信贷评估方法。基于此,本文的目的是通过对基于传统信贷风险评估方式发放的历史贷款建模,检验传统评估方式对有效性,并与基于数据模型识别的大科技公司历史贷款建风险模型比较,评估模型的风险识别正确率,探索传统银行小微贷款业务的电子化解决方案;并分析基于传统评估方式模型预测能力弱于数据驱动方法模型的原因及数据驱动模型变量是否可以从传统评估方式角度进行理解;除此之外,比较2家银行数据库建模结果并讨论建模数据库是否需要包含拒绝客户样本。
为了回答以上问题,我们应用了来源于2家区域性商业银行A和B,和1家非银行农村信贷机构C的数据库,其中A和B运用传统信贷评估方式发放小微贷款,C则通过线上信贷使用数据驱动模型提供小微贷款。建模方法使用经典的逻辑回归算法,即贷款状态定义为被解释的变量,其它变量作为解释变量候选。按照惯例,数据库的70%样本用于建模,30%样本用于测试获得的模型预测逾期的能力。比较模型测试表现使用AUC值。
接下来文章内容安排如下:第二部分使用数据库介绍;第三部分是实证分析,包含传统评估方式中8个假设与建模结果比较、不包含及包含拒绝样本建模比较、比较数据库A和B建模结果、传统评估方式与数据驱动方法建模结果比较及错误矩阵分析;最后进行汇总和建议。
数据库介绍
银行A提供的不包含拒绝样本数据库A和包含拒绝样本数据库A+分别于2019年和2024年收集,数据库A包含10016条样本,除贷款状态外,由5个非财务信息变量、3个衍生于征信报告和4个从财务比例提取变量组成,样本超过30天逾期率为0.0942,授信平均额度为12万。数据库A+包含100条样本,只包含非财务信息和征信报告关联变量。
银行B提供的授信客户数据库B和拒绝样本数据库B+均在2019年收集完成,由非财务信息和征信报告关联变量组成。数据库B有21623条样本,共有10个变量,9个解释变量中5个非财务信息和4个征信报告提取变量,样本超过30天逾期率为0.0907,授信平均额度为20万。数据库B+由300个拒绝样本组成。
相比之下,信贷机构C提供的数据库C除贷款状态外,解释变量则完全衍生于征信报告。数据库C于2024年收集,包含68个变量,其中64个变量是使用决策树从1000多个征信报告衍生变量优化获得。最终供分析的数据库C由4个人又统计特征的非财务信息变量和14个征信报告关联变量及28299条样本构成。样本超过30天的逾期率为0.0151,授信平均额度为0.94万。
实证分析
3.1传统信贷评估方式与建模结果比较
2家银行A、B和信贷机构C的传统信贷部门都使用逻辑检验保证收集到的财务信息真实性,作为分析的基础,它的基本原理如下:追溯投资的来源,统计逐年的经营利润,考虑支出后,与收集到的资产权益规模做比较。代表传统评估方式的以下8个假设都与数据库变量关联,但并不意味在实际评估中仅限于这些变量。
假设1
同等条件下中年人更有授信价值。因为中年人有社会成熟度,积累了足够的经营履历提高生意成功概率的同时,仍具备比较好的学习能力把握生意机遇。反之,年龄小或年龄大则逾期几率高,对应的在统计上应该表现为年龄与逾期不线性相关,在模型中不具有显著性特征。对银行A提供的数据库建模后的结果如下:借款人每增加1岁年龄,逾期发生几率增加,因为在模型中年龄的系数是正的并有显著性特征。对银行B提供的数据库建模后的结果如下:年龄不具有显著性特征,即年龄与逾期发生的几率没有关联。故假设1在银行A没有验证,但在银行B得到了验证。
假设2
同等条件下借款人名下本地有可交易的房产逾期发生的概率小。本地有房产一方面意味着借款人的经营能力和本地的稳定性,另一方面名下潜在可主张的房产也迫使借款人履行还款义务。对银行A提供的数据库建模后的结果如下:借款人没有自有住房,逾期发生的几率增加,因为住房状态的(定义没有住房为1)系数是正的并且显著性水平是1%。对银行B提供的数据库建模后的结果如下:住房状态不具有统计的显著性特征。故假设2在银行A验证但在银行B没有验证。
假设3
同等条件下借款人受教育程度与逾期发生无关,因为借款人的经营能力并不能从正规教育中获得。银行A提供的数据库没有此变量,故我们只能从B银行提供的数据库建模验证。教育变量的系数为负,表示了受教育程度高相对于受教育程度低,逾期发生的几率小,因为我们是以递增来定义受教育程度的,受教育越高分配的值就越高。故假设3是错误的。
假设4
同等条件下已婚的借款人不太可能产生逾期。因为已婚一般本地稳定性就好并且有监督主借款人还款的配偶列为共同借款人作为潜在的第二还款来源。对银行A提供的数据库建模后的结果显示婚姻状态的系数没有显著性水平,即婚姻状态与逾期不关联。对银行B提供的数据库建模后的结果表示非婚姻状态逾期发生几率大。故假设4在银行A不成立但在银行B成立。
假设5
同等条件下低于30天的信用卡或以每月还款方式的消费贷或房贷逾期记录,考虑其违约的金额及期限,并不会影响未来授信贷款的还款。因为有不少的案例显示这些并不反应借款人真实财务状况的逾期状态是由借款人疏忽或银行不及时提醒造成的。对银行A提供的数据库建模后的结果显示每增加一次此类逾期,逾期发生的几率就会增加,因为该变量的系数是正的并有显著性水平。对银行B提供的数据库建模后的结果显示每增加一个单位该类逾期金额逾期的几率就会增加,因为该变量的系数是正的并有显著性水平。故假设5在银行A和银行B均不成立。
假设6
同等条件下少于30天的以每月等额还款方式的商业贷款逾期记录可能会影响借款人未来获得贷款的还款。首先到期还本类逾期商业贷款的借款人排除在申请之外,因为该类贷款逾期清晰展示了借款人恶化的历史财务状况和还款行为。2家银行接受有瑕疵的这一类借款人是建立在目前借款人财务状况明显改善并且其它信息无瑕疵,即借款人非财务信息良好的基础上。对银行A提供的数据库建模后的结果显示此类逾期与未来贷款逾期没有关联。对银行B提供的数据库建模后的结果显示与银行A一样。故假设6在银行A和银行B都是错误的。
假设7
同等条件下申请贷款前有频繁的征信查询记录会增加贷款的逾期几率。银行征信查询记录一方面反应借款人的本地融资环境,另一方面也暗示着借款人被其它金融机构的拒绝次数。对银行A提供的数据库建模结果显示每增加查询一次,逾期的几率就会增加,相反对银行B提供的数据库建模结果显示查询次数与逾期无关。故假设7在银行A成立,但在银行B不成立。
假设8
只有数据库A有涉及财务信息关联变量,故我们把这些关联变量的假设都汇总在一起。定义Cd为发放贷款与年可支配收入的比例,其基准值为70%,把剩余30%作为缓冲区域。同等条件下,Cd越高逾期几率越大;定义Edy=权益/年可支配收入/经营年限,该值越高则潜在负债越高,同等条件下逾期几率就越大;定义Dr为负债资产比例,同等条件下,该值越高逾期几率越大;定义It为库存与年可变成本比例,该值越高资金效率越低,同等条件下,逾期几率越大。模型结果显示:相较于其它类型变量,绝大多数财务相关变量的系数相对大,即在同等条件下,一个单位的变量变化影响逾期的几率要比其它变量要大;并且除存货关联变量It对逾期没有影响,另外3个变量Cd、Edy和Dr的系数均为正并有显著性水平,意味着与我们的假设一致。
3.2比较数据库A和B的建模结果
为论证金融机构使用模型必须基于自建数据库,我们对数据库A和B的建模结果进行了比较。结果表示,银行A和B即便在产品设计上无差异,并使用同一家公司的专家模型(模型会根据区域调整)进行贷款授信,获得的模型在变量对逾期的影响仍有很大差异。考虑到数据库B不包含财务比例变量,比较模型由非财务信息变量和征信报告衍生变量组成。数据库A获得的不包含财务关联变量的模型,居住状态、信用卡逾期次数和征信查询次数影响逾期发生几率;数据库B获得的风险模型,婚姻状态和信用卡逾期次数影响逾期的发生。
3.3不包含及包含拒绝样本数据库建模比较
我们以银行A和B提供的数据库完成此比较。比较的结果是不包含拒绝样本和包含拒绝样本没有呈现一致性,而是模型中某些变量的系数的显著性特征发生了变化。以银行A提供的样本为例,不包含拒绝样本的建模结果表明,居住状态、信用卡逾期次数和征信查询次数对逾期发生几率有影响;包含拒绝样本的建模结果,年龄、居住状态、信用卡逾期次数、分期还款经营贷逾期次数和征信查询次数对逾期发生几率有影响。以银行B提供的样本为例,不包含拒绝样本的建模结果表明,婚姻状态、信用卡逾期次数对逾期发生几率有影响;包含拒绝样本的建模结果,婚姻状态、信用卡逾期次数和分期还款经营贷对逾期发生几率有影响。
此外我们比较获得贷款数据库正常还款客户变量的均值、逾期客户变量的均值和拒绝客户的变量均值,拒绝客户的变量均值并不完全趋同于逾期客户。以银行A提供数据库为例,获得授信但出现逾期客户的婚姻状态平均值为0.130(单身为1已婚为0),获得授信还款正常客户婚姻状态的平均值为0.11,但拒绝客户的婚姻状态均值为0.116,故拒绝客户的婚姻特征更趋同于正常还款客户;同样的情形也出现在银行B,获得贷款但出现逾期客户的平均查询次数为0.2691,无逾期客户为0.2778,拒绝客户的平均查询次数为0.46。
由于我们在建模时,把拒绝客户默认为逾期客户但未来是否真实发生是不确定的,考虑增加拒绝案例后变量系数的显著性变化及在分析关联客户的变量均值后,建模需要使用包含拒绝案例的数据库并没有得到充分论证。
3.4传统信贷评估方法与数据驱动方法建模结果比较
数据驱动方法建模结果显示,所有非财务信息变量的系数都不具有显著性特征。可能的原因是在授信额度比较小的情况下,信贷的准入门槛低,故非财务信息同质化,无法从非财务信息识别风险;建模使用的从64个征信关联变量选取的14个变量,原则上从功能上并没有与传统信贷评估方式有差异,即都涉及历史信贷逾期次数、逾期金额及被其它金融机构拒绝次数。不同的是数据驱动模型使用更多的相对变量,注重于比较历史贷款还款表现及借款人在其它金融机构获得授信的成功概率。这是由于科技人员鲜有直接信贷经验,所以需要借鉴其它金融机构的授信决策造成的。因此数据驱动模型的建模逻辑没有偏离传统信贷评估方式,完全可以从传统信贷评估方式进行理解。
但数据驱动方法的建模结果体现的强大的预测能力,完全体现了大数据的优势。初始数据库C的64个征信关联变量是从1000多个变量优化选取,使用数据库C选择了64个变量中的16个,虽然最后建模只使用了4个变量,但AUC值达到了88.81%,其中3个变量系数达到最高的1%显著性水平,剩下1个达到5%。相比较而言,数据库A建模的最好AUC水平为65.36%,数据库B建模的最好AUC水平仅为56.45%。如果说数据库B的结果是由缺失财务信息变量造成的,但数据库C并没有包含财务信息变量,建模效果也优于了包括财务变量的数据库A。
由于8个假设的论证结果低于预期并且传统评估方法模型弱于数据驱动模型,有必要对错误预测的样本进行必要的分析。
3.5错误矩阵的分析
除财务信息关联假设外,其它假设的验证度很差,故我们以数据库A建模结果为例,从错误矩阵中随机抽取了2个样本,即非正常还款但被划分为无风险贷款和正常还款但被划分为风险贷款,罗列如下:
扫描2个样本的变量值发现样本的非正常信息集中在第一个样本的财务信息关联变量,即Edy和It。2个样本的非财务信息都没有偏离关联的假设,虽然第二个样本的年龄偏大。传统信贷评估方法除了原则性的瑕疵譬如有严重逾期记录,并不会就某个瑕疵信息而拒绝客户,除非瑕疵的数量引起质的变化即还款能力,才会拒绝客户;客户的融资环境关联变量的值也都是传统信贷评估方式在容忍的范围,因为仅征信查询记录次数偏离数据库样本的平均值(5vs2.3和7vs0.28);至于财务信息关联变量值,Edy是逻辑检验关联变量,如果财务信息真实,该变量值应低于1(如前假设Edy=权益/年可支配收入/经营年限,客户的权益一般来自于经营积累,并且经营利润随着经营历史有逐年递增的趋势,公式中的年可支配收入使用的是最近一年的数据,是一个比平均利润高的数据,故低于1则安全)。第二个样本该值为0.68则在合理范围,第一个样本该值为1.71则意味着客户有潜在的负债。It的参考值为4左右(数据库平均值为4.554),该值样本1为12.6意味着有些库存不属于客户或客户并未支付,样本2该值为0.46低于4,可能客户生意模式不需要太多库存。总的来说,参考8个假设,样本1的授信是由信贷员的错误建议和贷审会成员疏于发现问题造成的,而样本2的授信完全符合贷审原则,但受制于模型逻辑被错误划分为风险贷款。
总结和建议
通过运用2家银行和1家信贷机构提供的数据库建模,我们首先得出数据驱动方法利用算法及大数据优势在信贷风险的预测能力上完胜传统信贷风险评估方式(AUC88.81%>65.36%>56.45%),即便前者的模型并不包含财务信息关联变量;同时也不可否认,比较数据库A和数据库B的建模结果,模型包含财务信息变量会提高预测能力(AUC65.36%>56.45%)。虽然数据驱动模型使用变量完全可以用传统评估方式去理解,但并不表示模型就可以直接被其它机构直接使用,因为即便是运用同一家咨询公司专家模型的银行A和B授信贷款后的建模结果变量也呈现对逾期发生几率不同的影响,故大数据的优势必须建立在金融机构自己建立数据库的基础上。只有这样,才能获得正确分类风险客户和非风险客户的变量,即变量系数呈现非常高的显著性水平等级;此外,我们不得不承认,传统评估方式的低预测能力是由人工干预及执行的不一致造成的。一方面8个假设中除财务比例关联假设外其它假设几乎没有被统计模型验证的,另外通过错误矩阵也发现了不应该被授信的样本; 同时我们也发现,拒绝样本不应该纳入数据库建模,因为包含拒绝样本后,部分变量系数的显著性水平发生了变化。通过比较拒绝样本与获得贷款样本中的变量均值,发现前者的变量均值并不完全趋同逾期样本的变量均值。
诚然,运用金融科技是传统商业银行的必然选择。基于我们的研究与分析做出如下建议:
对那些已经准备好了要进行数字化改革的商业银行,首先建模必须使用自己的数据库,收集自己的历史客户信贷数据,即建模前要先建数据库;
传统商业银行要运用自身丰富的信贷经验,模型要以采用大量的财务信息关联变量为基础放大线上银行的授信额度;
模型势必要引入识别客户真实财务信息的变量,类似银行A的Edy变量,以解决信息不对称的问题,从根本上控制信贷风险;
对那些还不准备运用金融科技进行信贷客户授信的银行,建立统计模型可以帮助银行对现有信贷风险评估方式进行检验评估,通过纠正错误来减少存量信贷风险。
【作者简介】
徐晨女士有20多年的小微金融和影响力投资相关的从业经验,曾亲自主导和参与支持过20多个银行的小微业务。
徐晨女士在信贷的数字风控、妇女的信贷服务方面具有丰富的研究和实践经验,之前参与过世界银行国际金融公司的多个项目、也为国际知名的小微金融机构提供数字化专项咨询服务。徐晨女士参与制定了众多银行的小微业务流程,风险管理规程以及培养了大量银行高级管理人才。
徐晨女士拥有德国科隆大学经济学学士学位,以及杜塞尔多夫大学经济学硕士学位。
THE END