关注“金科应用研院”,回复“礼包”
领取“风控资料合集”
文末还有惊喜小福利,记得看到底呦
Vintage分析最早的应用是用来记录和追踪不同年份的酒随时间变化时的品质变化。因为葡萄酒的品质随着时间的推移,品质会慢慢上升。
信贷业务场景非常类似葡萄酒的储存,需要追踪不同时期借出去的资金,监控逾期率的变化情况。所以Vintage分析在信贷领域也有广泛应用。
接下来我们模拟一笔1000元的放款来讲解Vintage,这笔贷款发放后我们按照首期还款客户就会逾期,然后在一段时间后再还款的情况来评估。如果用一条时间线来描述客户在各个时间点上的行为,那么结果如下图:
Vintage分析会按照每一笔借款所在的月份作为统计的基准,然后追踪这个放款月份里在贷资金在接下来几个月中,发生逾期的比率。这里就会涉及第一个专业概念。
指一笔放款的存续月份。类似于婴孩一出生就有了年龄,一旦申贷订单被放款,也便拥有了账龄和生命周期。
MOB0:放款日至当月月底
MOB1:放款后第二个完整的月份
MOB2:放款后第三个完整的月份
MOB的最大值取决于信贷产品期限。如果是12期产品,那么该资产的生命周期是12期,MOB最大到MOB12。例如,2019年11月13日放款的订单,2019年11月是MOB0,2019年12月是MOB1,以此类推。
如果我们将该笔放款客户行为的时间线整理成表格,就如下表:
接下来就根据这张表格来计算Vintage逾期率
某一个基准月放款的所有借据中,在第k个MOB观测点上处于逾期状态借据的剩余本金占基准月的放款额的比率,可以计算很多不同维度的指标。
X+Vintage逾期率 = 第k个MOB月逾期1+的剩余本金 / 基准月放款额
30+Vintage逾期率 = 第k个MOB月逾期M1+的剩余本金 / 基准月放款额
.........
这种类型的Vintage逾期率计算,我们需要记录借款金额,观测时间,逾期天数三个要素。
如果我们计算的是一个30+的Vintage,那么在观测时点,处于逾期30天及以上的借款对应的剩余本金将会纳入分子。分母均为1月的放款总额,这样我们就有了4个时间点的逾期30天以上的比例,计算结果如下图:
于是我们就能得到1条曲线,整个曲线解释的是,放款后在每个自然月的月末,当月总放款额中有多少的本金余额是处于逾期30天及以上的,并观测其变化趋势。
实际业务中,某月真实的放款肯定是多笔,所以我们把情况弄的更贴近实际业务一些。假设一月我们业务爆发性增长,贷出去5笔1000元的贷款,如下图:
(发生M1+逾期的部分用红色的色块标记出来,方便后面做计算)
首先Vintage表格里逾期率的分母是一月放款总额为5000元。在MOB0和MOB1肯定不会发生M1+,所以都是0/5000,具体如下:
到此为止,我们已经计算了M1+Vintage分析表格中一个基准月放款本金在接下来几个月的逾期率的计算。如果我们把接下来几个月的都如法炮制,就能得到一张表格和一张图:
代码如下:
如果以上内容你全部看明白了,那么恭喜你已经掌握Vintage分析了!!
高阶分析与应用请往下看!!
切片数据时间
上文中讲到由于需要追踪不同时期逾期比率的变化,那么观测的时间点就尤为重要,根据选取观测时间的不同可以将Vintage分为Month end(月末)与Cycle end(期末)两种:
Month end:选取切片数据的时间为每个自然月的最后一天,所有借据都是在同一天统计;
Cycle end:选取切片数据的时间为每个借据还款日的第二天,每个借据都有自己的统计日。
在统计上,Month end的算法在每次计算逾期天数时,对于在同月内不同时间放款借据给的表现期是有差异的,Cycle end则弥补了这个问题。但因为Month end口径计算更为简便而且效果也不差,所以通用的仍然方式为第一种。
根据计算标的不同,可划分为单量、金额与客户三类
金额是最常规也是使用得最多的,能观测资产的最终损失;在借据金额与逾期有相关性的时候,使用单量和金额结合观测会有不错的效果;客户的Vintege则更能协助贷前策略找到目标客户。
根据指标的计算口径,可划分为当前逾期、Ever逾期两类
当前逾期:在统计节点计算当前逾期的标的
Ever逾期:在统计节点计算历史逾期的标的
Ever逾期更严格一些,将历史满足逾期条件的标的均计算进来,与当前逾期结合能观测到Vintage口径的留存率。另外在建模中定义Y样本的时候也会用到。
根据指标逾期的口径,常规可划分为X+,30+,60+,90+,120+,150+,180+
按照上述的分类,粗略估算下来,共有2*3*2*7=84种,所以我们在解读Vintage时,需要对好暗号,明确是哪一种。如果再加上展示的维度,将会有更多类别(常见的维度为月度、季度、年等)
Vintage的解读,我们大体可以归纳为以下几点:
观测某笔资产最终的损失比例,也就是观测这根线最终平稳的值,当然打平的位置跟资产的平均借款期限有关。
以上图为例,可以看到2021年8月30+DPD的vintage曲线在MOB10时趋向平稳,也就是说,2021年8月的当月放款在10个月后30+逾期率为0.82%且不再增长。当然,趋向平稳的位置节点跟资产的平均借款期限有关,一般12期及以上的分期信贷产品在6-10期30+DPD应该趋向平稳。
观测单根线增长趋势,前期增加以欺诈风险为主,后期增加主要为信用风险,结合指标能判断最终损失中欺诈与信用的大致占比。
观测单条曲线的增长趋势,前期如1-3期曲线斜率较高通常代表风险表现以欺诈风险为主,后期曲线的上升主要为信用风险,通过Vintage分析能判断最终损失中欺诈与信用的大致占比
不同月份放款资产最终损失的差异,通过这个可与评判不同月份的放款资产的差异,从而对策略优化提供建议。
一般在初次上线一款信贷产品时,风控策略往往不够稳定和完善,第一个月放款资产的Vintage曲线往往上升较快。通过上线第一个月风控策略的更新优化,第二个月放款资产的Vintage曲线上升斜率应该有所下降,依次类推,通过不断优化风控策略,不断观察优化后策略对次月放款资产的Vintage曲线斜率、损失值以及趋向稳定的影响,以此评判风控策略的优化是良性发展。
不同年同组月份放款资产最终损失的差异,通过可以评判是否存在季节性。
对于大于12期以上信贷产品,通过观察不同年同一月份的Vintage,可以判断信贷产品从渠道获客,产品设计等是否具有季节性,如果发现具有季节性,可以通过去年的资产表现及早预测和规避一些风险事件的发生。比如,季节性的地区集中欺诈事件
观测已有数据的增长趋势,预估最终损失,并进行过程监控,提前预警。
如图Vintage分析的应用不仅是对历史风险的回顾与优化,也可以通过历史时间数据的分析建模,预测资产在完成全部生命周期后的整体损失,以提前评估风险容忍度,进行监控与预警
上文中讲到,我们可以计算的Vintage指标逾期的口径有X+,30+,60+,90+,120+,150+,180+等如此之多,那么实战中到底该选取哪个逾期口径进行分析呢?
首先我们必须要掌握的一个规律是:表现期越长,信用风险暴露将越彻底,但意味着观察期离当前越远,用以提取样本特征的历史数据将越陈旧,建模样本和未来样本的差异也越大。反之,表现期越短,风险还未暴露完全,但好处是能用到更近的样本。
所以挑选的核心逻辑就是在时效性和风险暴露程度上找平衡点。具体实现逻辑就是确定一个合适的表现期能覆盖足够多的坏客户即可。
从上图中,我们发现以下规律:
1)不同月份放款的M4+在经过9个MOB后开始趋于稳定,说明账户成熟期是9个月;
2)MOB4开始M4+Vintage逾期指标才开始有值。
如果我们要挑选一个Vintage指标来作为分析的Y值,遵循挑选逻辑,可选择MOB9 M4+Vintage 作为Y值。
方法一:单月观察Vintage+演变走势
(Loan_amt:当月放款金额;Weight_term:加权平均期限;Weight_price:加权平均定价)
可以观测到2020年1月:
该产品放款金额3915万,放款时借据平均期限8.8个月,借据平均利率为29.7%
2020年1月放款后,vintage30+的走势为前期快速升高,增速逐步趋缓,在第9期之后达到平稳水平,最后vintage30+在5.3%左右
从而得出结论,2020年1月放款的业务vintage30+的值5.3%,意味着,放款3915万的业务中,5.3%的金额会逾期30天及以上。
方法二:Vintage转化为年化风险损失
根据金融机构风险偏好不同,可以通常采用Vintage90+或者Vintage30+计算产品年化风险损失,以上图为例,2020年1月放款Vintage30+最终稳定值为5.3%,说明每放款100元,经历完整表现周期后最终会损失5.3元。那么如果转化为年化风险损失取决于这100元在一年会放几次,最终年化风险损失则基本等同于Vintage*周转次数。
但是影响产品周转次数的因素很多,最重要的因素是产品期限、还款方式、提前还款情况;产品期限意味着客户使用贷款的时间;还款方式则影响客户本金的占用情况。
场景一:按月还息到期一次性还本
按月还息到期一次性还本的现金流与基本原理中的特殊情况类似,客户的年化损失计算方式为,这里的期限为客户借据借款平均期限:
年化损失=Vintage*周转次数=vintage*12/期限
场景二:等额本息/等额本金/等本等息
情况二中的现金流相对复杂,主要原因是客户在按期还款的过程中每期都有本金和利息还款,客户占用资金逐期递减,客户用款次数也受到客户本金资金占用影响。由于还款方式的不同,每种还款方式的资金占用也有差异,在这里介绍一种相对通用的计算方式
根据客户的还款计划计算每期损失情况,计算客户年化损失,已知上述产品为等额本息的还款方式,放款要素如下:
计算还款计划如下:
每期客户本金损失=每期损失概率*上一期剩余本金
每期客户本金占用比=客户上期剩余本金/客户放款金额
(其中每期损失概率可由每月Vintage30+增加量计算得出)
通过还款计划结合以下指标计算得出下表:
最后客户本金损失期望=每期本金损失的和=11610.74元
最后客户资金占用比=每期资金占用比的平局值=56.13%
根据上述计算结果,可以得出:
本金损失概率=最后客户本金损失期望/放款金额=3.87%
期限周转次数=借据期数/平均用款期数=12/9=1.33
APR本金损失率=本金损失概率*期限周转次数=5.16%
IRR本金损失率=APR本金损失率/资金占用比=5.16%/56.13%=9.19%
预测出我们不同客群的Vintage全生命周期损失之后,我们就可以对不同客群进行盈利测算,结合成本计算出不同客群最佳的利率,从而实现利润的最大化。
感谢cycle$老师的分享,如果你喜欢、想要看更多的干货类型的文章,可以把公众号设为星标🌟,并且转发分享。
FAL长期对外征稿,邀请各大风控人士加入我们,在风控圈分享你的经验与知识👉征稿,快到碗里来,有稿费那种!
感谢您看到这里
微信公众号对话框回复“小福利”
领取粉丝专属优惠券