01
Q:现在的数据监管背景下,如下图所示的一些通话记录和APP下载记录类的特征衍生会受限吗(因为拿不到用户的这些原始特征)?
(以上课件来自:【第3期】量化风险建模师-认证班)
A:会有影响,一般业务测本身拿不到客户的通讯记录信息。但自身app的埋点信息和一些基础的设备信息是可以获取的。通话记录可以尝试购买三方数据,后面可能会直接对接征信机构去测试采购,他们一般具有完整的授权链。
02
Q:通过描述性统计,进行特征探索性分析并剔除变量的初筛方式,比如剔除top1占比过高的字符型变量,这个逻辑是只对LR型模型适用,还是即使是XGB这样的机器学习模型,这个变量预选择逻辑也适用?
A:对所有模型均可以适用,因为变量top1占比过高(95%+)其本身变异程度很小,所带的信息也不足于区分好坏(其iv应该非常低)。也可以补剔除直接进行iv筛选,但运算量会很大。所以为了节省计算时间,建议先剔除变异小的特征。
03
Q:如下图所示,使用PSI进行特征筛选的时候,base只选一个月会不会有所偏差,比如季节性效应或一些特定的时点。比如选择2020/01作为base的话可能正好是新冠疫情发生的时候。
(以上课件来自:【第3期】量化风险建模师-认证班)
A:是的,有的机构会进行循环base计算,例如:先以1月为base每个月计算一次再去平均,同时再以第一季度为base,每个季度计算一次取平均,甚至还会以上个月为base,逐月计算。base数据的选取会根据实际情况考虑选取较为稳定的时期(逻辑上没大问题均可)。课件中以训练集和测试集两个计算psi,为了方便讲解。
一般来说,模型上线后监控的话,以建模时期的样本或者以上线后累计一段时期的样本为base。
04
Q:在后疫情时代,疫情对变量设计和变量筛选有什么影响?会不会因为疫情一些变量的稳定性等发生了偏差?
A:有可能的,若是当前客群与模型开发时的样本发送偏差,比如特征受疫情影响导致分布发送显著变化,最终会影响模型分数的分布。监控会持续报警,此时需要与策略或业务侧沟通,是否需要进行模型迭代。
对于初出茅庐的金融新人来说,【量化风控模型0基础入门】是入门、延伸和量化金融的接轨。课程内容安排循序渐进,十分紧凑,让你从完全不了解量化风险建模,建立模型的基础概念,掌握模型的基本原理;深入学习建模的开发与应用、常规的参数调整以及制作模型开发后的评审报告文章,完成了从0到1的突破。
01
这门课适合谁?
想转行转岗建模师,但缺乏理论和项目实战经验,难通过面试笔试的社会在职人士 为了理想offer,想快速提升自身竞争力的毕业大学生 日常与数据建模师打交道工作有交集,想提升建模能力的风险管理从业人员,如业务人员、数据分析师、策略分析师等 对数据建模颇感兴趣,想通过课程快速学习了解模型原理和流程应用的精华
02
这门课的具体内容是什么?
▼上下滑动查看更多
长按图片中的二维码,一起加入我们吧!
扫码添加科科微信
免费咨询课程,职业规划
03
资深风控模型专家亲授,带你快速成长
肖老师
资深零售个人信贷风控模型专家,从事一线大厂消费金融风控模型开发多年 曾任某大企金融线模型组leader,世界500强企业金融科技事业部经理 现任某大厂旗下数科子公司-风控模型专家岗,擅长个人信贷风控模型
量化风控模型入门班
想在下半年高效提升
长按图片中的二维码,一起加入我们吧!
扫码添加科科微信
免费咨询课程,职业规划
戳“阅读原文”一起来充电吧!