解析:特征筛选在策略中的应用

文摘   科技   2024-09-04 08:31   广东  

01

Q:现在的数据监管背景下,如下图所示的一些通话记录和APP下载记录类的特征衍生会受限吗(因为拿不到用户的这些原始特征)?


(以上课件来自:【第3期】量化风险建模师-认证班


A:会有影响,一般业务测本身拿不到客户的通讯记录信息。但自身app的埋点信息和一些基础的设备信息是可以获取的。通话记录可以尝试购买三方数据,后面可能会直接对接征信机构去测试采购,他们一般具有完整的授权链。



02

Q:通过描述性统计,进行特征探索性分析并剔除变量的初筛方式,比如剔除top1占比过高的字符型变量,这个逻辑是只对LR型模型适用,还是即使是XGB这样的机器学习模型,这个变量预选择逻辑也适用?

A:对所有模型均可以适用,因为变量top1占比过高(95%+)其本身变异程度很小,所带的信息也不足于区分好坏(其iv应该非常低)。也可以补剔除直接进行iv筛选,但运算量会很大。所以为了节省计算时间,建议先剔除变异小的特征。



03

Q:如下图所示,使用PSI进行特征筛选的时候,base只选一个月会不会有所偏差,比如季节性效应或一些特定的时点。比如选择2020/01作为base的话可能正好是新冠疫情发生的时候


(以上课件来自:【第3期】量化风险建模师-认证班)


A:是的,有的机构会进行循环base计算,例如:先以1月为base每个月计算一次再去平均,同时再以第一季度为base,每个季度计算一次取平均,甚至还会以上个月为base,逐月计算。base数据的选取会根据实际情况考虑选取较为稳定的时期(逻辑上没大问题均可)。课件中以训练集和测试集两个计算psi,为了方便讲解。


一般来说,模型上线后监控的话,以建模时期的样本或者以上线后累计一段时期的样本为base。



04

Q:在后疫情时代,疫情对变量设计和变量筛选有什么影响?会不会因为疫情一些变量的稳定性等发生了偏差?

A:有可能的,若是当前客群与模型开发时的样本发送偏差,比如特征受疫情影响导致分布发送显著变化,最终会影响模型分数的分布。监控会持续报警,此时需要与策略或业务侧沟通,是否需要进行模型迭代。


如果你想了解更多特征筛选在风控策略中的应用,更贴近常规业务场景的实践。或想成为一名量化风险建模师,想要借此机会提升自己,获得dream offer,那么可以直接扫码,加入【量化风控模型0基础入门】课程。


对于初出茅庐的金融新人来说,【量化风控模型0基础入门】是入门、延伸和量化金融的接轨。课程内容安排循序渐进,十分紧凑,让你从完全不了解量化风险建模,建立模型的基础概念,掌握模型的基本原理;深入学习建模的开发与应用、常规的参数调整以及制作模型开发后的评审报告文章,完成了从0到1的突破。


01

这门课适合谁?


量化风控模型0基础入门班适合 0 - 3 岁的金融新人,典型包括:


  1. 想转行转岗建模师,但缺乏理论和项目实战经验,难通过面试笔试的社会在职人士
  2. 为了理想offer,想快速提升自身竞争力的毕业大学生
  3. 日常与数据建模师打交道工作有交集,想提升建模能力的风险管理从业人员,如业务人员、数据分析师、策略分析师等
  4. 对数据建模颇感兴趣,想通过课程快速学习了解模型原理和流程应用的精华

02

这门课的具体内容是什么?


具体课程内容

上下滑动查看更多


课程实用价值高:真实数据+全套代码可直接使
▼上下滑动查看更多

长按图片中的二维码,一起加入我们吧!

扫码添加科科微信

免费咨询课程,职业规划


03

资深风控模型专家亲授,带你快速成长


肖老师


  • 资深零售个人信贷风控模型专家,从事一线大厂消费金融风控模型开发多年
  • 曾任某大企金融线模型组leader,世界500强企业金融科技事业部经理
  • 现任某大厂旗下数科子公司-风控模型专家岗,擅长个人信贷风控模型

《第1期 模型入门班》学习群聊天截图

课程配套3个完整独立自主练习(附答案)+15个精选案例讲解每章节中所包含的课程案例、独立练习、实操代码(真实数据源+全套代码,学完可直接使用)。帮助你快速掌握模型和基本原理以及模型开发的全流程,建立风控模型的基础概念,从0-1独立完成模型训练与开发。

 量化风控模型入门班 

想在下半年高效提升

长按图片中的二维码,一起加入我们吧!

扫码添加科科微信

免费咨询课程,职业规划


“阅读原文”一起来充电吧!

金科应用研院
Make Fintech Easier And Smarter
 最新文章