ModelCube数据集 | 信用卡审批预测数据集

文摘   2024-10-03 08:25   浙江  

ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。

介绍

信用卡是金融业中一种常见的风险控制方法。它使用信用卡申请人提交的个人信息和数据来预测未来违约和信用卡借款的可能性。银行可以决定是否向申请人发放信用卡。信用评分可以客观地量化风险的大小。


一般来说,信用卡是基于历史数据的。一旦遇到较大的经济波动。过去的模型可能会失去原来的预测能力。逻辑回归模型是信用评分的常用方法。因为逻辑回归模型适用于分类任务,并且可以计算每个特征的系数。为了便于理解和操作,记分卡会将逻辑回归系数乘以某个值(如100)并四舍五入。

目前,随着机器学习算法的发展。在信用卡评分中引入了更多的预测方法,如Boosting、随机森林和支持向量机。然而,这些方法往往没有很好的透明度。可能很难向客户和监管机构提供拒绝或接受的理由。

字段说明

1. application_record.csv

字段名称字段说明
ID客户编号
CODE_GENDER性别
FLAG_OWN_CAR是否有车
FLAG_OWN_REALTY是否有房产
CNT_CHILDREN孩子数量
AMT_INCOME_TOTAL年收入
NAME_INCOME_TYPE收入类型
NAME_EDUCATION_TYPE教育水平
NAME_FAMILY_STATUS婚姻状况
NAME_HOUSING_TYPE生活方式
DAYS_BIRTH生日                ,从当前日期(0)倒计时,-1表示昨天
DAYS_EMPLOYED就业起始日期             ,从当前日期(0)倒计时。如果为正数,这意味着此人目前失业。
FLAG_MOBIL是否有移动手机
FLAG_WORK_PHONE是否有工作手机
FLAG_PHONE是否有手机
FLAG_EMAIL是否有邮箱
OCCUPATION_TYPE职业
CNT_FAM_MEMBERS家庭规模

2. credit_record.csv

字段名称字段说明
ID客户编号
MONTHS_BALANCE记录月份,提取数据的月份为起点,向后,0为当月,-1为上月,依此类推
STATUS状态,0:逾期1-29天1:逾期30-59天2:逾期60-89天3:逾期90-119天4:逾期120-149天5:逾期或坏账,核销超过150天C:当月已还清X:当月无贷款

数据集的用途

建立一个机器学习模型来预测申请人是"好"还是"坏"客户,与其他任务不同,没有给出"好"或"坏"的定义。可以借助一些技术,比如年份分析以构建标签。此外,数据不平衡问题也是这项任务中的一个大问题。

数据文件


下载数据集请登录ModelCube

http://modelcube.cn/dataset/dataset-detail/10145

数据科学人工智能
聚焦数据科学,大数据,人工智能,区块链和云计算等话题。技术资料分享,院士名家观点分享,前沿资讯分享。
 最新文章