ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。
介绍
信用卡是金融业中一种常见的风险控制方法。它使用信用卡申请人提交的个人信息和数据来预测未来违约和信用卡借款的可能性。银行可以决定是否向申请人发放信用卡。信用评分可以客观地量化风险的大小。
一般来说,信用卡是基于历史数据的。一旦遇到较大的经济波动。过去的模型可能会失去原来的预测能力。逻辑回归模型是信用评分的常用方法。因为逻辑回归模型适用于分类任务,并且可以计算每个特征的系数。为了便于理解和操作,记分卡会将逻辑回归系数乘以某个值(如100)并四舍五入。
目前,随着机器学习算法的发展。在信用卡评分中引入了更多的预测方法,如Boosting、随机森林和支持向量机。然而,这些方法往往没有很好的透明度。可能很难向客户和监管机构提供拒绝或接受的理由。
字段说明
1. application_record.csv
字段名称 | 字段说明 |
---|---|
ID | 客户编号 |
CODE_GENDER | 性别 |
FLAG_OWN_CAR | 是否有车 |
FLAG_OWN_REALTY | 是否有房产 |
CNT_CHILDREN | 孩子数量 |
AMT_INCOME_TOTAL | 年收入 |
NAME_INCOME_TYPE | 收入类型 |
NAME_EDUCATION_TYPE | 教育水平 |
NAME_FAMILY_STATUS | 婚姻状况 |
NAME_HOUSING_TYPE | 生活方式 |
DAYS_BIRTH | 生日 ,从当前日期(0)倒计时,-1表示昨天 |
DAYS_EMPLOYED | 就业起始日期 ,从当前日期(0)倒计时。如果为正数,这意味着此人目前失业。 |
FLAG_MOBIL | 是否有移动手机 |
FLAG_WORK_PHONE | 是否有工作手机 |
FLAG_PHONE | 是否有手机 |
FLAG_EMAIL | 是否有邮箱 |
OCCUPATION_TYPE | 职业 |
CNT_FAM_MEMBERS | 家庭规模 |
2. credit_record.csv
字段名称 | 字段说明 |
---|---|
ID | 客户编号 |
MONTHS_BALANCE | 记录月份,提取数据的月份为起点,向后,0为当月,-1为上月,依此类推 |
STATUS | 状态,0:逾期1-29天1:逾期30-59天2:逾期60-89天3:逾期90-119天4:逾期120-149天5:逾期或坏账,核销超过150天C:当月已还清X:当月无贷款 |
数据集的用途
建立一个机器学习模型来预测申请人是"好"还是"坏"客户,与其他任务不同,没有给出"好"或"坏"的定义。可以借助一些技术,比如年份分析以构建标签。此外,数据不平衡问题也是这项任务中的一个大问题。
数据文件
下载数据集请登录ModelCube
http://modelcube.cn/dataset/dataset-detail/10145