ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。
介绍
该数据集与葡萄牙一家银行机构的直接营销活动有关。营销活动是以电话为基础的。通常,需要与同一客户进行多次联系,才能了解产品(银行定期存款)是否会被订购(“是”)或不会被订购(“否”)。分类目标是预测客户是否会认购定期存款(变量y)。
字段说明
字段名称 | 字段说明 |
---|---|
age | 年龄(数字) |
job | 工作类型(分类:"行政"、"蓝领"、"企业家"、"女佣"、"管理"、"退休"、"自营职业者"、"服务"、"学生"、"技术员"、"失业"、"未知") |
marital | 婚姻状况(分类:"离婚"、"已婚"、"单身"、"未知";注:"离异"表示离婚或丧偶) |
education | 教育程度(分类:"基础.4y"、"基础.6y"、"基础.9y"、"高中"、"文盲"、"专业课程"、"大学学位"、"未知") |
default | 是否存在信用违约?(分类:"否"、"是"、"未知") |
housing | 有住房贷款吗?(分类:"否"、"是"、"未知") |
loan | 有个人贷款吗?(分类:"否"、"是"、"未知") |
contact | 联系人沟通类型(分类:"蜂窝"、"电话") |
month | 一年中最后一次联系的月份(分类:"一月","二月","三月",…,"十一月","十二月") |
day_of_week | 一周中最后一次联系的日子(分类:"周一"、"周二"、"周三"、"周四"、"周五") |
duration | 最后一次联系的持续时间,以秒为单位(数值)。重要提示:这个属性严重影响输出目标(例如,如果duration=0,则y=‘no’)。然而,在通话执行之前,持续时间是未知的。同样,在通话结束后,y显然是已知的。因此,这个输入只应该用于基准测试目的,如果目标是建立一个现实的预测模型,则应该被丢弃 |
campaign | 在此活动期间为此客户执行的接触次数(数值,包括最后一次接触) |
pdays | 自上次活动联系客户以来过去的天数(数值;999表示客户之前未被联系过) |
previous | 在此活动之前为此客户执行的接触次数(数值) |
poutcome | 上一次营销活动的结果(分类:"失败"、"不存在"、"成功") |
emp.var.rate | 就业变动率 - 季度指标(数值) |
cons.price.idx | 消费者价格指数- 月度指标(数值) |
cons.conf.idx | 消费者信心指数- 月度指标(数值) |
euribor3m | 3个月利率- 每日指标(数值) |
nr.employed | 员工数量 - 季度指标(数值) |
y | 客户是否认购了定期存款?(二元:"是"、"否") |
引用要求
使用该数据集,要求引用一下论文:
[Moro et al., 2014] S. Moro, P. Cortez and P. Rita. A Data-Driven Approach to Predict the Success of Bank Telemarketing. Decision Support Systems, In press, http://dx.doi.org/10.1016/j.dss.2014.03.001
数据来源
http://archive.ics.uci.edu/ml/datasets/Bank+Marketing#
数据文件
下载数据集请登录ModelCube
http://modelcube.cn/dataset/dataset-detail/10320