ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。
介绍
一家活跃在大数据和数据科学领域的公司希望从那些成功通过公司开设的一些课程的人中招聘数据科学家。许多人报名参加了他们的培训。公司想知道这些候选人中哪些人在培训后真的想为公司工作,或者是在寻找新的就业机会,因为这有助于减少成本和时间,以及提高培训质量或规划课程和候选人的分类。与人口统计、教育、经验相关的信息已经从候选人的注册和报名中获得。
该数据集旨在了解导致一个人离职的因素,以供人力资源研究之用。通过使用当前的资历、人口统计、经验数据构建的模型,你将预测候选人寻找新工作或为公司工作的概率,以及解释影响员工决策的因素。
整个数据集被分为训练集和测试集。测试集中不包含目标变量,但相关任务的目标值数据文件已经提供。还提供了一个与测试集enrollee_id
对应的样本提交,包含列:enrollee_id
, target
。
注:
数据集不平衡。
大多数特征是分类的(标称、有序、二进制),有些具有高基数。
缺失插补可以成为数据清洗的一部分。
字段说明
字段名称 | 字段说明 |
---|---|
enrollee_id | 候选人的唯一id |
city | 城市代码 |
city_ development _index | 城市发展指数(按比例) |
gender | 候选人的性别 |
relevent_experience | 候选人的相关经历 |
enrolled_university | 注册的大学课程类型(如果有的话) |
education_level | 候选人的教育水平 |
major_discipline | 考生的教育专业 |
experience | 候选人年总经验 |
company_size | 当前雇主所在公司的员工人数 |
company_type | 当前雇主的类型 |
last_new_job | 上一份工作与当前工作的年份差异 |
training_hours | 完成的培训小时数 |
target | 0–不想换工作,1–想换工作 |
数据集的用途
1.预测候选人为公司工作的可能性。
2.研究哪些特征会影响候选人决策的方式。
数据文件
下载数据集请登录ModelCube
http://modelcube.cn/dataset/dataset-detail/10074