ModelCube数据集 | 人力资源分析:数据科学家工作变动数据集

文摘   2024-07-30 08:00   浙江  

ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。

介绍

一家活跃在大数据和数据科学领域的公司希望从那些成功通过公司开设的一些课程的人中招聘数据科学家。许多人报名参加了他们的培训。公司想知道这些候选人中哪些人在培训后真的想为公司工作,或者是在寻找新的就业机会,因为这有助于减少成本和时间,以及提高培训质量或规划课程和候选人的分类。与人口统计、教育、经验相关的信息已经从候选人的注册和报名中获得。

该数据集旨在了解导致一个人离职的因素,以供人力资源研究之用。通过使用当前的资历、人口统计、经验数据构建的模型,你将预测候选人寻找新工作或为公司工作的概率,以及解释影响员工决策的因素。

整个数据集被分为训练集和测试集。测试集中不包含目标变量,但相关任务的目标值数据文件已经提供。还提供了一个与测试集enrollee_id对应的样本提交,包含列:enrollee_id, target

注:

  • 数据集不平衡。

  • 大多数特征是分类的(标称、有序、二进制),有些具有高基数。

  • 缺失插补可以成为数据清洗的一部分。

字段说明

字段名称字段说明
enrollee_id候选人的唯一id
city城市代码
city_ development _index城市发展指数(按比例)
gender候选人的性别
relevent_experience候选人的相关经历
enrolled_university注册的大学课程类型(如果有的话)
education_level候选人的教育水平
major_discipline考生的教育专业
experience候选人年总经验
company_size当前雇主所在公司的员工人数
company_type当前雇主的类型
last_new_job上一份工作与当前工作的年份差异
training_hours完成的培训小时数
target0–不想换工作,1–想换工作

数据集的用途

1.预测候选人为公司工作的可能性。

2.研究哪些特征会影响候选人决策的方式。

数据文件


下载数据集请登录ModelCube

http://modelcube.cn/dataset/dataset-detail/10074

数据科学人工智能
聚焦数据科学,大数据,人工智能,区块链和云计算等话题。技术资料分享,院士名家观点分享,前沿资讯分享。
 最新文章