ModelCube数据集 | 人力资源分析：数据科学家工作变动数据集

文摘 2024-07-30 08:00 浙江

ModelCube（modelcube.cn）是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术，实现了科研场景中全类型数据管理与标注，实验环境快速获取与灵活定制，模型的全生命周期管理，科研成果的管理与发布，以及 AI驱动的论文检索和学习等功能。

介绍

一家活跃在大数据和数据科学领域的公司希望从那些成功通过公司开设的一些课程的人中招聘数据科学家。许多人报名参加了他们的培训。公司想知道这些候选人中哪些人在培训后真的想为公司工作，或者是在寻找新的就业机会，因为这有助于减少成本和时间，以及提高培训质量或规划课程和候选人的分类。与人口统计、教育、经验相关的信息已经从候选人的注册和报名中获得。

该数据集旨在了解导致一个人离职的因素，以供人力资源研究之用。通过使用当前的资历、人口统计、经验数据构建的模型，你将预测候选人寻找新工作或为公司工作的概率，以及解释影响员工决策的因素。

整个数据集被分为训练集和测试集。测试集中不包含目标变量，但相关任务的目标值数据文件已经提供。还提供了一个与测试集enrollee_id对应的样本提交，包含列：enrollee_id, target。

注:

数据集不平衡。
大多数特征是分类的(标称、有序、二进制)，有些具有高基数。
缺失插补可以成为数据清洗的一部分。

字段说明

字段名称	字段说明
enrollee_id	候选人的唯一id
city	城市代码
city_ development _index	城市发展指数(按比例)
gender	候选人的性别
relevent_experience	候选人的相关经历
enrolled_university	注册的大学课程类型(如果有的话)
education_level	候选人的教育水平
major_discipline	考生的教育专业
experience	候选人年总经验
company_size	当前雇主所在公司的员工人数
company_type	当前雇主的类型
last_new_job	上一份工作与当前工作的年份差异
training_hours	完成的培训小时数
target	0–不想换工作，1–想换工作

数据集的用途

1.预测候选人为公司工作的可能性。

2.研究哪些特征会影响候选人决策的方式。

数据文件

下载数据集请登录ModelCube
http://modelcube.cn/dataset/dataset-detail/10074

http://mp.weixin.qq.com/s?__biz=MzU2NTcxODIyMg==&mid=2247515321&idx=1&sn=80dbf41e52a59b0f77ec05dc77b4a65a

数据科学人工智能

聚焦数据科学，大数据，人工智能，区块链和云计算等话题。技术资料分享，院士名家观点分享，前沿资讯分享。

最新文章

ModelCube数据集 | NBA球员数据集（1950年至今）

ModelCube数据集 | 泰坦尼克号数据集

ModelCube数据集 | 英国二手车数据集

ModelCube数据集 | 语音性别识别数据集

ModelCube数据集 | 印度板球超级联赛数据集

ModelCube数据集 | 心脏病数据集

ModelCube数据集 | 手语数字数据集

ModelCube数据集 | 2020年世界卫生统计报告数据集|完整|地理分析

ModelCube数据集 | 印度创业基金数据集

ModelCube数据集 | 太阳能发电数据集

ModelCube数据集 | 拉面评分数据集

ModelCube数据集 | 《权力的游戏》数据集

ModelCube数据集 | PJM小时能耗数据集

ModelCube数据集 | 枪支暴力数据集

ModelCube数据集 | 糖尿病数据集

ModelCube数据集 | 用于讽刺检测的新闻标题数据集

ModelCube数据集 | 国际足联世界杯数据集

ModelCube数据集 | 零售数据分析数据集

ModelCube数据集 | 校园招聘数据集

ModelCube数据集 | Spotify2019年Top50歌曲数据集

ModelCube数据集 | 钻石数据集

ModelCube数据集 | 标准普尔500指数股票数据集

ModelCube数据集 | 医疗预约数据集

ModelCube数据集 | IMDB 50K电影评论数据集

ModelCube阅读列表 | 机器学习运维MLOps

ModelCube数据集 | 亚马逊Top50畅销书数据集（2009-2019年）

ModelCube数据集 | 视频游戏销售额与评级数据集

ModelCube阅读列表 | 对抗生成网络

ModelCube数据集 | 女性电子商务服装评论数据集

ModelCube阅读列表 | ImageNet架构和技巧

ModelCube数据集 | WHO预期寿命数据集

ModelCube数据集 | 加州房价数据集

ModelCube阅读列表 | 强化学习

ModelCube数据集 | 用于脑肿瘤检测的脑MRI图像

ModelCube数据集 | 全球大学排行数据集

ModelCube实验 | 基于Seaborn的保险费用数据散点图实践

ModelCube阅读列表 | 数据挖掘十大算法

ModelCube数据集 | 移动应用商店（7200个应用）数据集

ModelCube实验 | 基于出租车数据的城市交通流分析

ModelCube数据集 | Zomato Bangalore餐厅评论数据集

ModelCube数据集 | （MBTI）Myers-Briggs人格类型数据集

ModelCube实验 | 使用Pandas对美国橄榄球联盟 (NFL) 数据进行数据清洗

ModelCube阅读列表 | 主题模型

ModelCube数据集 | 巧克力棒评分数据集

ModelCube数据集 | 人力资源分析：数据科学家工作变动数据集

ModelCube实验 | 基于集成学习的肾结石预测

ModelCube阅读列表 | 神经网络优化

ModelCube数据集 | 国际象棋游戏数据集（Lichess）

ModelCube实验 | 在线送餐客户流失分析与预测

ModelCube数据集 | 水质数据集

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉