ModelCube数据集 | 2011-2016年H-1B签证申请数据集

文摘   2025-01-02 07:59   浙江  

ModelCube(modelcube.cn)是博雅数智自主研发的一站式人工智能科研平台。为全国高校和科研机构的大数据和人工智能科研团队提供一站式科研服务。基于MLOps的实践和企业核心技术,实现了科研场景中全类型数据管理与标注,实验环境快速获取与灵活定制,模型的全生命周期管理,科研成果的管理与发布,以及 AI驱动的论文检索和学习等功能。


介绍

H-1B 签证是针对美国临时外国工人的一种就业类非移民签证。外国公民若要申请 H1-B 签证,美国雇主必须为其提供工作机会并向美国移民部提交 H-1B 签证申请。这也是国际学生完成大学或高等教育并开始全职工作后申请和持有的最常见签证类型。

以下文章包含有关H-1B签证流程的更多信息:

  • 什么是H1B LCA?为什么要提交?工资、处理时间–DOL

  • H1B申请流程:分步指南

该数据集包含五年的 H-1B 申请数据,总共约有 300 万条记录。数据集中的列包括案件状态、雇主名称、工作地点坐标、职位、现行工资、职业代码和提交年份。

有关各个列的详细信息,请参阅基础原始数据集的详细描述官方数据字典。

字段说明

字段名称字段说明
CASE_STATUS表示 LCA 处理后的申请状态。认证申请已提交给 USCIS 以获得 H-1B 批准。CASE_STATUS: CERTIFIED 并不意味着申请人的 H-1B 签证已获批准,它只是意味着申请人有资格申请 H-1B
EMPLOYER_NAME提交劳动条件申请的雇主名称
SOC_NAMESOC_CODE 关联的职业名称。SOC_CODE 是与临时劳动条件所要求的工作关联的职业代码,由标准职业分类 (SOC) 系统进行分类
JOB_TITLE职位名称
FULL_TIME_POSITIONY = 全职职位;N = 兼职职位
PREVAILING_WAGE临时工职位所申请工作的现行工资。工资以美元为单位按年计算。职位的现行工资定义为在预期就业地区向申请职业的类似就业工人支付的平均工资。现行工资基于雇主对该职位的最低要求
YEAR提交 H-1B 签证申请的年份
WORKSITE工地
lon经度
lat纬度

数据集来源

外国劳工认证办公室(OFLC)生成项目数据,包括H1-B签证的数据。披露数据每年更新一次,可在线获取https://www.foreignlaborcert.doleta.gov/performancedata.cfm。

现有的原始数据很混乱,不能立即进行适当的分析。执行了一组数据转换,使数据更易于访问以进行快速探索。要了解更多信息,请参阅此博客文章以及赠送的notebook。

数据集的用途

  1. 研究申请数据工程师职位的人数是否随着时间的推移而增加?

  2. 研究美国哪个地区的硬件工程师工作最多?

  3. 研究哪个行业的数据科学家职位最多?

  4. 研究哪些雇主每年提交的请愿书最多?

数据文件


下载数据集请登录ModelCube

http://modelcube.cn/dataset/dataset-detail/10328

数据科学人工智能
聚焦数据科学,大数据,人工智能,区块链和云计算等话题。技术资料分享,院士名家观点分享,前沿资讯分享。
 最新文章