移位份额工具变量的实用指南
来源:A PRACTICAL GUIDE TO SHIFT-SHARE INSTRUMENTS-NBER-2024
内容提要
本文系统性地总结和探讨了移位份额工具变量(shift-share instruments)在计量经济学研究中的应用。该方法通过结合各单元对共同冲击的异质性暴露来构造工具变量,已广泛应用于劳动经济学、国际贸易等领域。作者指出,移位份额工具变量的识别主要有两条路径:一是基于外生冲击(exogenous shifts),二是基于外生份额(exogenous shares)。论文详细阐述了这两种路径的理论基础、实践要点和诊断检验方法,并通过多个经典研究案例进行说明。
背景
移位份额工具变量方法最早可追溯到Freeman(1975, 1980)的研究,近年来在经济学研究中的应用日益广泛。根据统计,目前约1/8的NBER工作论文明确使用了该方法,还有许多研究隐含地采用了移位份额结构。该方法的核心思想是利用不同单元对共同冲击的异质性暴露来构造工具变量,以解决内生性问题。
以Autor等(2013)的研究为例,他们考察中国进口对美国地方劳动力市场的影响。通过结合各地区制造业就业份额(shares)与全国层面的产业进口冲击(shifts),构造了反映地区对中国进口竞争暴露程度的工具变量。可有效处理美国特定的生产率和需求冲击可能带来的内生性问题。
理论框架
基本模型设定
考虑如下模型:
其中是结果变量,是可能存在内生性的解释变量,是控制变量向量。移位份额工具变量的一般形式为:
其中是单元i对冲击k的暴露份额,是共同的冲击。
两种识别路径
基于外生冲击的识别
主要依赖于冲击的外生性,不需要对份额的外生性做出假设。关键在于冲击要与加权平均后的误差项不相关:
核心思想是,如果冲击是外生的(类似于随机分配),那么即使份额本身是内生的,由这些份额加权平均得到的工具变量仍然可以是有效的。具体来说,只要冲击与加权平均后的误差项不相关,即满足:,就可以实现识别。这个条件的直观解释是:即使某些地区由于其特定的产业结构(反映在份额中)可能系统性地与误差项相关,但只要冲击的分配是随机的或者准随机的,在大样本条件下,这种相关性就会被平均掉。
在技术细节方面,对于第一种方法,论文建议控制份额之和(如果份额不完整),并使用基于冲击层面的标准误计算方法。
基于外生份额的识别
要求各份额本身可以作为有效的工具变量。这种情况下,移位份额估计可以看作是多个基于单一份额的工具变量估计的加权平均。
第二条识别路径则是基于外生份额。在这种方法下,每个份额本身都被视为一个潜在的工具变量。Goldsmith-Pinkham等(2020)证明,移位份额估计量可以被解释为多个单独使用各个份额作为工具变量得到的估计量的加权平均。这些权重被称为Rotemberg权重,其大小取决于份额对处理变量的预测能力以及对应的冲击大小。
对于第二种方法,则需要检验不同份额作为工具变量时估计结果的一致性,并重点关注那些具有较大Rotemberg权重的份额的有效性。
案例
以Autor等(2013)的研究为例:
结果变量:美国各通勤区制造业就业增长 解释变量:地区对中国进口的暴露程度 工具变量:基于其他发达国家从中国进口增长构造的移位份额变量
对于基于外生冲击的识别路径,主要步骤包括:
确保有足够多的外生冲击 控制份额之和(若份额不完整) 进行适当的平衡性检验 使用暴露稳健的标准误
对于基于外生份额的识别路径,需要:
验证份额的外生性 计算Rotemberg权重以确定关键份额 检验不同份额工具变量估计结果的一致性
论文特别强调,这两种方法各有其适用条件。外生冲击方法要求有足够多的冲击,这样大数定律才能发挥作用。而外生份额方法则要求份额能够真正捕捉到与研究问题相关的特定暴露度,而不是反映一般性的产业结构特征。举例来说,在研究移民对劳动力市场影响时,使用不同来源国移民的历史分布作为份额可能是合适的,因为这些份额专门反映了移民网络;但在研究贸易冲击时,使用一般的产业就业份额可能就不太合适,因为这些份额可能同时反映了许多其他不可观测的因素。
1. 基本移位份额工具变量
基础的移位份额工具变量公式为:
以Autor等(2013)的研究为例,其具体构造方法为:
**份额()**:使用1990年各通勤区i在行业k的就业份额
数据来源:Census数据 计算方法:,其中是1990年通勤区i在行业k的就业人数,是该通勤区总就业 **冲击()**:1990-2000年间其他高收入国家从中国进口的增长
数据来源:UN Comtrade数据库 计算方法:,其中是其他国家从中国进口行业k产品的变化值,是美国该行业1990年的就业人数
2. 处理变量与结果变量
**处理变量()**:地区进口暴露度
构造方法: 其中是美国从中国进口的变化 **结果变量()**:制造业就业变化
计算公式: 数据来源:Census和County Business Patterns数据
实证模型设定
1. 基本回归方程
其中为控制变量。
2. 工具变量两阶段最小二乘估计(2SLS)
第一阶段:
第二阶段:
3. 标准误处理
对于基于外生冲击的方法,使用暴露稳健的标准误:
其中是冲击层面的矩条件。
识别条件的检验
1. 相关性条件检验
第一阶段F统计量:需要计算暴露稳健的F统计量其中是暴露稳健的方差估计
2. 外生性条件检验
对于外生冲击方法:
其中是冲击层面的预先决定的特征
冲击层面的平衡性检验:
对于外生份额方法:
对高权重份额进行平衡性检验 计算Rotemberg权重:
Rotemberg权重反映了每个行业(或每个冲击)对最终移位份额估计量的贡献大小。这个权重告诉哪些行业/冲击在驱动整体估计结果中起主导作用。
假设研究中国进口对就业的影响:
发现纺织业权重最高(占30%),那么要特别检验:
在中国进口增长前,高纺织业份额的地区是否已经有不同的就业趋势 这些地区的其他特征(如教育水平、人口结构)是否有系统性差异。
3. 稳健性检验
留一法检验:构造去除某一地区的移位份额工具变量:
替代性份额检验:使用更早期的份额构造工具变量:
LATE
这个理论框架的一个重要扩展是处理异质性处理效应的情况。在这种情况下,移位份额估计量可以被解释为局部平均处理效应(LATE)的一种加权平均,其中权重与份额的大小和冲击的方差有关。具体来说,在满足单调性假设的条件下,估计量的概率极限为:
其中是第一阶段效应,是冲击的方差,是单元-冲击层面的处理效应。这个表达式清楚地显示了不同处理效应在最终估计量中的相对权重。
数值示例
一、基于外生冲击的识别条件
理论条件
基于外生冲击的识别要求冲击与加权平均后的误差项不相关。形式化表述为:
这个条件的含义是,即使份额()可能与误差项()相关,只要冲击()是外生的,在足够多的冲击下,经过份额加权平均后的工具变量仍然是有效的。
数值示例
考虑劳动力市场的例子:
假设某地区有3个主要行业:制造业、服务业和建筑业 政府对这些行业随机分配补贴(冲击):制造业10%、服务业5%、建筑业8% 地区A的行业就业份额分别是:40%、35%、25% 地区B的行业就业份额分别是:20%、50%、30%
计算移位份额工具变量:
地区A: 地区B:
验证方法
冲击层面的平衡性检验
验证冲击是否与行业特征相关:
其中包括行业层面的预先决定特征,如技能密集度、资本密集度等
有效冲击数量检验
计算Herfindahl指数的倒数: 其中是冲击k的重要性权重
序列相关检验
对于面板数据,检验冲击的序列相关性 若存在序列相关,考虑使用更长的滞后份额或提取冲击的不可预测部分
二、基于外生份额的识别条件
理论条件
要求各个份额本身都满足工具变量的有效性条件:
这意味着份额变量需要满足平行趋势假设,类似于双重差分法。
数值示例
考虑移民研究的例子:
两个时期(1990-2000) 两个来源国(墨西哥和菲律宾) 两个地区(洛杉矶和芝加哥)
假设1980年的移民份额:
洛杉矶:墨西哥40%,菲律宾20% 芝加哥:墨西哥25%,菲律宾15%
1990-2000年的移民增长率:
墨西哥:50% 菲律宾:30%
验证方法
Rotemberg权重分析计算每个份额的权重:
例如,对于Card(2009)的研究:
墨西哥移民份额权重约为50% 菲律宾移民份额权重约为15%
份额层面的平衡性检验
对高Rotemberg权重的份额进行重点检验:
其中是预期结果变量
过度识别检验
使用Sargan-Hansen检验 检验使用不同份额作为工具变量得到的估计结果是否一致
总结
对于外生冲击方法:
进行冲击层面的描述性统计 报告有效冲击数量 在控制相关特征后检验冲击的随机性
对于外生份额方法:
计算并报告关键份额的Rotemberg权重 对高权重份额进行详细的平衡性检验 检验使用不同份额组合的估计结果稳健性
局限
当冲击数量较少时,基于外生冲击的识别可能不够可靠。
份额的外生性往往难以完全保证,特别是当份额反映了一般性的产业结构时。
在存在异质性处理效应的情况下,估计结果的解释需要格外谨慎。