AEA亲自操刀: SSIV份额移动IV的使用指南说明, 思想, 程序命令和使用检查清单都清楚了

学术   2024-12-13 16:39   美国  

凡是搞计量经济的,都关注这个号了
邮箱:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
接着中文的需要看! Bartik工具变量法在因果识别中的应用与检验的综述, 从源头到使用清单及步骤和注意事项全部齐了”,这不份额移动工具变量SSIV的大牛Kirill Borusyak, Peter Hull在美国经济学会旗下期刊Journal of Economic Perspectives刊发了一篇SSIV的使用指南说明,把shift和share两个维度分解得非常细致通俗易懂。
背景信息:SSIV(Shift-Share IV)工具变量是一种在经济学研究中用来处理内生性问题的方法,特别是在评估政策效应或经济冲击时。它也被称为Bartik IV。这种工具变量的构造基于两个主要组成部分:地方行业分布的异质性和全国性行业冲击的外生性。
1.构造方式:SSIV通过将地方行业分布的份额与全国性行业冲击相乘来构造工具变量。具体来说,对于每个地区,它的行业份额(例如,某个地区在特定行业中的就业比例)与全国该行业的增长率(或其它冲击变量)相乘,得到一个加权的全国性冲击,这个加权值就作为工具变量。
2.避免内生性问题:SSIV的核心优势在于它能够避免内生性问题。这是因为全国性行业冲击(如行业增长率)通常被认为是外生的,与地区特定的误差项无关。同时,地方行业分布的份额是基于基期的数据,这个份额在全国范围内的行业冲击发生之前就已经固定,因此也与地区特定的误差项无关。
3.应用领域:SSIV广泛应用于贸易、移民以及地区经济影响的研究领域,特别是在评估政策变化对特定地区或行业影响时。
1.Bartik IV构建操作程序和步骤, 使用该IV策略的AER数据和code及中英文文献,2.此文的研究发现, 可能会与AER“上山下乡”一样充满争议, 连续DID, 队列DID和Bartik IV,3.AER: 中国城乡迁徙与企业生产, 移动份额工具变量法Bartik,4.Bartik工具变量是什么? 份额移动法IV应用越来越多,5.TOP5前沿: 时下最流行的移动份额工具变量SSIV研究设计指南!6.免费4门课程, 因果推断1和2, IV, 份额移动IV和高级DID, 附数据,代码,讲义和阅读清单, 7.不研究人, 经济学开始研究鸟儿了, DID-TWFE, Bartik IV, 零第一阶段ZFS检验值得参考, 8.Bartik工具变量法最新发展和使用方法流程图总结

Kirill Borusyak, Peter Hull, and Xavier Jaravel, 2025, A Practical Guide to Shift-Share Instruments, Journal of Economic Perspectives.

*感谢群友@李莫愁大战法海提供以下内容,建议再阅读原文更容易理解。

在众多经济学研究领域,学者们经常聚焦于那些受到不同程度共同冲击影响的单位。以Autor等在2013年开展的一项具有里程碑意义的研究为例,该研究深入分析了1990年代和2000年代“对中国进口激增”对美国当地劳动力市场的影响。研究者通过计算工人在与中国竞争加剧的行业中的就业比例,来评估各地区对这一“中国产业冲击”的敏感程度。这一方法通过一个份额移动解释变量来具体实现,即通过将美国从中国进口的各行业变化的平均值,按照各行业在地区就业中的份额进行加权,来衡量各地区的暴露程度。

这种工具变量通过汇总一系列共同的冲击,并结合异质的份额暴露权重,广泛应用于劳动经济学、国际贸易、宏观经济学、公共财政学以及金融学等领域的研究。尽管这类工具变量的使用最早可以追溯到Freeman在1975年和1980年的研究,但在过去十年中,采用这些工具的文献数量有了显著增长。如今,在NBER工作论文中,大约有1/8的工具变量被明确标识为份额移动工具,而许多其他工具则隐含地具有份额移动结构。

那么,这类工具变量在何种情境下能够有效地解决内生性问题,又在何种情境下可能无法奏效呢?这个问题并不容易回答,因为份额移动工具变量依赖于两种不同来源的变异,而这些变异各自的影响力并不明显。直观上,我们可能会认为这些份额的变化是有益的,因为它们反映了系统中潜在的外部变化。然而,这些变化往往发生在与分析单位(例如地方劳动市场)不同的层面上(比如行业层面)。这不禁让人质疑,它们是否仍然具有有效性?另一方面,份额在不同单位之间有所变动,但这些变动通常是预先设定的,比如某个特定时期的就业份额。那么,我们又该如何理解这些变动背后的潜在外部因素呢?

本文旨在提供对这些问题的概念性解答,并给出使用份额移动工具变量或评估他人使用这些工具变量可靠性的实用指导。依据最新的计量经济学文献,本文提出了两种不同的识别策略。第一种策略由Borusyak等(2022年)和Adão等(2019年)发展而来,它利用了众多外生性移动,但并未对份额的外生性做出假设。第二种策略由Goldsmith-Pinkham等(2020年)提出,主要关注份额的外生性问题。这两种方法在选择合适估计值、进行有效推断以及执行诊断检验方面具有不同的实际意义。

首先探讨了采用份额移动工具变量的普遍理由,并概述了两种核心方法的逻辑框架。讨论了如何将“移动驱动”的识别理解为一种利用移动层面自然实验的方法,而将“份额驱动”的识别视为通过整合多个双重差分设计来捕捉异质性冲击暴露的手段。随后,为研究人员提供了两份检查清单,以便在实施份额移动设计时参考,这些清单分别针对外生移动和外生份额的方法。本文始终从实际应用的角度出发,通过实例来阐释关键概念和操作步骤;对于更深入的技术性分析,可以参考Borusyak等(2023a)的研究。

附录A针对使用份额移动工具变量时可能遇到的一些实际问题提供了解答。例如,它讨论了如何将估计结果解释为异质性局部平均处理效应,如何处理多个工具变量和交互项的问题,以及如何操作份额移动工具变量,特别是在样本内部测量移动时(如Bartik(1991)和Card(2009)的研究)。此外,还探讨了在这些情境下,是否采用留出法(即leave out)来构建变化是有益的。

份额移动基本概念

份额移动工具变量是什么?它们来自哪里?

表1呈现了几个来自不同领域的显著份额移动工具变量案例。在后续的讨论中,将对这些案例中的部分进行更深入的分析。目前,表格的主要目的是揭示份额移动研究设计的共同特点。每项研究都旨在探究一组单位i中两个变量之间的因果关系或结构性联系。将结果变量表示为( y_i )。按照因果推断领域的常用术语,将解释变量( x_i )称为处理变量。例如,Autor等(2013)的研究旨在评估对中国进口增长对美国地区制造业就业增长( y_i )(以及其他结果变量)的因果效应。表格还列出了在地区、企业、产品和个人层面上,结果变量和处理变量之间的众多实例。

为了在这一背景下明确我们的目标,考虑以下形式的模型:

在这个模型中,wi表示一系列可观测的控制变量。β是关注的关键参数,它反映了处理变量对结果变量的影响(为简化讨论,假设这一影响在所有单位中是一致的)。误差项εi则包括了所有未被观测到的结果变量的决定因素。在这里假定结果方程设定正确,关注的焦点是β的稳健估计,而不是计量模型的选择和解释。

非常关键的一点是,在构建方程(1)的过程中,充分考虑了处理变量的内生性问题,即变量Xi与误差项之间可能并非完全无关。以Autor等(2013)的研究为例,这表明美国某些地区更多暴露于中国进口可能与未观测到的劳动力市场条件相关,而这些条件在没有中国冲击的情况下,原本可能导致制造业就业的增长或减少。这种内生性问题可能会导致使用普通最小二乘法估计方程(1)时产生偏误。为了解决这一挑战,标准的做法是寻找一个工具变量,它与未观测到的模型误差几乎无关,但与内生的Xi保持相关。随后,可以通过二阶段最小二乘法来估计参数

表1中的工具变量通过其份额移动结构来区分:

在这里,(g1, ..., gk) 表示对所有单位产生共同影响的变化因素,而 (si1, ..., siK) 则代表在不同单位间有所差异的暴露份额。在许多实际应用中,每个观测值的份额之和等于1,因此实际上就是这些变化因素的加权平均数,权重即为相应的份额。

在表1中,大多数案例所展示的移动定义层次 (k) 与单位 (i) 并不一致。例如,Bartik(1991年)和Autor等(2013年)采用的是基于地区结果和行业层面的移动定义。然而,网络溢出效应的研究是个例外,其中 (k) 指的是个体或地区的朋友圈或邻居。此外,值得注意的是,尽管表1中的大多数例子都采用了份额移动工具变量来处理变量Xi的内生性问题,但仍有一些研究考虑了对本身进行“简约形式”的回归分析。在这些情况下,通过设定 (Xi = ) 来实现这一点。

研究者们从各自的视角出发,阐述了采用份额变动工具变量的动机。一个常见的情形是,当处理变量代表某些经济指标随时间的增长,而这种增长可以分解为初始份额和随时间移动的部分。例如,设表示地方劳动力市场i在两个不同时间点 t=0, 1之间的就业增长率。该地区的就业情况可以按照行业进行细分:,其中Xikt指的是地方劳动力市场i中行业k在时间t的就业人数。这进一步促使地区就业增长率的分解,表现为初始行业就业份额与地方行业增长率变动的结合形式。

研究者们可能会选择一组共同的变化趋势gk来构建工具变量,以此来替代各个地区特有的移动Xik。在这种分解方法中,份额可以保持原样或者被替换,例如,可以采用历史份额。通过这种方式构建的工具变量,通常与处理变量有较高的相关性。

为了更直观地阐述这一概念,我们可以借鉴Bartik(1991年)提出的著名份额移动工具变量方法。该方法的目标是评估区域劳动力供应对区域工资增长Yi的弹性反应,具体地,就是研究各地区i 的就业增长Xi。通常情况下,为了估计这种供应弹性,需要一个能够影响劳动力需求的工具变量。公式(3)揭示了一个核心观点:Xi实际上是一个以初始就业份额为权重的地区就业增长的加权平均值。这种地区性的变化既反映了劳动力需求的变化,也体现了劳动力供给的变化。

为了单独研究需求变化的影响,可以构建一个工具变量,该变量保留了公式中的地区行业就业份额,并引入了一组共同变化因素。这些共同变化因素应该能够预测地区行业的增长率,但它们的影响仅限于捕捉需求变化的部分。Bartik(1991年)定义为国家层面的行业增长率,用以代表整体需求的变化。同样,也可以定义为特定行业需求的变化,例如政府补贴的变动。

分解(3)帮助我们理解了在定义zi时,为什么份额通常(尽管并非总是)对于每个观测值的总和为1。以前面提到的例子为例,区域就业份额在各个行业的总和自然而然地等于1。然而,在某些情况下,工具变量可能仅反映了特定行业的变化,例如制造业。这时,只有这些特定行业会被考虑在份额移动工具变量的计算之内,这可能会导致份额的总和低于1。我们将在后续的讨论中更深入地探讨这一现象的重要性。

分解处理变量并不是获取份额移动工具变量的唯一途径。另一种常见的做法是将一些全国性的移动“分配”给各个单位。附录A.5中详细描述了这种方法,并解释了它与之前讨论的分解方法之间的联系。在某些情况下,工具变量本身就自然地呈现出份额移动的特征。例如,许多研究网络冲击如何传播的简约形式研究(如Cai等在2015年的研究)采用了一个指标,即单位(i)的朋友或邻居中有多少人被选中参与某种干预。这个变量本质上具有份额移动的结构:其中gk是指示k是否被选中的虚拟变量,而 sik 是指示k是否为单位i朋友的虚拟变量,并且按照(i)的朋友数量进行缩放。

无论出于何种动机,使用这种Zi的核心挑战在于令人信服地证明它是外生的,即它与模型中的未观测误差项无关。这类论证通常依赖于对工具变量变化来源的背景知识。使用份额移动工具变量的独特挑战在于,它包含了两个不同的变化来源:份额的移动本身和份额的大小。因此,为了有说服力地证明这些工具变量是外生的,必须解释移动和份额的哪些特性使得Zi无关(而不仅仅是简单地声明基本的外生性条件。接下来,我们将介绍两种途径来进行这种论证。

什么是来自多个外生移动的识别?

确保份额移动工具变量Zi的外生性的一种策略是让gk 保持外生性。例如,可以设想一个彩票系统,它随机分配给每个行业k不同的补贴水平gk。在先前讨论的劳动力供应情况下,可以采用初始的地方就业份额作为权重,对地方就业增长Xi进行工具变量估计。在这一过程中,补贴的加权平均值被用来作为衡量标准。补贴的作用可以被理解为通过改变劳动力需求进而影响工资水平,而不是直接对劳动力供应产生影响。通常情况下,外生的变动应该是随机分配的,并且仅通过处理变量来影响结果,排除其他潜在的影响因素。

基于份额变动的识别方法基于一个简单的观察:随机变化的份额加权平均本身就是随机的。即使这些份额在计量经济学中被认为是内生的,这一观点依然有效,因为不同份额的单位可能存在系统性的未观察差异。例如,专注于高技能密集型行业的地区可能会经历来自某些国家的移民增加,这可能导致高技能密集型行业的总就业份额与未观察到的移民冲击之间存在正相关性。然而,只要对高技能密集型行业的补贴具有典型的工具变量特性,份额变动的研究设计就无需假设暴露份额的外生性。

尽管彩票提供了理想化实验的直观理解,但工具变量外生性的必要和充分条件是对份额移动的一个较弱的条件:gk应该与按份额加权的平均值不相关。在示例中,这意味着补贴gk——即使不是完全随机分配——也不能在集中(在就业份额sik上)于高劳动力供应冲击与低劳动力供应冲击的地区的行业中表现出系统性的偏高或偏低。如果违反这一条件,就会威胁到外生移动方法中的识别问题。

外生移动方法的另一种理解方式是将份额移动工具变量看作是一种“翻译工具”,它能够将一组“近似随机”的变动转移到不同的分析层面。例如,如果行业补贴被视作“近似随机分配”,则可以设想在行业层面进行分析,直接将补贴 (g_k) 作为行业就业的工具变量。但在地方劳动力市场层面设定方程可能揭示出更有趣的经济参数,即在补贴的影响下,工人跨行业流动时产生的溢出效应。不过,核心的识别假设保持不变,即份额移动工具将行业层面的自然实验转化为地方劳动力市场的分析。

“加权平均彩票”的逻辑强调了外生移动方法的两个额外要求。首先,它要求存在大量的移动,记作。如果k的数量较少,即使这些移动是完全随机的,也可能因为偶然性而与未观察到的因素相关联。这种情况可以看作是大数定律不适用的一个特例:无论观察多少单位,实际上只有少数几个外生的比较。

其次,份额必须总和为1,这样份额移动工具变量才能被解释为变动的加权平均值,而非加权总和。否则,即使移动是完全随机的,工具变量也可能通过份额总和在单位之间产生系统性的移动。我们将在后续讨论中探讨外生移动方法如何适用于这种“份额不完全”的情况。

什么是来自外生份额的识别?

确保份额移动工具变量外生性的另一种策略是使得份额是外生的。这到底意味着什么呢?可以想象,份额是“几乎随机”地分配给各单位的,仿佛是通过彩票抽取,并且满足排除限制条件(即,份额仅通过处理变量影响结果)。另外,当结果以移动的形式进行衡量时,可以将份额外生性解释为一种与双重差分法类似的平行趋势条件。也就是说,为了使不相关,可以假设,如果没有任何处理变量的变化,对比于暴露于k的更多或更少的单位,结果会呈现出类似的趋势。只有当每个k都满足这种平行趋势条件时,份额才是外生的。

为了使这一逻辑更加具体,考虑一个受到 Card(2009)启发的例子,他估计了外来工人和本地工人在劳动需求中的(逆)替代弹性 β。在这个模型中,方程(1)将两期之间外来工人和本地工人相对工资变化 yi与这些群体相对就业变化 xi之间的关系联系起来。假设在这两期之间,某一特定来源国(如古巴)的移民流入发生了突变,如 Card(1990)研究的 Mariel Boatlift 事件。可以假设,暴露于这种移民流入的地区(通过初始来自古巴的移民份额sik捕捉到)在移民与本地劳动力需求方面的变化趋势是相似的,即= 0。在这种情况下,古巴移民份额可以作为一个有效的工具变量来识别 β。

在这种份额外生性的情况下,份额移动工具变量可以被视为将多个有效份额工具变量结合在一起——每个工具变量都基于相同的差分法逻辑,但捕捉不同的暴露变动。实际上,Goldsmith-Pinkham 等(2020)表明,份额移动估计通常可以被视为将 K个“逐一”估计合并,每个估计使用单个sik作为工具变量。在上面的例子中,这将意味着来自多个来源国的移民流入发生了突变,但每个来源国的变化程度不同。在这种情况下,如果每个暴露份额都满足平行趋势条件,结合它们与gk权重的份额移动工具变量也将是一个有效工具。

因此,当研究者愿意使用任何单个份额作为外生工具变量时,外生份额方法是合适的。份额外生性的合理性取决于是否有可能存在一些未观察到的冲击,通过与构建工具变量时使用的相同(或相似)份额影响结果。即使份额是从彩票中随机抽取的,如果存在这样的冲击,也总会导致平行趋势条件的违背。

通过构造与研究对象密切相关的份额来提高份额外生性的合理性,这样就可以确保这些份额仅影响xi的冲击,而不会影响可能影响yi的广泛冲击。例如,在移民效应的文献中(如 Card(2009)),暴露份额是根据研究问题量身定制的:它们衡量了过去各地的地方移民。这一情境可以与流行的份额移动设计进行对比,后者使用反映地方产业构成的份额来研究特定行业变动的区域影响,例如 Autor 等(2013)研究的中国产品竞争或 Acemoglu 和 Restrepo(2020)研究的机器人化问题。行业就业份额是“通用的”,因为它们可能衡量观察对象暴露于其他冲击(本质上是任何行业冲击)的程度,其中许多冲击是未观察到的。在使用这种份额的研究中,基于份额外生性来进行识别的理由是难以成立的。在外生份额的框架下,Autor 等(2013)和 Acemoglu 和 Restrepo(2020)实际上为不同的处理使用了相同的工具(滞后的就业份额)。

在外生份额策略下,移动的作用是次要的:Goldsmith-Pinkham 等(2020)表明,移动会影响它们在份额移动工具变量表示中的权重,但只要份额是外生的,它们就不会影响 β的识别。然而,gk的选择可能会影响份额移动工具变量的效力。直观地讲,分解(3)表明,一个强效工具变量可能使用单位之间的移动xik平均值作为 gk(例如,使用行业就业增长的全国性增长率 gk替代地方增长率 xik)。


文章很长,后面还有一系列做SSIV的检查清单,有需要查看全文的,建议直接下载该文即可。

*群友可直接在社群下载全文PDF。
内生性问题的拓展性阅读 ,0.看完顶级期刊文章后, 整理了内生性处理小册子;1.“内生性” 到底是什么鬼? New Yorker告诉你;2.Heckman两步法的内生性问题(IV-Heckman);3.IV和GMM相关估计步骤,内生性、异方差性等检验方法;4.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题;5.毛咕噜论文中一些有趣的工具变量!;6.非线性面板模型中内生性解决方案;7.内生性处理的秘密武器-工具变量估计;8.内生性处理方法与进展;9.内生性问题和倾向得分匹配;10.你的内生性解决方式out, ERM独领风骚;11.工具变量IV必读文章20篇, 因果识别就靠他了;12.面板数据是怎样处理内生性的;13.计量分析中的内生性问题综述;14.工具变量IV与内生性处理的解读;15.一份改变实证研究的内生性处理思维导图;16.Top期刊里不同来源内生性处理方法;17.面板数据中heckman方法和程序(xtheckman);18.控制函数法CF, 处理内生性的广义方法;19.二值选择模型内生性检验方法;20.2SRI还是2SPS, 内生性问题的二阶段CF法实现;21.内生变量的交互项如何寻工具变量;22.工具变量精辟解释, 保证你一辈子都忘不了,23.审稿人: 为啥你不展示Y对工具变量Z的简约式回归结果呢?24.Two Sample IV, 双样本二阶段工具变量回归, TS2SLS充分利用2份数据的信息,25.Stata自救行动: 高维固定效应HDFE, 弱工具变量稳健性估计, 工具变量SVAR
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


计量经济圈
凡是搞计量经济的,都关注这个号了。
 最新文章