Bartik工具变量法在因果识别和政策评估等社会科学研究中的应用日益广泛,受到了越来越多的关注。然而,在大部分国内经济学经验研究中,该方法存在应用不规范甚至是误用的问题。下面这篇文章结合理论计量的基本原理和前沿成果,尝试在一个统一的标准分析框架下,对Bartik工具变量法在因果识别中的应用进行系统性的归纳总结,以厘清其在实践应用中需要注意的一些问题。
该文首先梳理了Bartik工具变量法的发展脉络,明确了Bartik工具变量的经典设定以及推广延伸;其次阐述了Bartik工具变量法在因果识别中的基本策略,归纳分析了Bartik工具变量在实际构建过程中的一些常见问题,包括如何计算观测样本的份额权重、如何设定政策冲击的维度等;然后详细分析了Bartik工具变量法在因果识别中的应用条件,并结合具体例子作出了解释说明;最后在此基础上,提出了一个详细的操作清单,并以贸易政策的影响研究为例,全面展示了该方法的应用实践。
1.Bartik IV构建操作程序和步骤, 使用该IV策略的AER数据和code及中英文文献,2.此文的研究发现, 可能会与AER“上山下乡”一样充满争议, 连续DID, 队列DID和Bartik IV,3.AER: 中国城乡迁徙与企业生产, 移动份额工具变量法Bartik,4.Bartik工具变量是什么? 份额移动法IV应用越来越多,5.TOP5前沿: 时下最流行的移动份额工具变量SSIV研究设计指南!6.免费4门课程, 因果推断1和2, IV, 份额移动IV和高级DID, 附数据,代码,讲义和阅读清单, 7.不研究人, 经济学开始研究鸟儿了, DID-TWFE, Bartik IV, 零第一阶段ZFS检验值得参考, 8.Bartik工具变量法最新发展和使用方法流程图总结,9.
余振,李萌,庄额嘉,2024.Bartik工具变量法在因果识别中的应用与检验[J].数量经济技术经济研究,1-21.
一、引言
自20 世纪80 年代“可信度革命”兴起以来,经济学的经验研究发生了深刻的变化,不仅更加强调研究设计的重要性,即基于实验和准实验数据,运用计量经济学中的方法,识别和论证经济现象之间的因果关系(Angrist 和Pischke,2010),而且更加重视研究方法运用的可信度与有效性(Bertrand 等,2004;Baker 等,2022;Lal 等,2023)。社会经济活动中的各种关系错综复杂,验证特定的因果关系常常需要处理内生性问题,其中,工具变量法是一个经常使用的方法。存在有效的工具变量是使用工具变量法的前提,然而由于相关性和外生性要求,在实践中通常难以寻找到合适的工具变量。在此背景下,Bartik(1991)将宏观统计数据和微观人口调查数据结合起来,构建了工具变量,从地区和个体层面识别了就业增长与失业率、劳动参与、工作时长、房价和其他价格指数、工资收入等因素之间的因果关系。Bartik 工具变量法(又称shift-share 工具变量)由此得名,并在Blanchard 和Katz(1992)的研究中被进一步推广。早期采用Bartik 工具变量的研究多将其定义为通过地区行业份额与国家就业变化交乘得出的地区劳动需求冲击,即各地区受到的劳动需求冲击是以地区就业份额为权重的全国各行业就业变化的加权平均。随着“可信度革命”的深入和政策评估研究的兴起,越来越多的研究者应用Bartik 工具变量法识别和论证了各类政策的因果效应。
近年来,Bartik 工具变量法在因果识别和政策评估等社会科学领域的研究中受到了日益广泛的关注和应用。研究者只需要结合特定的政策冲击,选取和计算出观测对象的份额权重,就可以通过加权平均的形式构建出研究所需的工具变量,进而展开因果识别。然而,在目前的国内经济学经验研究中,大部分研究者是将Bartik 工具变量法作为一种对政策冲击更精确的分解方式,在将国家-行业层面的政策冲击分解到地区或企业层面后,引入回归估计中作为一个解释变量使用,又或是在稳健性检验中借鉴Bartik 工具变量的基本结构,通过加权平均构建工具变量论证文章的内生性问题,即将该方法作为一种变量构建方式来使用。这一方面可能是遵循既往研究的实证分析习惯,另一方面也可能是没有深刻、准确地理解Bartik工具变量法的理论蕴涵,忽略了其作为一种工具变量本身所需要满足的基本条件。同时,使用Bartik 工具变量法进行因果识别的过程中,各种细节问题也容易被研究者们忽视或引起困扰,例如,如何确定份额权重、如何选择基期、政策冲击在哪一种分类标准下进行分解比较合适等等。这些问题不仅会给研究者准确使用Bartik 工具变量法带来阻碍,而且会使实证研究结论不可信甚至完全错误。但少有文献在统一框架下系统性地探讨Bartik 工具变量法的应用条件,总结在实践操作中需要注意的细节问题。鉴于此,本文梳理了Bartik 工具变量法的发展脉络,尝试在一个统一的标准分析框架下,从理论原理出发,对Bartik 工具变量法在因果识别中的基本策略、应用条件和实践的常见问题做出系统性分析总结,以期为社会科学各领域的研究者应用Bartik 工具变量法进行因果识别提供一些参考,进一步增强该方法应用的有效性和科学性。
本文接下来的结构安排如下:第二部分对Bartik 工具变量法的历史发展脉络进行梳理。第三部分阐述了Bartik 工具变量法在因果识别中的基本策略,并讨论了Bartik 工具变量在实际构建过程中的一些常见问题。第四部分详细讨论了Bartik 工具变量法在因果识别中的应用条件。第五部分提出了Bartik 工具变量法在实际应用中的操作清单,并以贸易政策的影响研究为例,对该方法的实践操作进行了全面展示。第六部分针对Bartik 工具变量法在贸易政策研究中的应用实践,进行了各种检验分析和数值模拟。第七部分是总结和展望。
二、Bartik 工具变量法的发展脉络
在构建Bartik 工具变量用于因果识别时,存在两个核心部分,一是确定份额权重,二是量化政策冲击。可见,份额权重的选择对于Bartik 工具变量法的应用具有重要的影响。因此,本部分以Bartik 工具变量法在变量构建中的份额权重设定为线索,梳理了该方法的应用与发展。
(一)基于Bartik 经典设计的份额权重设定
Bartik 工具变量法的首次正式应用是在劳动经济学的研究中。学者Timothy J. Bartik 在评估美国各州和地区经济发展政策效应时,将25 个大都市统计区在1970 年的就业比例与国家层面1972—1973 年和1985—1986 年的就业增长率交乘,以此将国家层面的就业增长分解到微观地区层面,作为地区就业增长率的工具变量进行回归估计。Bartik 工具变量法由此得名,而后在Blanchard 和Katz(1992)的研究中被应用推广。Blanchard 和Katz(1992)基于美国50 个州在1970—1989 年间的就业数据,以各州前置期2 位行业分类代码下各行业的就业比例作为权重,对国家层面各行业(加总至2 位行业分类代码)的就业增长率进行加权分解,作为各州就业增长率的工具变量,进而识别其与工资变化、失业率变化之间的因果关系。早期研究基本是将地区-行业的就业份额作为权重,对国家-行业层面的就业变化进行加权分解。这种以就业比例为权重,加权分解就业变化的研究设计,也被后续众多学者沿用(Charles 等,2019;孙伟增等,2019;张吉鹏等,2020;赵奎等,2021)。
随后,学者们基于相同的份额权重设定方式,开始选择不同的政策影响进行因果识别。Topalova(2005)、Autor 等(2013)等学者以地区就业比例为份额权重,对国家关税削减、进出口扩张等贸易政策变化带来的影响进行加权分解。Diamond(2016)、毛其淋和盛斌(2021)等学者采用类似的方式,将国家层面的工资收入水平分解到地区层面,进而展开实证检验。伴随科技革命的深入推进,人工智能技术迅速发展,成为学者和研究人员日益重视的热点问题,Acemoglu 和Restrepo(2020)、陈媛媛等(2022)、王晓娟等(2022)、许健等(2022)、董直庆等(2023)、何小钢和刘叩明(2023)等学者基于Bartik 工具变量法的思路,以地区的就业比例为权重,将行业层面的机器人渗透率分解到地区层面,识别了人工智能与工资、就业、劳动力流动和企业规模分布之间的因果关系。王永钦和董雯(2020)、沈坤荣等(2024)则以企业生产部门员工占比和制造业生产部门员工占比的比值为权重,进一步将数据分解到企业层面,从企业层面检验了机器人应用的因果效应。
(二)拓展Bartik 经典设计的份额权重设定
伴随着学术研究的深入,学者们参考和借鉴Bartik 工具变量的核心构建思路,对份额权重加以变形和转化,并展开了研究分析,推广和拓展了Bartik 工具变量法的使用范围。这类拓展应用源于Card(2001)的研究,Card(2001)为了检验政策变化引致的外来劳动力流入对本地劳动力和区域劳动力市场产生的影响,采用Bartik 工具变量法,将国家层面的移民流入按各地区早期的移民流入结构进行加权分解,以解决因果识别中由劳动需求冲击导致的内生性问题。此后,大量有关劳动力流动和移民问题的影响研究都借鉴了该方法,基于相同的份额权重构建了Bartik 工具变量,进而实证检验了政策的因果效应(Peri,2015;Tabellini,2020;Imbert 等,2022;唐为等,2024)。
由于微观数据可获得性的提高和研究方法的推广,越来越多的学者从理论模型和现实经济环境出发,选取了各类不同政策冲击和相应的份额权重,运用Bartik 工具变量法检验政策和影响间的因果关系。Hummels 等(2014)、毛日昇和陈瑶雯(2021)等学者以进出口贸易结构为份额权重,构建了地区或企业层面的Bartik 工具变量。在数字化浪潮下,沈国兵和袁征宇(2020)、方明月等(2022)、董松柯等(2023)、何雅兴等(2023)、刘诚(2023)、卢福财等(2024)、周亚虹等(2023)和申志轩等(2024)均采用Bartik 工具变量法的构建思路,以企业数字化转型程度占比、城市特牌酒店占比、县域普惠金融指数和企业数字采购订单数占比等为份额权重,构建了不同层面的Bartik 工具变量,用于识别数字化发展进程中的各种因果效应。此外,陈诗一和陈登(2018)、杜鹏程等(2021)、毛捷和曹婧(2021)、郝颖等(2023)、毛其淋等(2024)、江鑫等(2024)众多学者在识别环境污染、社会保险、税费改革、经济集聚、贸易网络深化和政府绿色采购等影响时,也选取了合适的评估对象和权重,通过Bartik 工具变量法展开研究分析。
系统梳理Bartik 工具变量法在研究中的应用,可以发现最初使用该方法的研究均延续了Bartik(1991)的经典设定。随着学术研究的深入,学者们基于理论模型和现实问题,逐渐开始对经典设定进行变形转化,进一步拓展了Bartik 工具变量法的应用场景。然而,在众多国内经济学研究中,鲜少有学者关注到Bartik 工具变量在构建过程中需要注意的细节问题,也很少判断和检验其研究设计中是否满足Bartik 工具变量法在因果识别中的应用条件。这既不利于实证研究的可信度,也不利于因果识别的规范发展。
第三部分阐述了Bartik 工具变量法在因果识别中的基本策略,并讨论了Bartik 工具变量在实际构建过程中的一些常见问题。
第四部分详细讨论了Bartik 工具变量法在因果识别中的应用条件。
第五部分提出了Bartik 工具变量法在实际应用中的操作清单,并以贸易政策的影响研究为例,对该方法的实践操作进行了全面展示。
第六部分针对Bartik 工具变量法在贸易政策研究中的应用实践,进行了各种检验分析和数值模拟。
第七部分是总结和展望。
*群友可直接在社群下载全文PDF。
内生性问题的拓展性阅读 ,0.看完顶级期刊文章后, 整理了内生性处理小册子;1.“内生性” 到底是什么鬼? New Yorker告诉你;2.Heckman两步法的内生性问题(IV-Heckman);3.IV和GMM相关估计步骤,内生性、异方差性等检验方法;4.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题;5.毛咕噜论文中一些有趣的工具变量!;6.非线性面板模型中内生性解决方案;7.内生性处理的秘密武器-工具变量估计;8.内生性处理方法与进展;9.内生性问题和倾向得分匹配;10.你的内生性解决方式out, ERM独领风骚;11.工具变量IV必读文章20篇, 因果识别就靠他了;12.面板数据是怎样处理内生性的;13.计量分析中的内生性问题综述;14.工具变量IV与内生性处理的解读;15.一份改变实证研究的内生性处理思维导图;16.Top期刊里不同来源内生性处理方法;17.面板数据中heckman方法和程序(xtheckman);18.控制函数法CF, 处理内生性的广义方法;19.二值选择模型内生性检验方法;20.2SRI还是2SPS, 内生性问题的二阶段CF法实现;21.内生变量的交互项如何寻工具变量;22.工具变量精辟解释, 保证你一辈子都忘不了,23.审稿人: 为啥你不展示Y对工具变量Z的简约式回归结果呢?24.Two Sample IV, 双样本二阶段工具变量回归, TS2SLS充分利用2份数据的信息,25.Stata自救行动: 高维固定效应HDFE, 弱工具变量稳健性估计, 工具变量SVAR
7年,计量经济圈近2000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle