需要看! Bartik工具变量法在因果识别中的应用与检验的综述, 从源头到使用清单及步骤和注意事项全部齐了

学术 2024-12-04 18:22 美国

凡是搞计量经济的，都关注这个号了

邮箱：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

Bartik工具变量法在因果识别和政策评估等社会科学研究中的应用日益广泛，受到了越来越多的关注。然而，在大部分国内经济学经验研究中，该方法存在应用不规范甚至是误用的问题。下面这篇文章结合理论计量的基本原理和前沿成果，尝试在一个统一的标准分析框架下，对Bartik工具变量法在因果识别中的应用进行系统性的归纳总结，以厘清其在实践应用中需要注意的一些问题。

该文首先梳理了Bartik工具变量法的发展脉络，明确了Bartik工具变量的经典设定以及推广延伸；其次阐述了Bartik工具变量法在因果识别中的基本策略，归纳分析了Bartik工具变量在实际构建过程中的一些常见问题，包括如何计算观测样本的份额权重、如何设定政策冲击的维度等；然后详细分析了Bartik工具变量法在因果识别中的应用条件，并结合具体例子作出了解释说明；最后在此基础上，提出了一个详细的操作清单，并以贸易政策的影响研究为例，全面展示了该方法的应用实践。

Bartik工具变量法在因果识别中的应用与检验

1.Bartik IV构建操作程序和步骤, 使用该IV策略的AER数据和code及中英文文献，2.此文的研究发现, 可能会与AER“上山下乡”一样充满争议, 连续DID, 队列DID和Bartik IV，3.AER: 中国城乡迁徙与企业生产, 移动份额工具变量法Bartik，4.Bartik工具变量是什么? 份额移动法IV应用越来越多，5.TOP5前沿: 时下最流行的移动份额工具变量SSIV研究设计指南！6.免费4门课程, 因果推断1和2, IV, 份额移动IV和高级DID, 附数据,代码,讲义和阅读清单, 7.不研究人, 经济学开始研究鸟儿了, DID-TWFE, Bartik IV, 零第一阶段ZFS检验值得参考, 8.Bartik工具变量法最新发展和使用方法流程图总结，9.

余振,李萌,庄额嘉，2024.Bartik工具变量法在因果识别中的应用与检验[J].数量经济技术经济研究,1-21.

一、引言

自20 世纪80 年代“可信度革命”兴起以来，经济学的经验研究发生了深刻的变化，不仅更加强调研究设计的重要性，即基于实验和准实验数据，运用计量经济学中的方法，识别和论证经济现象之间的因果关系（Angrist 和Pischke，2010），而且更加重视研究方法运用的可信度与有效性（Bertrand 等，2004；Baker 等，2022；Lal 等，2023）。社会经济活动中的各种关系错综复杂，验证特定的因果关系常常需要处理内生性问题，其中，工具变量法是一个经常使用的方法。存在有效的工具变量是使用工具变量法的前提，然而由于相关性和外生性要求，在实践中通常难以寻找到合适的工具变量。在此背景下，Bartik（1991）将宏观统计数据和微观人口调查数据结合起来，构建了工具变量，从地区和个体层面识别了就业增长与失业率、劳动参与、工作时长、房价和其他价格指数、工资收入等因素之间的因果关系。Bartik 工具变量法（又称shift-share 工具变量）由此得名，并在Blanchard 和Katz（1992）的研究中被进一步推广。早期采用Bartik 工具变量的研究多将其定义为通过地区行业份额与国家就业变化交乘得出的地区劳动需求冲击，即各地区受到的劳动需求冲击是以地区就业份额为权重的全国各行业就业变化的加权平均。随着“可信度革命”的深入和政策评估研究的兴起，越来越多的研究者应用Bartik 工具变量法识别和论证了各类政策的因果效应。

近年来，Bartik 工具变量法在因果识别和政策评估等社会科学领域的研究中受到了日益广泛的关注和应用。研究者只需要结合特定的政策冲击，选取和计算出观测对象的份额权重，就可以通过加权平均的形式构建出研究所需的工具变量，进而展开因果识别。然而，在目前的国内经济学经验研究中，大部分研究者是将Bartik 工具变量法作为一种对政策冲击更精确的分解方式，在将国家-行业层面的政策冲击分解到地区或企业层面后，引入回归估计中作为一个解释变量使用，又或是在稳健性检验中借鉴Bartik 工具变量的基本结构，通过加权平均构建工具变量论证文章的内生性问题，即将该方法作为一种变量构建方式来使用。这一方面可能是遵循既往研究的实证分析习惯，另一方面也可能是没有深刻、准确地理解Bartik工具变量法的理论蕴涵，忽略了其作为一种工具变量本身所需要满足的基本条件。同时，使用Bartik 工具变量法进行因果识别的过程中，各种细节问题也容易被研究者们忽视或引起困扰，例如，如何确定份额权重、如何选择基期、政策冲击在哪一种分类标准下进行分解比较合适等等。这些问题不仅会给研究者准确使用Bartik 工具变量法带来阻碍，而且会使实证研究结论不可信甚至完全错误。但少有文献在统一框架下系统性地探讨Bartik 工具变量法的应用条件，总结在实践操作中需要注意的细节问题。鉴于此，本文梳理了Bartik 工具变量法的发展脉络，尝试在一个统一的标准分析框架下，从理论原理出发，对Bartik 工具变量法在因果识别中的基本策略、应用条件和实践的常见问题做出系统性分析总结，以期为社会科学各领域的研究者应用Bartik 工具变量法进行因果识别提供一些参考，进一步增强该方法应用的有效性和科学性。

本文接下来的结构安排如下：第二部分对Bartik 工具变量法的历史发展脉络进行梳理。第三部分阐述了Bartik 工具变量法在因果识别中的基本策略，并讨论了Bartik 工具变量在实际构建过程中的一些常见问题。第四部分详细讨论了Bartik 工具变量法在因果识别中的应用条件。第五部分提出了Bartik 工具变量法在实际应用中的操作清单，并以贸易政策的影响研究为例，对该方法的实践操作进行了全面展示。第六部分针对Bartik 工具变量法在贸易政策研究中的应用实践，进行了各种检验分析和数值模拟。第七部分是总结和展望。

二、Bartik 工具变量法的发展脉络

在构建Bartik 工具变量用于因果识别时，存在两个核心部分，一是确定份额权重，二是量化政策冲击。可见，份额权重的选择对于Bartik 工具变量法的应用具有重要的影响。因此，本部分以Bartik 工具变量法在变量构建中的份额权重设定为线索，梳理了该方法的应用与发展。

（一）基于Bartik 经典设计的份额权重设定

Bartik 工具变量法的首次正式应用是在劳动经济学的研究中。学者Timothy J. Bartik 在评估美国各州和地区经济发展政策效应时，将25 个大都市统计区在1970 年的就业比例与国家层面1972—1973 年和1985—1986 年的就业增长率交乘，以此将国家层面的就业增长分解到微观地区层面，作为地区就业增长率的工具变量进行回归估计。Bartik 工具变量法由此得名，而后在Blanchard 和Katz（1992）的研究中被应用推广。Blanchard 和Katz（1992）基于美国50 个州在1970—1989 年间的就业数据，以各州前置期2 位行业分类代码下各行业的就业比例作为权重，对国家层面各行业（加总至2 位行业分类代码）的就业增长率进行加权分解，作为各州就业增长率的工具变量，进而识别其与工资变化、失业率变化之间的因果关系。早期研究基本是将地区-行业的就业份额作为权重，对国家-行业层面的就业变化进行加权分解。这种以就业比例为权重，加权分解就业变化的研究设计，也被后续众多学者沿用（Charles 等，2019；孙伟增等，2019；张吉鹏等，2020；赵奎等，2021）。

随后，学者们基于相同的份额权重设定方式，开始选择不同的政策影响进行因果识别。Topalova（2005）、Autor 等（2013）等学者以地区就业比例为份额权重，对国家关税削减、进出口扩张等贸易政策变化带来的影响进行加权分解。Diamond（2016）、毛其淋和盛斌（2021）等学者采用类似的方式，将国家层面的工资收入水平分解到地区层面，进而展开实证检验。伴随科技革命的深入推进，人工智能技术迅速发展，成为学者和研究人员日益重视的热点问题，Acemoglu 和Restrepo（2020）、陈媛媛等（2022）、王晓娟等（2022）、许健等（2022）、董直庆等（2023）、何小钢和刘叩明（2023）等学者基于Bartik 工具变量法的思路，以地区的就业比例为权重，将行业层面的机器人渗透率分解到地区层面，识别了人工智能与工资、就业、劳动力流动和企业规模分布之间的因果关系。王永钦和董雯（2020）、沈坤荣等（2024）则以企业生产部门员工占比和制造业生产部门员工占比的比值为权重，进一步将数据分解到企业层面，从企业层面检验了机器人应用的因果效应。

（二）拓展Bartik 经典设计的份额权重设定

伴随着学术研究的深入，学者们参考和借鉴Bartik 工具变量的核心构建思路，对份额权重加以变形和转化，并展开了研究分析，推广和拓展了Bartik 工具变量法的使用范围。这类拓展应用源于Card（2001）的研究，Card（2001）为了检验政策变化引致的外来劳动力流入对本地劳动力和区域劳动力市场产生的影响，采用Bartik 工具变量法，将国家层面的移民流入按各地区早期的移民流入结构进行加权分解，以解决因果识别中由劳动需求冲击导致的内生性问题。此后，大量有关劳动力流动和移民问题的影响研究都借鉴了该方法，基于相同的份额权重构建了Bartik 工具变量，进而实证检验了政策的因果效应（Peri，2015；Tabellini，2020；Imbert 等，2022；唐为等，2024）。

由于微观数据可获得性的提高和研究方法的推广，越来越多的学者从理论模型和现实经济环境出发，选取了各类不同政策冲击和相应的份额权重，运用Bartik 工具变量法检验政策和影响间的因果关系。Hummels 等（2014）、毛日昇和陈瑶雯（2021）等学者以进出口贸易结构为份额权重，构建了地区或企业层面的Bartik 工具变量。在数字化浪潮下，沈国兵和袁征宇（2020）、方明月等（2022）、董松柯等（2023）、何雅兴等（2023）、刘诚（2023）、卢福财等（2024）、周亚虹等（2023）和申志轩等（2024）均采用Bartik 工具变量法的构建思路，以企业数字化转型程度占比、城市特牌酒店占比、县域普惠金融指数和企业数字采购订单数占比等为份额权重，构建了不同层面的Bartik 工具变量，用于识别数字化发展进程中的各种因果效应。此外，陈诗一和陈登（2018）、杜鹏程等（2021）、毛捷和曹婧（2021）、郝颖等（2023）、毛其淋等（2024）、江鑫等（2024）众多学者在识别环境污染、社会保险、税费改革、经济集聚、贸易网络深化和政府绿色采购等影响时，也选取了合适的评估对象和权重，通过Bartik 工具变量法展开研究分析。

系统梳理Bartik 工具变量法在研究中的应用，可以发现最初使用该方法的研究均延续了Bartik（1991）的经典设定。随着学术研究的深入，学者们基于理论模型和现实问题，逐渐开始对经典设定进行变形转化，进一步拓展了Bartik 工具变量法的应用场景。然而，在众多国内经济学研究中，鲜少有学者关注到Bartik 工具变量在构建过程中需要注意的细节问题，也很少判断和检验其研究设计中是否满足Bartik 工具变量法在因果识别中的应用条件。这既不利于实证研究的可信度，也不利于因果识别的规范发展。

第三部分阐述了Bartik 工具变量法在因果识别中的基本策略，并讨论了Bartik 工具变量在实际构建过程中的一些常见问题。

第四部分详细讨论了Bartik 工具变量法在因果识别中的应用条件。

第五部分提出了Bartik 工具变量法在实际应用中的操作清单，并以贸易政策的影响研究为例，对该方法的实践操作进行了全面展示。

第六部分针对Bartik 工具变量法在贸易政策研究中的应用实践，进行了各种检验分析和数值模拟。

第七部分是总结和展望。

文章很长，很详细，有需要查看全文的，建议直接下载该文即可。

*群友可直接在社群下载全文PDF。

内生性问题的拓展性阅读，0.看完顶级期刊文章后, 整理了内生性处理小册子；1.“内生性” 到底是什么鬼? New Yorker告诉你；2.Heckman两步法的内生性问题(IV-Heckman)；3.IV和GMM相关估计步骤，内生性、异方差性等检验方法；4.最全估计方法，解决遗漏变量偏差，内生性，混淆变量和相关问题；5.毛咕噜论文中一些有趣的工具变量！；6.非线性面板模型中内生性解决方案；7.内生性处理的秘密武器－工具变量估计；8.内生性处理方法与进展；9.内生性问题和倾向得分匹配；10.你的内生性解决方式out, ERM独领风骚；11.工具变量IV必读文章20篇, 因果识别就靠他了；12.面板数据是怎样处理内生性的；13.计量分析中的内生性问题综述；14.工具变量IV与内生性处理的解读；15.一份改变实证研究的内生性处理思维导图；16.Top期刊里不同来源内生性处理方法；17.面板数据中heckman方法和程序(xtheckman)；18.控制函数法CF, 处理内生性的广义方法；19.二值选择模型内生性检验方法；20.2SRI还是2SPS, 内生性问题的二阶段CF法实现；21.内生变量的交互项如何寻工具变量；22.工具变量精辟解释, 保证你一辈子都忘不了，23.审稿人: 为啥你不展示Y对工具变量Z的简约式回归结果呢？24.Two Sample IV, 双样本二阶段工具变量回归, TS2SLS充分利用2份数据的信息，25.Stata自救行动: 高维固定效应HDFE, 弱工具变量稳健性估计, 工具变量SVAR

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

7年，计量经济圈近2000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

计量经济圈组织了一个计量社群，有如下特征：热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此，建议积极进取和有强烈研习激情的中青年学者到社群交流探讨，始终坚信优秀是通过感染优秀而互相成就彼此的。

计量经济圈

凡是搞计量经济的，都关注这个号了。

Stata18 MP版永久版可安装使用! 相对于17版确实有功能完备太多！

你几期数据就事前不行, 事后也不行，那你看看别人前后各40期的图多么具有信服力

2024年学者对实证计量方法关注热点的排行榜信息

读博能逆天改命吗? 首次因果证据: 不能

AEA亲自操刀: SSIV份额移动IV的使用指南说明, 思想, 程序命令和使用检查清单都清楚了

孔子首次上诺奖! 开讲! 2024年诺贝尔经济学奖AJR三位此生最重要Lecture, 必看！

咋还争起来了! 这篇TOP刊平行趋势到底通过没, 一些说有事前趋势, 一些说这不重要

宋铮等这篇文章终于在TOP刊发出来了! 标题太有趣. 交叠DID, 事件研究法, 结构估计, 引力模型测度

有趣! 经济学各领域实证方法的横向比较和纵向演变, 为啥有的领域用结构估计, 但其他领域不呢？

前沿: 什么样的经济学文章更容易被引用, 形成重大影响力? 发TOP刊并不意味引用多.

研究了4万篇论文, 发现什么样的文章更容易发表到经济学TOP5, TOP6-TOP100期刊呢？

需要看! Bartik工具变量法在因果识别中的应用与检验的综述, 从源头到使用清单及步骤和注意事项全部齐了

海龟博发会计TOP3, UTD24却放弃国内TOP商学院教职, 考上公务员进入体制去了.

好久没看到这种出乎意料但又是情理之中的文章了! 绝对印象深刻! 连续DID, IV, 地理断点等.

中国经济学年会上说的那篇300多页的TOP5刊论文找到了, 是这篇, 还给你做了细致讲解！

在DID评估中, 这种balance test表格或图可以用起来, 比较直观.

TOP刊: 看电视能够提高孩子成绩! 中国家长们真的错怪电视了! 识别策略, 稳健性检验, 异质性和机制分析都简单易懂

群友(美国TOP经济系博士和博后)突然说对学术界挺失望的, 也不知如何安慰。

必关注! 2025年经济学顶会AEA, 金融学顶会AFA年会议程定下来了, 这些论文值得关注！

经济学是否需要引入在金融会计TOP刊流行的路径分析作为机制检验新方法？

金融学在做机制分析时要大胆得多, 看这TOP刊做的工具变量的二步法检验！

温忠麟三步法之后, 又来了个江艇二步法, 机制分析容易惹争议！！

务必控制年份固定效应, 养成控制年份固定效应的习惯, 为啥控制年份固定效应很重要？

AER刚刊发! 4位美国学者发“像中国一样国际化”, 还为我国市场建立了一个理论模型！

又吵起来了! 说国内经济学研究是怎么了, 还有救么?

这样弄, 保证通过平行趋势! 通过PT检验的8大常规操作首次揭晓.

平行趋势不可靠, 范式变了, 需考虑事前趋势可靠性, 稳健性和敏感性检验! 附代码和数据

有启发! 将DID双重差分的最新进展整合到模型设定偏差的统一框架中进行解读

说这是, 人工智能AI对科学发现的影响的最佳论文! 研究发现让人倍感诧异, 太出乎意料了

近年来这些关于双重差分法DID的新研究是否改变了学术界的研究方向？

不研究人, 经济学开始研究鸟儿了, DID-TWFE, Bartik IV, 零第一阶段ZFS检验值得参考

这篇TOP5会让川普倍感头痛, 得对这作者恨得要死, 工具变量和机制分析很有看头

产业政策真复兴了! 美国经济学会JEP连续刊发5篇文章支持产业政策, 这样做实证产业政策！

机器学习中的9种常用距离度量方法

做政策评估时, 如何衡量一项政策的空间溢出效应呢？

18种机器学习ML算法对比解析, 及Python操作代码

2024年度国家社科基金重大项目立项名单公示！

川普让DID方法倒退至少1个月, 伍德里奇关小黑屋吃芹菜, 哈里斯爸爸书籍胎死腹中！

TOP刊: 看看这研究设计多精妙! 美国贸易政策真的改变了国际产业链吗? 中国真的被其他国家取代了吗?

TOP5主编实证: 像中国一样的产业政策很好, 得到国际认可! DID, 事件研究, 各种灵活计量模型设计！

TOP综述: “像中国一样的第三产业化”, 不说也知道作者是谁！

《经济研究》终于宣布公布文章附录, 数据和软件代码文件！！！

这TOP5太牛了! 高知左翼与商人右翼, 21个西方国家过去半个世纪政治分化的演变, Y为虚拟变量的面板回归如何做?

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉