近年来这些关于双重差分法DID的新研究是否改变了学术界的研究方向？

学术 2024-11-13 16:01 英国

凡是搞计量经济的，都关注这个号了

邮箱：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

Scott Cunningham教授做了一个关于双重差分文章和他们影响力的比较，看了之后发现3篇DID文章直接改变了一个期刊JOE的命运。

关于Scott Cunningham，1.一位“诗人”教授写了本因果推断书籍, 现在可以直接下载PDF参看！2.这本书成了耶鲁和MIT教材后, 中文版“因果推断”力作也译出来了！3.我是如何从一个诗人变成一个计量实证高手, 并且还出版了一本计量书籍！4.从网页上直接复制代码的因果推断书籍出现了, 学会主流方法成效极快

几年前，Guido Imbens 和 Susan Athey 曾强调，合成控制方法（Synthetic Control Methods）是过去15年（如今已超过20年）因果推断领域最重要的创新之一。然而，就在一周前，Andrew Goodman-Bacon 在2021年发表的关于处理时间上存在变化的双重差分法（Difference-in-Differences, DiD）一文《Difference-in-differences with variation in treatment timing》的引用量已经超过了那篇开创性的合成控制方法文章《Synthetic Control Methods for Comparative Case Studies》。

因此，下面将首先概述一些关于Goodman-Bacon文章的关键事实，然后深入探讨该文章与另外两篇共同获得Journal of Econometrics奖的论文之间的联系。最后，将公开探讨一个可能性：近年来这些关于双重差分法（DiD）的新研究是否可能影响学术界的研究方向，导致人们逐渐偏离合成控制方法。接下来，将详细阐述这些观点。

在我看来，这三篇论文构成了关于双重差分法（DiD）中异质性处理效应的核心文献，并且荣获了2022年Journal of Econometrics（JOE）的Aigner和Zellner奖项。它们分别是Bacon的文章，Brant Callaway和Pedro Sant’Anna的论文，以及Sophie Sun和Sarah Abraham的论文。尽管这些论文有许多相似之处，但每篇都展现了其独到之处。

*群友可直接在社群下载这三篇DID文章。

1.Bacon的论文对经典的双向固定效应模型进行了深入分析，指出处理效应需要保持恒定，以便估计量能够识别平均处理效应（ATT）。这是因为双向固定效应（TWFE）估计的是所有潜在2x2系数的加权平均值，包括将处理组与已经处理的组进行比较的系数。这篇文章已被引用6,489次。

2.Callaway和Sant’Anna的论文，简称CS，提出了一种估计量，计算小的构建块参数，称为群体-时间ATT的加权平均。通过将双重差分问题按组别逐一分析，并且仅使用组内未处理个体，该方法避免了Bacon所示的经典TWFE模型中固有的问题。此外，文章还提出了不同的协变量处理方式，明确了条件平行趋势假设在该背景下的含义，并证明了估计量满足半参数效率界限。这篇文章已被引用5,849次。

3.Sun和Abraham的论文，简称SA，既对差异化时间下的事件研究系数进行分解（与Bacon在静态模型中的做法类似），也提出了类似的解决方案，识别了群体-时间ATT（他们称之为队列-时间ATT），并提出了多种加权方案。SA清晰地展示了事件研究系数的分解，说明了一个问题，即其他时期和组别中的处理效应“渗透”到每个事件研究系数中（或污染了它们）。这些处理效应被正负权重相乘，权重之和为零，因此如果所有处理效应相同，它们会相互抵消；但如果这些效应在各组间的时间路径不同（即各组的效应路径不同），它们就无法抵消，事件研究系数就会被重新加权，产生负向偏差。这篇文章已被引用4,029次。

这三篇论文自2021年底起，总引用量已达到约16,400次，成为了全球具有巨大影响力和学术价值的文章。它们之所以引人注目，是因为都在同年、同一份期刊上发表。这激发了我的好奇心，我想知道Journal of Econometrics的影响因子是多少。经过查询，发现它的影响因子在2024年高达9.9。

我有些惊讶地想，“9.9？我原本以为经济学期刊的影响因子通常不会这么高。”我平时不太关注影响因子，所以经常会忘记具体数值，但我印象中QJE的影响因子似乎在十几左右。

因此，我决定通过Wayback Machine亲自查看Journal of Econometrics（JOE）历年的影响因子。结果，找到了以下信息：

从2019年到2024年，JOE的影响因子分别为：

2019年：1.949
2020年：1.949
2021年：1.577
2022年：2.388
2023年：6.3
2024年：9.9

将这些数据输入ChatGPT，要求它用Python绘制一个时间序列图，并附上以下标题。说实话，这可能是我唯一一个100%相信并清楚显示任何事物平均处理效应的时间序列图，更不用说是3篇论文了。

那么，这个增长到底有多大呢？来看看这个。以下是所有经济学TOP 5期刊的影响因子截图。它们的影响因子范围从RES的5.9，到QJE的11.1。

Top 5刊影响因子

在手头的影响因子数据准确的前提下，以下是对各大期刊影响因子的汇总。我本可以采用双重差分法来分析这些数据，追溯至2021年之前的影响因子，以更准确地评估那三篇论文，总共获得超过16,000次引用，是否真的推动了JOE影响因子的六倍增长，超越了这些论文自身的影响。但目前，让我们先观察一下这些图表，你会发现，在这三篇论文发表之前，JOE的影响因子一直维持在1.9或更低，而如今已经实现了六倍的增长。

我提到的JOE影响因子的上升趋势可能有所夸大，但如果确实存在偏差，我想这个偏差也不会太大。如果能够将这三篇论文完全从期刊影响因子的计算中排除，影响因子会下降多少呢？可能不会完全回落到2，因为JOE在2023年还发表了一篇关于双重差分法的综述文章（What’s Trending in Diff-in-Diff），该文章已经获得了超过1,312次引用。此外，2020年，Sant’Anna和Zhao的双重稳健双重差分法论文也已发表。尽管我们必须实际重新计算影响因子，才能确切知道去除这三篇论文后的影响因子是多少，但直觉告诉我，双重差分法，尤其是这三篇论文，已经使JOE转变为一本极具影响力的期刊，甚至超越了一些Top 5期刊的影响因子（除了QJE和AER）。这可谓是“双重差分法成就的期刊”。

在计量经济学领域，论文通常不会迅速获得大量引用，而那些被广泛引用的论文往往是经过长时间积累的结果。我们可以将Joshua Angrist和Guido Imbens关于局部平均处理效应（LATE）的著名论文作为比较。他们的一篇论文发表于1994年，在Econometrica上，另一篇与Don Rubin合作的论文发表于1996年，在Journal of American Statistical Association上。这两篇论文的引用量分别为6,804次和8,027次。

Google Scholar的一个突出特点是，它能够提供特定文献随时间变化的引用数据。这使得我们能够计算每年的日均引用率，并据此进行预测。以Bacon的论文和Imbens与Angrist在1994年发表的论文为例，根据它们在2024年的日均引用率进行预测，假设它们保持这一增长速度，来预测它们何时会产生交叉。Bacon的论文在2024年的增长速度是每天6.59次引用，而Imbens和Angrist 1994年的论文增长速度是每天1.47次。按照这个速度，从今天起算，这两篇论文将在2024年12月22日交叉。

接下来，对Angrist、Imbens和Rubin在1996年发表的论文进行了类似的计算。它2024年日均增长速度略高于1994年的论文，每天增长1.67次引用。尽管它的引用基数高于Bacon的论文，但按照这个速度，Bacon的论文将在2025年8月30日超越它。

虽然主要集中讨论Bacon、CS和SA三篇论文，但还有其他一些论文也值得关注，如de Chaisemartin和D'Haultfoeuille的论文（引用量为4100次）以及Borusyak等的论文（引用量为2800次），它们独立识别了经典双向固定效应的问题，并提出了使用平行趋势假设来识别平均处理效应的替代解决方案。任何一篇论文的影响都不能孤立于其他论文，因为它们都涉及相同的主题，通常在同一时间被大量引用，可以看作是在讨论双向固定效应和双重差分法（diff-in-diff）相关的异质处理效应问题时的“引用块”。问题的核心在于，围绕dCDH、BJS、CS、SA以及Bacon这些论文的研究成果，尤其是那些在2020年和2021年发表的四篇论文，可能对学术研究的趋势产生了深远的影响。我特别关注2021年，因为在那一年，JOE上发表了三篇被引用次数极高的论文，它们似乎直接且显著地提升了该期刊的影响因子，使其在短短三年内超越了三本顶级的Top 5期刊，这种情况我怀疑是前所未有的。

究竟是什么原因导致了这样的现象呢？双重差分法作为一种研究工具确实备受青睐，而Bacon等所揭示的问题可能在应用研究领域引起了广泛的共鸣。这与应用研究界长期以来主要依赖双重差分法进行项目评估的实践密切相关，这种依赖与职业发展的趋势变化有着直接的联系。例如，研究领域正逐渐转向更为具体的项目评估、普遍的实证研究，以及对更广泛理论研究的相对忽视。此外，之前的研究文献中，几乎完全依赖于普通最小二乘法（OLS）和时间面板单位固定效应的双重差分法，这种丰富性也为当前的研究趋势提供了坚实的基础。

现在让我们大致看一下不同研究设计的趋势。以下是Currie等（2020）的三张图表，这些图表展示了从1980到2018年NBER工作论文和2004到2018年Top 5期刊中，使用不同研究设计术语（如双重差分法）的论文数量。他们搜索了“双重差分法”（左图）、“工具变量”（中图）和“合成控制”（右图）等词汇的出现频率。

这确实彰显了计量经济学家在热门研究领域中所能产生的巨大影响。例如，合成控制在2018年大约占所有NBER工作论文的2%，而双重差分法（diff-in-diff）的占比则高达25%。尽管工具变量（IV）被提及的频率更高，但如果我们将工具变量限定为那种备受推崇的“可信度工具变量”风格，其提及次数可能会有所减少。

Paul Goldsmith-Pinkham的研究将这一分析扩展到了2024年中期。他发现，如果延续双重差分法和合成控制的使用趋势，并且根据他对不同子领域的细分，双重差分法在应用微观经济学领域的应用比例目前已达到约32%，这一比例甚至超过了Currie等在2020年发现的工具变量的最大应用比例。

但值得注意的是，自2021年以来，合成控制的应用比例从约3.5%的高峰开始急剧下降。2021年不仅是合成控制的高峰年，也是Bacon、CS和SA三篇论文发表的年份，紧接着便是dCDH论文的发表。

合成控制和双重差分法并不是完美无缺的替代品。尽管它们各自拥有不同的假设前提和计算方式，但它们共同追求的核心目标是一致的，即估计处理组的平均处理效应（ATT）。这两种方法都是因果面板数据分析中不可或缺的工具。实际上，在某些情况下，比如在我与Manisha Shah合作的论文中，你会看到研究者将这两种方法中的某一种用作稳健性检验。这是因为，对于许多应用研究者来说，尽管这两种方法在底层结构和相关假设上存在差异，但从实际操作的角度来看，在许多情况下，合成控制和双重差分法几乎成为了事实上的替代选择。

这引出了一个问题：这些双重差分法论文的巨大影响力，尤其是其中仅有的几篇，是否实际上正在将研究焦点从合成控制转移开来，而合成控制在2021年之前还一直在稳步增长。记住，Athey和Imbens曾经提到，合成控制是过去二十年里因果推断领域最重要的创新。

我曾分享过一些关于这一主题的见解，但颇具讽刺意味的是，我实际上预见到，双重差分法文献的涌现可能会导致合成控制方法应用的增加，而不是减少。我这样推断的原因是，尽管人们常常诟病合成控制方法缺乏透明度，认为回归分析更加透明，然而随着我们对普通最小二乘回归（OLS）性质的进一步认识，发现OLS回归的透明度也并不如人们所期望的那样高。因此，合成控制与双向固定效应（TWFE）之间的相对优势差距可能会缩小，这可能会导致研究者在某些情况下更倾向于选择合成控制方法。

*可以进一步到社群交流讨论前沿DID方法。
关于多期DID或交叠DID: 1.DID相关前沿问题“政策交错执行+堆叠DID+事件研究”, 附完整slides，2.交错(渐进)DID中, 用TWFE估计处理效应的问题, 及Bacon分解识别估计偏误，3.典范! 这篇AER在一图表里用了所有DID最新进展方法, 审稿人直接服了！4.最新Sun和Abraham(2020)和TWFE估计多期或交错DID并绘图展示结果！详细解读code！5.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习，6.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等，7.交叠DID中平行趋势检验, 事件研究图绘制, 安慰剂检验的保姆级程序指南！8.欣慰! 营养午餐计划终于登上TOP5! 交叠DID+异质性稳健DID！9.用事件研究法开展政策评估的过程, 手把手教学文章！10.从双重差分法到事件研究法, 双重差分滥用与需要注意的问题，11.系统梳理DID最新进展: 从多期DID的潜在问题到当前主流解决方法和代码! 12.标准DID中的平行趋势检验,动态效应, 安慰剂检验, 预期效应教程，13.DID从经典到前沿方法的保姆级教程, 释放最完整数据和代码！
关于合成控制法：1.分享一篇使用合成控制法SCM进行实证研究的文章的代码，2.用合成控制法, 机器学习和面板数据模型开展政策评估的论文！3.中文刊上用断点回归RDD和合成控制法SCM的实证文章有哪些？不看至少需要收藏一下！4.合成控制法创始人如何用SCM做实证呢？这些规定动作一个都不能少！5.最新: 运用机器学习和合成控制法研究武汉封城对空气污染和健康的影响! 6.关于合成控制法SCM的33篇精选Articles专辑！小组惊动了阿里巴巴！7.DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征，8.合成控制法SCM新进展, 直接通过代码演示, 附数据和code！9.上一日删除的帖子及TOP5刊原文PDF！10.复现AER"大运河"DID, CIC和SCM等方法的文献保姆级教程, 直接上手！11.牛! 把整个国家作为处理组用合成控制法和EVAR发表到国际TOP刊，12.合成控制法SCM新进展, 直接通过代码演示, 附数据和code！
关于因果推断书籍：1.一本最新因果推断书籍, 包括了机器学习因果推断方法, 学习主流和前沿方法，2.社会经济政策的评估计量经济学, 提供书籍和数据和程序文件，3.诺奖得主Angrist的因果推断课程文献读物单子再次更新了, 还提供了其他三门课程，4.全面且前沿的因果推断课程, 提供视频, 课件, 书籍和经典文献，5.从网页上直接复制代码的因果推断书籍出现了, 学会主流方法成效极快，6.推荐书籍"用R软件做应用因果分析", 有需要的学者可以自行下载！7.哪本因果推断书籍最好？我们给你整理好了这个书单！8.“不一样”的因果推断书籍, 很多观点让我们能恍然大悟, 涵盖了不少其他书里没有的因果推断方法！9.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好！10.一位“诗人”教授写了本因果推断书籍, 现在可以直接下载PDF参看！11.使用R软件学习计量经济学方法三本书籍推荐，12.机器学习与Econometrics的书籍推荐, 值得拥有的经典，13.史上最全的因果识别经典前沿书籍, 仅此一份，14.用R语言做Econometrics的书籍推荐, 值得拥有的经典，15.Stata学习的书籍和材料大放送, 以火力全开的势头，16.USA经管商博士最狂热崇拜的计量书籍震撼出炉，17.推荐使用Python语言做因果推断前沿方法的书籍，18.一些比较常见的因果推断书籍25本汇总, 很多可以直接下载PDF，19.推荐一本专攻处理效应分析的书籍, 包括主流政策评估计量方法

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

7年，计量经济圈近2000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

计量经济圈组织了一个计量社群，有如下特征：热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此，建议积极进取和有强烈研习激情的中青年学者到社群交流探讨，始终坚信优秀通过感染优秀而互相成就彼此。

http://mp.weixin.qq.com/s?__biz=MjM5OTMwODM1Mw==&mid=2448123618&idx=1&sn=1738565b4723660a100abe5a41535836