UTD最新: 不想被直接拒稿, 就好好看2024年做DID的实用建议, 不然该刊编辑可直接桌拒

学术 2024-09-05 15:13 新加坡

凡是搞计量经济的，都关注这个号了

邮箱：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

接着“UTD最新: 不想被直接拒稿, 就要好好阅读这80项必做和禁忌清单, 不能错过这篇如此精彩的文章”，今天我们关注的焦点是UTD期刊JIBS编辑团队的最新文章“在国际商务研究中使用双重差分设计及面板数据：进展、潜在问题和实用建议”。

关于DID应用的最新进展和潜在问题，我们不作过多阐述，感兴趣的读者可以直接前往社群下载全文PDF进行深入阅读。我们主要聚焦于该刊编辑团队为进行DID研究设计所提供的实用建议。

来自JIBS编辑团队做DID实用建议：

研究设计：审慎选择实证研究的处理变量

1.企业层面的处理

如前所述，许多采用双重差分（DID）方法的国际商务研究，倾向于将企业历史中的重大事件作为面板数据的处理冲击。然而，这种做法需要谨慎考虑。这些企业层面的事件往往是企业历史运营和绩效路径的内生结果，与多种企业特有的因素（尤其是那些影响企业国际商务实践的因素）紧密相关。随着时间的推移，这些因素可能会对研究结果产生反馈效应。因此，基于这些事件的DID设计可能违背了事件处理的随机性和外生性的假设。此外，不同企业在不同时间段的处理可能存在差异，这可能违反了“处理treatment”恒定性的假设。再者，企业历史中的重大事件通常会对企业的运营和结果产生长期影响，这往往具有显著的持续性效应，从而违背了静态处理的假设。如示例2所示，企业层面“处理treatment”的这些潜在问题可能导致DID面板数据设计的平均处理效应（ATT）估计出现根本性偏差。

实际上，鉴于上述问题的严重性，DID面板数据设计可能并非企业层级处理的最佳实证研究设计。相反，其他识别策略，如利用工具变量的两阶段最小二乘回归（2SLS）、断点回归设计（RDD）等，可能为研究者提供更为严谨的企业层级事件因果关系估计方法。例如，在以往的研究中，本地企业被跨国公司（MNEs）收购是一个常见的处理事件。与其将这些事件直接作为DID处理，研究者可以专注于被MNEs收购的“处理组”企业，深入探讨跨国并购中的关键特征及其战略意义。具体而言，研究者可以考察被收购企业的绩效如何受到外国所有权的影响，并以行业平均值（排除目标企业）作为工具变量进行分析。此外，研究者还可以利用50%的外国所有权作为断点，运用RDD方法分析外国所有权对本地企业并购后绩效的影响。这种方法能够更准确地揭示企业层级事件的因果效应。

2.行业和国家层面的处理

与企业层面的处理相比，在国际商务（IB）领域，产业机构或国家及超国家层面的重大事件可能更适合作为使用面板数据的双重差分（DID）设计的应用场景。这是因为这些行业和国家层面的事件通常对单个企业的决策或表现具有外生性。尽管如此，研究者在处理这些行业和国家层面的事件时，仍需审慎考虑其随机性和外生性，尤其是那些基于商业政策或制度重大变革的事件。

正如先前研究所强调的，政府和政策制定者往往会基于某些系统性模式，对特定行业或地区的企业运营或结果进行调整。例如，政府可能会根据历史进口记录和行业内本地企业的表现来调整关税。同样，一个国家颁布新的跨境并购法规，可能是基于过去外国收购方在该国的活动。在这些情况下，处理组和对照组之间可能存在异质性，这可能导致处理前的趋势不平行。因此，研究者在设计基于行业或国家层面处理的国际商务DID研究时，应仔细选择合适的结果指标，并避免潜在的反馈效应。

在使用行业或国家层面的政策处理时，研究者需要特别警惕可能违反静态处理假设的风险。正如前文所述，这些宏观事件往往会对受影响的行业、地区或国家中的所有企业产生长期影响，其处理效应本质上会受到延续效应的影响。在国际商务的背景下，这种延续效应在国家和超国家层面的重大冲击中尤为显著。例如，众所周知，一个国家加入或退出主要超国家组织（如中国加入世界贸易组织和英国脱欧）的影响可能会持续数十年，对该国的企业产生深远的影响。同样，近期的研究表明，全球供应链和价值网络仍在消化2018年开始的中美贸易战的影响。正如上文所述，使用具有显著延续效应的非静态处理在DID面板数据设计中可能尤为棘手。

此外，行业或国家层面的政策处理也可能违反恒定处理假设，因为它们在不同行业、地区或经济体中的表现和影响程度往往存在显著差异。这种潜在的违反在涉及多国样本的国际商务（IB）研究中尤为明显。例如，有研究表明，一个国家加入欧盟对其企业进入外国市场的影响在不同加入时间的国家之间存在显著差异。同样，最近的全球疫情对不同国家和不同行业的企业供应链产生了截然不同的影响。这些问题不仅可能导致双重差分（DID）估计的偏差，也可能在研究的理论构建中引入替代性解释。因此，研究者在理论发展和经验估计中，需要仔细界定延续效应的来源，以及其非企业特定“处理treatment”的异质性。这要求研究者在设计研究时，不仅要关注“处理treatment”的外生性和随机性，还要考虑其在不同情境下的异质性。

分析策略：遵循严格的操作规范

1.执行恰当的平行趋势检验

鉴于前述问题的复杂性和普遍性，在国际商务领域应用面板数据的双重差分（DID）设计时，研究者必须严格遵守研究规范。首先，进行恰当的平行趋势检验至关重要，这有助于验证所选处理事件的随机性和外生性。在进行这种检验时，处理组和对照组在接受处理之前，在关注的结果变量上应无系统性差异。

平行趋势检验对于固定时间处理设计（fixed-time treatment designs）和时间变化处理设计（time-varying treatment designs）都同样重要。对于固定时间处理设计，常规做法是通过图表展示并比较处理组和对照组在处理前的趋势。而对于时间变化设计，Bertrand等人（2004）提出了一种平行趋势检验模型，如下所示：

在这个模型中，是处理前趋势的虚拟变量，对于处理对象在其首次接受处理前n年取值为1，其他情况为0。是处理后趋势的虚拟变量，对于处理对象在接受处理后n年取值为1，其他情况为0。研究者可以根据实际情况调整这些前后趋势虚拟变量的数量。这些处理前趋势虚拟变量用于比较处理组和对照组在处理前n年的趋势。如果这些虚拟变量对结果变量没有显著影响，则表明处理组和对照组在处理前的趋势没有显著差异，从而支持了处理事件的随机性和外生性假设。

2.全面控制固定效应

在国际商务（IB）领域的双重差分（DID）研究中，一项经常被忽视但至关重要的规范是全面考虑各个层面的固定效应，尤其是个体固定效应和时间固定效应。这些固定效应至少部分地涵盖了处理中的延续效应和异质性，这些效应根植于企业、年份、行业或国家的独特且不变的特性。

因此，如果在模型中未能控制所有相关的固定效应，可能会加剧对恒定和静态处理假设的违反，从而影响研究结果的准确性。在时间变化设计中，这一点尤为重要，因为处理后虚拟变量通常用来代替DID的交互项。

为了确保研究结果的可靠性，研究者应该在模型中纳入个体固定效应和时间固定效应。个体固定效应可以控制那些在时间序列中不变的个体特征，而时间固定效应则可以控制那些在横截面上不变的时间特征。
此外，研究者还可以考虑引入行业固定效应或国家固定效应，以控制那些可能影响研究结果的行业或国家层面的异质性。这些固定效应的引入，有助于确保研究结果更加稳健，从而为国际商务领域的理论和实践提供更加有力的支持。

实际上，企业的国际化运营和全球战略被认为是由企业自身、行业特性、地理位置以及时间动态等多种因素共同塑造的。鉴于国际商务（IB）实践的复杂性，国际商务学者可以采用交互固定效应的方法，这是一种更为稳健的分析手段，能够有效捕捉不同层面上未观测到的特异性因素之间的相互作用。这种方法有助于更有效地控制面板数据中DID设计潜在的非静态和非恒定处理问题。例如，全球供应链的韧性不仅受到企业所在行业条件的影响，还受到其母国和采购国的地理位置特性的影响。因此，为了深入研究全球疫情对跨国企业（MNEs）全球供应链存续的影响，学者们可以控制行业、母国和采购国之间的交互固定效应，以及传统的企业和年份固定效应。

3.采用匹配样本

在以往利用面板数据进行双重差分（DID）研究的实践中，构建匹配的对照样本是一种常见的方法，用以缓解非随机处理分配可能带来的问题。这种方法在我们的综述中也被多个国际商务（IB）领域的DID研究所采纳。其核心思想在于，将每个处理组对象与一个或多个在关键特征上相似的对照组对象进行匹配，这些特征可能包括企业的基本面、地理位置、行业归属等。匹配样本的构建通常通过倾向得分匹配（PSM）或粗糙匹配（CEM）等技术实现。这种方法在一定程度上确实有助于减轻由于处理分配的非随机性和内生性导致的估计偏差，前提是匹配标准能够准确捕捉到导致非随机和内生处理分配的主要因素。对于企业层面的处理，尤其重要的是将结果的历史记录纳入匹配标准中，以控制可能的反馈效应。例如，在示例2中，可以将每个时期的处理企业与一组具有相似历史资产回报率（ROA）的未国际化或尚未国际化的企业进行匹配。在这种情况下，历史ROA是导致非随机处理分配的关键因素。

然而，鉴于国际商务环境的复杂性以及企业全球战略和跨境运营的多样性，研究者在实际操作中很难完全识别和考虑所有导致处理分配内生性的因素，尤其是在处理发生在企业层面时。更为关键的是，仅依靠匹配样本作为对照组，并不能解决由非恒定或非静态处理引起的偏差问题，这些偏差通常只影响处理对象。因此，尽管匹配样本方法为提升面板数据双重差分（DID）设计的严谨性提供了重要的操作规范，但国际商务学者在使用时仍需谨慎评估其有效性。学者们在构建匹配样本时，需要细致地识别并采用合适的标准。这包括但不限于企业的基本面、地理位置、行业归属等关键特征，以及可能影响处理分配的其他潜在因素。

4.探索替代估计方法：CSDID与堆叠回归估计量

除了前述的规范操作外，学者们近期还开发了一系列替代估计方法，旨在修正双重差分（DID）假设的潜在违反情况，并增强面板数据DID设计的稳健性。特别值得一提的是，Callaway和Sant’Anna（2021）提出的“CSDID估计量”方法。这种方法最初设计是为了解决面板数据DID设计中时间变化处理的异质性问题。

CSDID估计量的实施步骤如下：首先，它为同一时间段内接受处理的一组对象估计所谓的“群体处理效应”。具体来说，就是将对象-时间观察值简化为一系列特定时间的群体，每个群体构成了一个简单的2 × 2 DID设计。在这一设计中，使用那些从未接受处理或尚未接受处理的观察值作为对照组。随后，将所有群体-时间特定的处理效应汇总，计算出群体平均的处理效应（ATT），这便是研究者感兴趣的核心估计值。

CSDID估计量的优势在于，它能够通过聚合不同群体的处理效应，来减少由于个体层面的异质性所导致的估计偏误。这种方法特别适用于处理效应在不同群体间存在显著差异的情况，能够提供更为稳健和准确的处理效应估计。

另一种备受推崇的估计方法被称为“堆叠双重差分（stacked DID）”（Cengiz, Dube, Lindner, & Zipperer, 2019）。这种方法首先为每个处理期创建一个特定时期的面板数据集，这个数据集仅包含在该时期接受处理的观察值以及在该时期之前和之后都未接受处理的纯净对照观察值。通过这种方式，所有未处理和已处理的观察值被排除在特定时期的面板数据集之外，从而为每个处理期构建了一个清晰的固定时间双重差分（DID）设计。接着，将所有特定时期的面板数据集合并，形成一个全新的面板数据集，用于进行双向固定效应双重差分（TWFE DID）估计。值得注意的是，这种TWFE DID估计方法不再控制企业层面的固定效应，而是转而考虑特定时期的企业固定效应（或企业-时期固定效应）。

为了探究在双重差分（DID）假设受到挑战时，CSDID和叠加DID这两种替代估计方法的稳健性，我们选取了两个示例，用这两种方法替代了传统的双向固定效应双重差分（TWFE DID）估计，并进行了实证检验。图4和图5分别呈现了这两个示例的检验结果。以图4为例，在示例1中，无论是CSDID还是叠加DID估计，均显示出比TWFE DID回归更为严谨的估计结果。

在进行的六个模拟中，关税削减这一政策变动的处理效应——无论是从观察值的平均处理效应（ATT）还是从企业平均ATT来看——均落在了使用CSDID和叠加DID估计得出的ATT的标准差范围内。这一发现揭示了，当处理分配具备随机性和外生性时，CSDID和叠加DID估计方法能够有效地纠正那些可能违反恒定性和静态性处理假设的情形。

然而，当处理分配呈现出非随机性和内生性时，CSDID估计的严谨性可能会受到挑战。正如图5所示，在示例2中，针对国际化这一内生处理的“真实”平均处理效应（ATT）始终超出了使用CSDID估计得到的500个ATT平均值的8个标准差范围，这表明在其他假设是否被违反的情况下，CSDID估计得到无偏估计的可能性不大。与此相对，对于这种内生性处理，叠加DID估计相较于TWFE DID回归和CSDID估计，提供了更为稳健的结果。观察值的平均ATT和企业平均ATT始终位于使用叠加DID估计得到的500个ATT平均值的1个标准差范围内。

鉴于这些发现，对于未来的国际商务研究者而言，在面板数据的DID设计中，考虑采用这些替代估计量（如果条件允许）至少作为稳健性检验，可能是有益的。特别是对于那些基于企业层面的处理，采用叠加DID估计量替代传统的TWFE DID回归，可能更有效地减轻潜在的估计偏差。

这是编辑团队发现的DID使用中的问题：

可能违反政策处理的随机性和外生性

我们的回顾揭示的第一个问题是，59篇研究中相当一部分采用的“处理treatment”可能本质上并非随机或外生。这个问题在使用基于公司历史中的代表性事件（如国际化、所有权变更等）作为公司层面处理的IB-DID研究中尤为突出。这些公司特定的事件与接受处理公司的战略和表现密切相关，这也会影响它们在处理前后感兴趣的结果。因此，这些“处理treatment”的分配可能是内生的，即公司是否接受处理是由其感兴趣的历史结果决定的（即“反馈效应”）。例如，一些研究使用公司首次海外投资作为“处理treatment”，这在公司的战略和表现中可能是内生的。同样，另一个“处理treatment”，即本地公司被外国跨国公司收购，也可能在本地公司的表现和质量中是内生的。在这两种情况下，接受处理的公司在运营和结果方面可能与对照公司系统性地不同，从而违反了处理的随机性。

相关的还有，21篇使用公司层面“处理treatment”的研究中有12篇（57.1%）没有报告任何形式的平行趋势检验。此外，只有30篇研究（50.8%）报告了展示处理组与对照组平行趋势的检验或说明。缺乏稳健的平行趋势检验进一步加剧了关于非随机和内生处理的担忧。

静态处理假设可能受到违背

我们的综述进一步揭示，在众多国际商务双重差分（IB-DID）研究中，所采用的“处理treatment”可能随时间推移产生持续的延续效应。这些“处理treatment”不仅在实施时期产生即时的影响，而且可能在后续时期继续对受处理对象的结果产生影响。这种现象在以重大事件（例如9/11恐怖袭击或中国加入世界贸易组织）作为“处理treatment”的研究中尤为常见。这些重大事件的影响往往需要较长时间才能被企业完全吸收和适应。此外，这些事件之后通常伴随着一系列连锁反应和后续冲击，使得处理的影响不仅持续存在，而且在不同时间点上的范围和强度也可能有所不同。

同时，这些重大事件往往会影响到接受处理主体的多个运营和表现方面，这些影响可能随着时间的推移与研究关注的结果产生复杂的交互作用。这种处理效应的异质性，可能会导致偏离在面板数据中采用双向固定效应双重差分（TWFE DID）设计时的估计值。

恒定处理假设可能未被满足

在审视国际商务双重差分（IB-DID）研究时，我们发现一些研究所采用的“处理treatment”可能在不同主体或时间段内并不产生恒定的影响。这一问题在涉及多国样本的研究中尤为显著。例如，一些研究以某国并购法的实施作为DID设计的依据。然而，不同国家的法律或法规往往具有不同的条款和规定，可能对各国公司产生不同程度的影响。同样，美国关税削减这一在IB-DID研究中广泛采用的政策处理，其影响在不同行业中的规模、持续时间和范围也存在差异，导致这种政策冲击对不同行业公司产生异质性处理效应。在这些情况下，处理效应的异质性可能会干扰已处理观察值，进而扭曲DID估计的结果。

值得注意的是，在59篇IB-DID研究中，仅有22篇（占比37.3%）严格遵循了双向固定效应双重差分（TWFE DID）估计的标准模型规范，同时控制了个体和时间的固定效应，其中9篇采用了固定时间处理（time-fixed），13篇采用了时间变化处理（time-varying treatment）。在这59篇研究中，有9篇（占比15.3%）在DID分析中完全没有控制任何固定效应。另外28篇研究（占比47.5%，其中5篇采用固定时间处理，23篇采用时间变化处理）仅控制了个体固定效应或时间固定效应之一。由于处理效应的延续性和异质性部分嵌套在个体和时间的固定效应中，未能适当控制这两者可能会加剧因违反静态处理或恒定处理假设而产生的偏差。

*群友可在社群下载全文PDF查看。
DID新进展，参考1.连续型DID也要被改造! 现成的平行趋势PT和TWFE估计都有问题, 时隔3年再次出发！2.审稿人: 就这么点样本做DID, 还异质性稳健DID呢, 麻烦看最新文献再说吧！！3.不炒冷饭! 2024年最新“2”份DID使用检查清单, 前沿DID使用基本规范指南！4.7种! 一张图里画出7种异质性稳健DID的平行趋势与动态效应的完整code和示例，5.最新: 2024版异质性稳健DID最全指南! 更新太快脑袋跟不上看这里！6.只有4期数据, 为啥平行趋势检验时有6期呢? DID与连续变量交互系数如何解释? 7.各种异质性稳健DID方法的特点和优点分别是什么? 为你选择某种估计方法提供客观依据！

关于多期DID或交叠DID: 1.DID相关前沿问题“政策交错执行+堆叠DID+事件研究”, 附完整slides，2.交错(渐进)DID中, 用TWFE估计处理效应的问题, 及Bacon分解识别估计偏误，3.典范! 这篇AER在一图表里用了所有DID最新进展方法, 审稿人直接服了！4.最新Sun和Abraham(2020)和TWFE估计多期或交错DID并绘图展示结果！详细解读code！5.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习，6.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等，7.交叠DID中平行趋势检验, 事件研究图绘制, 安慰剂检验的保姆级程序指南！8.系统梳理DID最新进展: 从多期DID的潜在问题到当前主流解决方法和代码! 9.标准DID中的平行趋势检验,动态效应, 安慰剂检验, 预期效应教程，10.DID从经典到前沿方法的保姆级教程, 释放最完整数据和代码！

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

7年，计量经济圈近2000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

计量经济圈组织了一个计量社群，有如下特征：热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此，建议积极进取和有强烈研习激情的中青年学者到社群交流探讨，始终坚信优秀是通过感染优秀而互相成就彼此的。

http://mp.weixin.qq.com/s?__biz=MjM5OTMwODM1Mw==&mid=2448121186&idx=1&sn=4816827ec6866432cfe380de82cc06c1

计量经济圈

凡是搞计量经济的，都关注这个号了。