连享会-2024 政策优化和机制分析专题
Update:
2024/6/9
导言:
这份课程大纲已经经历了两年的修改和完善,涵盖了 DID 分析的新范式,政策效应机制分析的新方法,以及政策学习和政策优化的最新进展。即使你因为时间限制,无法参加本次课程,通读本文也会颇受启发。它将有助于你了解政策评价领域的最新趋势,文中提及的参考文献也将给你带来新的灵感。
1. 课程概览
时间: 2024 年 8 月 8-10 日 (三天) 地点: 西安 · 西北工业大学 嘉宾: 杨海生 (中山大学) 课件/计量软件: 提供全套 Stata+R 程序、数据和复现资料 (开课前一周发送) 打印版由主办方统一印制 Jupyter-Notebook 每天 6 小时授课 + 半小时答疑 课程主页: https://www.lianxh.cn/PL.html PDF 课程大纲:https://file.lianxh.cn/KC/lianxh_PL.pdf 预读文献: -点击下载- 助教招聘: https://www.wjx.top/vm/wRLKESq.aspx# 报名链接: https://www.wjx.top/vm/rUbtugg.aspx#
课程提要
本期课程为大家提供了一些进行政策评价的新视角和新工具。我们不再满足于验证政策是否有效,还可以分析政策的作用机制、政策公平性和政策的可迁移性等,以便让政策分析更有弹性和深度。核心内容如下:
政策的作用机制:如何检验和分析? 逐步检验法 | 双重纠偏 Lasso | 敏感性分析 因果路径分析 | 连续型中介变量 | 多重中介检验 渠道相关性检验 | 中介渠道相对重要性分析 政策优化和政策公平性 当前政策如何优化?政策学习 | 政策迁移学习 如何兼顾效率和公平性? 政策绩效评估:基于多臂 Qini 曲线 基于网络的政策学习:溢出效应和同伴效应 分析工具:DID 分析的新范式 纽曼正交框架下的 DID 匹配框架下的 DID 多期 DID:假设条件和检验方法
2. 嘉宾简介
杨海生,中山大学岭南学院经济学系副教授,主要研究领域为复杂网络、机器学习及因果推断。在 ACM Computing Surveys, Emerging Markets Review, Ecological Economics, Journal of Asian Economics, 经济研究, 管理世界, 经济学 (季刊), 管理科学学报, 金融研究, 会计研究, 世界经济等学术刊物上发表论文 40 余篇,主持了多项国家自然科学基金、广东省自然科学基金项目。
3. 课程导引:政策评价的新模式
近十年来,政策评价似乎遇到了一个共同的「瓶颈」:即使用最前沿的方法,似乎也仅限于回答「政策是否有效」这个问题。换言之,目前多数研究似乎都只扮演了评论家的角色:挑剔、刻薄,却从来都无法给出切实的政策建议,致使研究结论似乎多少带有「事后诸葛亮」的味道。
相比之下,下面这些问题更加切实,也更有助于指导政策实践:
Q1. 政策产生作用的机制有哪些? Q2. 每一个机制的相对重要性如何验证和估计? Q3. 如何控制或估计这些机制之间的相关性和溢出效应? Q4. 能否基于现有政策实施的经验,对后续政策进行优化。或曰:在 A 地实施的某项政策能否迁移或推广到 B 地?什么条件下可以?如果不可以,需要如何调整? Q5. 能否设计出兼顾政策效率和公平性的政策方案?
显然,Q1-Q3 有助于回答「为什么?」,而 Q4-Q5 则有助于解决「怎么做?」。
本期课程旨在介绍一组能实现上述研究目标的方法和工具,包括:因果路径分析、多重中介效应的检验和比较、连续性中介变量、政策迁移学习和基于网络的政策学习等。这些方法是由因果推断领域的几个大牛在最近三五年内提出来,包括:斯坦福大学的 Susan Athey、Guido Imbens,哈佛大学的 Raj Chetty、Xiang Zhou 等。
显然,一些主流期刊广泛关注的主题 (如扶贫、限购、税收优惠、政策试点等),都可以从上述视角入手做更深入地挖掘。这为我们选择新的研究切入点提供了广泛的空间: 我们不用再疲于奔命寻找新的「政策冲击」,而是可以专注于「政策作用机制」、「长期影响评价」等更有意思的话题。
我们将利用经典文献中的数据分析不同的政策情景,通过 Stata+R 程序的讲解,帮助大家将这些方法迁移到大家的研究中。此外,还会介绍这些模型的拓展及其在制度经济学、环境经济学、财政和区域经济学等领域的应用,并在异质性分析、政策含义讨论和可视化方面提供实用建议,以扩展研究思路、激发想象力。
释疑 1:你能学到什么?
准备深造的本科生 对于致力于通过夏令营进入名校深造的同学,我建议深究 1-2 个方法,花一个月完成 1-2 篇论文的复现。然后,找一个被广泛关注的政策评价问题,利用新方法做对比分析,形成一篇优秀的参营论文。毕竟,参营展示时,评委更关注你的学术潜力,而上述工作则表明你能掌握并合理应用前沿方法。
硕士和博士生 对于即将或正在读博士的同学,可能需要花 1-2 个月甚至更长时间系统掌握本次课程的方法,以提升自信心。几个月的反复学习是为了夯实这些方法背后的基础理论,如因果推断基本概念、反事实框架、Lasso 和非参数估计等。接下来,需要广泛阅读,找到合适的选题并运用所学方法。这样,博士论文中的“创新性”问题将不再是难题。
青椒和导师 对于正在琢磨来年自科或社科项目选题的青椒或导师们,深刻理解这些方法背后的理念,并形成对未来 3-5 年学术研究趋势的判断是最重要的。比如,不再执着于验证某项政策是否有效,而是探讨政策“奏效”或“失效”的条件和原因,提出兼顾效率和公平性的政策优化方案。一旦换了角度,机会便会应运而生。
释疑 2:软件问题和 AI 助手
虽然本次课程有些前沿方法是用 R 实现的,但完全不必纠结软件问题。原因如下:
R 并不像你想象的那么难 一方面,在大神 Hadley Wickham 的引导下,R 已经变得越来越模块化,使之规范、易用。大家只需花十来分钟在课件 指引 下安装 R + RStudio 套装即可开干。另一方面,不同软件之间的兼容性越来越好,我们可以用 Stata 完成大部分数据处理,再用 R 执行几行代码,得到核心结果,然后返回 Stata 完成结果输出;也可以用 rcall
等命令直接在 Stata 环境中运行 R 代码。
课件中的模拟数据和范例代码易懂易学 在每个专题中,杨老师都提供了一些基于模拟数据的完整案例代码,以便大家理解和操练。因此,核心问题不是软件问题,而是理解模型的原理及应用场景。
AI 是很好的助手 现在市面上除了功能强大的 ChatGPT 4.0,还有很多免费的 AI 大模型可以帮助我们理解代码,详见 AI 编程助手大盘点:不止 ChatGPT 和 Copilot。它们可以高效地实现代码注释、代码解读、代码修改和代码扩展等功能。国产的 同义灵码, CodeGeex 表现也不错。
4. 课程详情
本课程旨在深化学员对双重差分方法 (DID) 的应用、中介效应分析及政策优化策略的理解,并提升在实际环境中评估、分析和优化政策的能力。具体说明如下:
T1:DID 的新范式
内容概述
双重差分方法 (DID) 是政策分析中的重要工具,但你真的用对了吗?本专题将基于因果推断领域的前沿理论和技术,讲解应用 DID 的「新范式」。通过本专题的学习,学员将掌握各种 DID 技术的应用细节和适用场景,提高政策效果评估的准确度和可靠性。
其一,应用 DID 之前,我们需要预先判断研究对象和样本是否适用于 DID,这要求我们熟知 DID 的基本假设与检验,如平行趋势检验和安慰剂检验。此处,我们将与大家探讨以下问题:
为了准确识别政策效应,事前事后都需满足平行趋势假定,那么如何做「事后的」平行趋势检验? 存在时间趋势时,平行趋势检验满足时就能得到 ATT 吗? 安慰剂检验中检验的究竟是处理组还是控制组样本,事前还是事后样本?基于不同样本的检验背后有什么经济意义? DID 模型中具有控制变量时,如何进行平行趋势检验和安慰剂检验?
其二,我会介绍「纽曼正交框架」下的各种 DID 工具,包括:双重稳健 DID (DRDID)、双重机器学习 (DML)、广义随机森林 (GRF) 和非参数因果推断 (NP-Causal),以便在数据结构复杂或模型形式未知的情况下,得到更稳健的因果推断结果。这些方法有助于解开学员们普遍面临的一些困惑:
DID 回归和虚拟变量回归有区别吗?DID 和 TWFE 是一样的吗? DID 回归可以加控制变量和交乘项吗? 审稿人常提及的 DID 中的内生性问题要怎么解决?
其三,介绍匹配框架下的 DID 应用,比如学员熟知的 PSM-DID,实际上并无新增信息量,得到的控制组样本真的可靠吗?基于顶尖文献的前沿技术,我们将介绍合成控制 DID (SDID) 和 Wasserstein 生成对抗网络 (WGAN),帮助学员通过精确匹配或构造合成控制组,更准确地估计政策效果。
其四,多期 DID 的进阶技术。当政策实施分为多个时点时,需要引入多期 DID,需要应对两个难题:
Q1. 政策效应是多个时点处理效应的简单平均还是加权平均,权重如何选择? Q2. 如果政策实施时间彼此相关,该如何估计政策效应?
此时,可以借助 CSDID、Dynamic IPW 和 RIPW 等工具。这些工具还有助于应对存在缺失数据或处理组非随机分配等情形,通过调整观测数据,优化权重分配,以便更为准确地估计政策效应。
本讲要点
DID 的基本假设与检验 平行趋势检验 安慰剂检验 两步法标准回归介绍 (Barwick et al.,2024) 纽曼正交框架下的 DID TWFE TWFE 与标准 DID 的区别与联系 (Wooldridge,2021) 遗漏变量检验 DRDID 与 DML (Sant & Zhao,2020) GRF Npcausal (Kennedy et al.,2023) 匹配框架下的 DID PSM-DID SDID (合成 DID) WGAN (Wasserstein 生成对抗网络,Athey et al.,2021) 多期 DID CSDID (Athey et al.,2018;Sun & Abraham,2020;Callaway & Sant,2021;Goodman-Bacon,2021) 动态 IPW (van den Berg & Gerard,2022) RIPW (Arkhangelsky et al.,2021)
参考文献
Athey, S., Imbens, G. W., & Wager, S., 2018. Approximate residual balancing: debiased inference of average treatment effects in high dimensions. Journal of the Royal Statistical Society Series B: Statistical Methodology, 80(4), 597-623.Link, PDF, Google. Athey, S., Imbens, G. W., Metzger, J., & Munro, E. (2021). Using wasserstein generative adversarial networks for the design of monte carlo simulations. Journal of Econometrics, 105076. Link, PDF, Google. Arkhangelsky, D., Imbens, G. W., Lei, L., & Luo, X. (2021). Design-Robust Two-Way-Fixed-Effects Regression for Panel Data. arXiv preprint arXiv:2107.13737.Link (rep),PDF, Google. Barwick, Panle Jia, Shanjun Li, Liguo Lin, and Eric Yongchen Zou. (2024). From Fog to Smog: The Value of Pollution Information.American Economic Review, 114 (5): 1338-81.Link (rep), PDF, Appendix, Google. Callaway, B., & Sant'Anna, P. H., 2021. Difference-in-differences with multiple time periods. Journal of Econometrics, 225(2), 200-230.Link, PDF, Google. Goodman-Bacon, A., 2021. Difference-in-differences with variation in treatment timing. Journal of Econometrics, 225(2), 254-277.Link, PDF, Google Kennedy, E. H., Ma, Z., McHugh, M. D., & Small, D. S., 2017. Non-parametric methods for doubly robust estimation of continuous treatment effects. Journal of the Royal Statistical Society Series B: Statistical Methodology, 79(4), 1229-1245.Link, PDF, Google. Sant'Anna, P. H., & Zhao, J., 2020. Doubly robust difference-in-differences estimators. Journal of Econometrics, 219(1), 101-122.Link, PDF, Google. Sun, L., & Abraham, S., 2021. Estimating dynamic treatment effects in event studies with heterogeneous treatment effects. Journal of Econometrics, 225(2), 175-199.Link, PDF, Google. Van den Berg & Gerard J.,2022. Long-Run Effects of Dynamically Assigned Treatments: A New Methodology and an Evaluation of Training Effects on Earnings. Econometrica,90(3),1337-1354. Link, PDF, Google. Wooldridge, J. M. (2021). Two-way fixed effects, the two-way mundlak regression, and difference-in-differences estimators. Available at SSRN 3906345.Link, PDF,Google.
T2:中介效应分析的新方法
内容概述
在政策评价中,影响机制分析至关重要。若无法清晰确认某项政策的影响路径和机制,并提供各个路径影响力度的估计,就无法提出实质性政策建议。这是目前多数研究者共同面临的难题。
作为机制检验的重要工具,近年来「中介效应分析」受到了诸多质疑。自从江艇 (2022) 发表以来,国内学界对中介效应进行热烈的讨论,诸多不明就里的吃瓜群众对「中介效应」谈虎色变。殊不知,江艇老师的文章旨在强调传统中介效应分析所依赖的条件,以及应用中需要避开的各种坑。
为此,本专题首先理清如下问题:
Q1. 中介分析中的逐步检验法被全盘否定了吗?适用条件是什么? Q2. 在中介效应分析中被频繁质疑的内生性问题究竟是什么?如何解决? Q3. 除了逐步检验法还有其他可以分析中介效应的工具吗?
基于上述问题,我将在「因果推断框架」下解析目前广泛使用的中介效应检验方法,包括逐步检验法和两阶段工具变量法 (Di Giuli & Laux, 2022),并引入敏感性分析 (Imai et al., 2010) 作为评估这些传统方法可行性的重要工具。
模型设定中往往存在遗漏变量,这是导致中介变量存在内生性问题的主要原因。为解决这一问题,我将介绍 Guo et al. (2020) 提出的双重纠偏拉索 (Doubly Debiased LASSO, DDL) 估计方法。DDL 有两种形式:线性模型和广义线性模型。线性模型易于计算和解释。广义线性模型则更具灵活性,适用性也更广泛,但系数的经济含义需要通过计算边际效应来解释。
政策效果通常通过多个中介渠道实现。具体分析中,需要考虑:
Q1. 哪个渠道发挥了主导作用? Q2. 不同渠道之间的相对重要性排序如何? Q3. 如何检验不同渠道间的相互联系?
确定哪些中介变量在政策效果传导中扮演关键角色是近期研究的重点,Guo et al. (2022) 提出的「高维中介分析」是一种重要的分析工具。此外,Zhou (2022) 和 Zhou & Yamamoto (2023) 提出的「因果路径分析」为我们提供了从实验和观察数据中追踪复杂因果链的工具,这对于深入理解政策的综合影响非常有帮助。我将以分析师对企业投资效率的影响机制为例,介绍「多重路径分析」和「嵌套路径分析」等复杂关联问题在 R 和 Stata 中的实现方法。
最后,如果处理变量是连续型变量 (如罚款额度、减税幅度等),中介效应分析该如何进行?对此,我将介绍 Lin et al. (2024) 最新提出 WIT 方法以及 Di Giuli & Laux (2022) 的思路。这些方法的引入,大大拓展了实证分析的选题范围和分析深度。
简言之,新近发展的链式中介效应分析克服了传统模型的诸多限制,将大有可为。目前有关中介效应分析的诸多棘手问题都可以利用本讲中涉及的方法进行有效应对:
其一,多个影响机制之间彼此关联问题。我们将使用 因果路径模型 (Zhou, 2022;Zhou and Yamamoto, 2023) 来解决「多路径」和「嵌套路径」分析中的路径关联问题。 其二,遗漏变量问题。它会导致有偏估计,但可以用 Guo et al. (2022) 新近提出的 DDL (Doubly Debiased LASSO) 方法加以克服。
本讲要点
中介效应检验 中介效应的因果推断理论框架 传统检验方法的可行性分析:逐步检验法、敏感性分析 (Imai et al.,2010)、两阶段工具变量法 (Di Giuli & Laux,2022) DDL 线性模型 (Guo et al.,2022AoS) 广义线性模型 (解决遗漏变量问题) 多重中介检验 有效中介识别检验 (Guo et al.,2022JASA) 因果路径分析 (Zhou,2022;Zhou & Yamamoto,2023) 案例:分析师利空关注对企业投资效率的影响机制 连续型处理变量下的中介效应分析 (Lin et al.,2024)
参考文献
Di Giuli, A., & Laux, P. A., 2022. The effect of media-linked directors on financing and external governance. Journal of Financial Economics, 145(2), 103-131.Link (rep), PDF, Google Guo, X., Li, R., Liu, J., & Zeng, M., 2022. High-Dimensional Mediation Analysis for Selecting DNA Methylation Loci Mediating Childhood Trauma and Cortisol Stress Reactivity. Journal of the American Statistical Association, 117(539), 1110-1121. Link, PDF, Google. Guo, Z., Ćevid, D., & Bühlmann, P.,2022. Doubly debiased lasso: High-dimensional inference under hidden confounding. Annals of Statistics, 50(3), 1320.Link, PDF, Google. Imai, K., Keele, L., & Yamamoto, T., 2010. Identification, inference and sensitivity analysis for causal mediation effects. Statistical Science, 25(1), pp.51~71.Link, PDF, Google. Lin, Y., Windmeijer, F., Song, X., & Fan, Q. (2024). On the instrumental variable estimation with many weak and invalid instruments. Journal of the Royal Statistical Society Series B: Statistical Methodology, qkae025.Link, PDF, Google. Zhou, X., 2022. Semiparametric estimation for causal mediation analysis with multiple causally ordered mediators. Journal of the Royal Statistical Society Series B: Statistical Methodology, 84(3), 794-821.Link, PDF, Google. Zhou, X., & Yamamoto, T., 2023. Tracing causal paths from experimental and observational data. The Journal of Politics, 85(1), 250-265.Link (rep), PDF, Appendix, Google.
T3:政策的优化策略
内容概述
本讲介绍的方法可以解决大家普遍面临的一个棘手问题:如何让政策建议不那么空泛? 主要包括:Athey and Wager (2021) 提出的基于「政策学习」(Policy Learning, PL) 的处理效应的核心思想和估计方法,以及 Viviano and Bradic (2023) 的提出的「公平目标政策」(Fair-Targeting-Policy) 模型,旨在分析如何在政策优化过程中兼顾效率和公平。
多数因果推断模型都依赖于 SUTVA 假设:实验组个体和处理组个体之间不存在干扰或溢出效应。显然,这大大简化了分析和估计的难度。然而,在研究某些行为时 (如个人购房、企业创新、地方政府投资等),SUTVA 假设可能不再满足,因为个体之间的行为会相互影响,也会存在溢出效应。此时,传统估计方法由于存在偏误而不再适用。
为此,Munro et al. (2023) 建立了一个基于市场均衡的处理效应模型,以便于估计「直接处理效应 (ADE)」和「间接处理效应 (AIE)」。ADE 是在给定协变量的情况下,政策冲击对实验组个体自身的预期影响;而 AIE 则是个体受冲击后对其他个体的预期影响。这在以往的政策评价中鲜有提及。他们还研究了不同个体间处理效应的异质性,并提出了满足均衡稳定性条件的「最优政策目标规则」(optimal targeting rule)。这构成了政策优化的理论基础。
本专题首先介绍“市场均衡”的含义及其对处理效应估计结果的影响,进而探讨在一般均衡情况下如何估计政策的处理效应,最后通过实例讲解该方法在 R 中的实现过程。
接下来的问题是:在考虑效率的同时,如何确保政策优化也能兼顾公平?我们将结合 Viviano & Bradic (2023) 的 Fair-Targeting-Policy,探讨如何使政策优化同时具备效率与公平。
最后,我们还将深入探讨如何评估政策下不同干预措施所产生的各异效果。学者常问:如何对连续变量进行优化?如何识别产生最大边际效益的政策措施?对此,我们将借助多臂 Qini 曲线 (Sverdrup et al., 2023),不仅能够识别哪些政策措施能够产生最大的边际效益,进而实现资源分配的最优化;还能够通过对比不同政策的多臂 Qini 曲线,在不同的时间节点上或整个干预周期内,直观地评估各项政策的绩效表现。这种方法的应用将极大地增强政策评估的精确性和决策的科学性。当政策处理变量是连续变量时,借助于非参数估计的灵活性,我们还可以通过非参数因果推断 (Kennedy et al., 2017;Colangelo & Lee,2023;Tan & Xu,2024) 对政策效果进行细化的效果评估和效能优化。
我将以"名刊工程"的政策效果估计为例,介绍上述政策优化方法在 R 中的实现和解读。
本讲要点
市场均衡状态政策效应 (Treatment Effects in Market Equilibrium) (Munro et al.,2021) 政策学习 (Policy Learning) (Athey & Wager,2021) 基于网络的 Policy Learning 政策公平性 (Fair Policy) (Viviano & Bradic,2023) 多臂 Qini 曲线 (Multi-Armed Qini Curve) (Sverdrup et al.,2023) 连续 Treatment (Kennedy et al., 2017;Colangelo & Lee,2023;Tan & Xu,2024)
参考文献
Athey, S., & Wager, S., 2021. Policy learning with observational data. Econometrica, 89(1), 133-161.Link, PDF, Google. Munro, E., Wager, S., & Xu, K., 2021. Treatment effects in market equilibrium. Working Paper, arXiv preprint arXiv:2109.11647.Link, PDF, Google. Sverdrup, E., Wu, H., Athey, S., & Wager, S., 2023. Qini Curves for Multi-Armed Treatment Rules. Working Paper, arXiv preprint arXiv:2306.11979.Link, PDF, Google. Viviano, D., & Bradic, J., 2023. Fair policy targeting. Journal of the American Statistical Association, 1-14.Link, PDF, Google. Kyle Colangelo & Ying-Ying Lee,2023. Double Debiased Machine Learning Nonparametric Inference with Continuous Treatments. Econometrics,Link, PDF, Google. Xu, W., & Tan, Z. (2022). High-dimensional model-assisted inference for treatment effects with multi-valued treatments. arxiv preprint arxiv:2201.09192.Link, PDF, Google.
5. 报名信息
主办方: 太原君泉教育咨询有限公司 标准费用 (含报名费、材料费),差旅及食宿费自理: 全价:3600 元/班/人 优惠方案: 专题课/现场班老学员:9 折,3240 元/人 **学生 (需提供学生证/卡照片)**:9 折,3240 元/人 连享会会员: 8.5 折,3060 元/人 温馨提示: 以上各项优惠不能叠加使用,现场座位根据报名缴费顺序确定。 联系方式: 邮箱:wjx004@sina.com 王老师:18903405450 (微信同号) 李老师:18636102467 (微信同号)
报名链接: https://www.wjx.top/vm/rUbtugg.aspx#
长按/扫描二维码报名:
缴费方式
方式 1:对公转账
户名:太原君泉教育咨询有限公司 账号:35117530000023891 (晋商银行股份有限公司太原南中环支行) 温馨提示: 对公转账时,请务必提供「汇款人姓名-单位」信息,以便确认。
方式 2:扫码支付
温馨提示:
扫码支付后,请将「付款记录」截屏发给王老师-18903405450(微信同号)
6. 助教招聘
名额: 10 名 任务: A. 课前准备:完成 2 篇推文,风格参见连享会主页 www.lianxh.cn; B. 开课前答疑:协助学员安装软件和使用课件,在微信群中回答一些常见问题; C. 上课期间答疑:针对前一天学习的内容,在微信群中答疑 (8:00-9:00,19:00-22:00); Note: 下午 5:30-6:00 的课后答疑由主讲教师负责。 要求: 热心、尽职,熟悉 Stata / R 的基本语法和常用命令,能对常见问题进行解答和记录 特别说明: 往期按期完成任务的助教可以直接联系连老师直录。 截止时间: 2023 年 7 月 29 日 (将于 7 月 31 日公布遴选结果于 课程主页,及连享会主页 lianxh.cn)
申请链接: https://www.wjx.top/vm/wRLKESq.aspx#
7. 交通和住宿
校内宾馆:西北工业大学正禾宾馆
地址:西安市莲湖区友谊西路127号西北工业大学 预订电话:13891950069,17788061199 温馨提示: 预定时请以「**连享会会议参会人员**」身份报名,以便享受协议价。 小知士:正禾宾馆位于西北工业大学校内,上课、用餐以及午休方便快捷,环境可以参考以下图片: