这个研究有意思。
本研究依托《中国老年人健康长寿影响因素调查(CLHLS)》数据以及中国环保部公布的API数据,构建了2000至2012/14年的省级面板数据。将2008年北京奥运会的环境管制政策视为一个准自然实验,本研究采用合成双重差分(Synthetic Difference-in-Differences,SDID)方法,首次识别了短期暴露于PM10对老年痴呆症患病率的因果效应。
研究结果发现,每立方米年度PM10浓度降低1微克,老年痴呆症患病率将降低0.82个百分点,且这种影响在不同老年群体间存在差异。这些发现为将改善空气质量作为延缓老年痴呆症发病的有效公共卫生政策提供了证据支持,并指出这可能是政府减轻公共卫生负担的一个潜在工具。研究还表明,随着近年来中国空气质量的改善,老年痴呆症患病率有望显著下降,进而带来潜在的经济收益:从全球范围看,潜在的经济效益可能从2.1亿美元到281亿美元不等(参考:审稿人: 你确定你文章将为社会带来万亿级的收益? 若不发表会遭受上万亿的损失?)。
关于合成双重差分法,参看1.前沿, 合成双重差分法SDID方法介绍和示例, 附code和数据!2.合成双重差分法DID的视频和Slides
关于空气污染,参考1.TOP刊上过去10年“空气污染”的文章分析, 中国已然成为第一大研究国度,2.空气污染的100000个后果之航班延误, 工具变量, 各种稳健性检验!3.前沿实证设计之空气污染与失眠和看电影, 一口气咕咚两篇就已消化殆尽!4.1980-2022全国各地级市逆温数据公布! 空气污染的绝佳工具变量!5.又是用逆温作为空气污染的IV的JDE文章, 研究对中国人口迁徙的影响!6.最新: 运用机器学习和合成控制法研究武汉封城对空气污染和健康的影响! 7.为啥北方孩子普遍更胖? 空气污染惹的祸还是背的锅?8.《中国经济问题》主编JDE文章: 空气污染和制造业企业生产率
研究发现的回归结果如下:
简要介绍一下:
目前,关于空气污染与老年痴呆之间是否存在因果联系的研究尚不充分,这引发了两个核心问题:首先,空气污染是否真的是诱发老年痴呆的因素之一?其次,采取空气污染控制措施是否能够有效地延缓老年痴呆的发展进程?
为了深入挖掘问题的答案,本研究将目光投向了2008年北京奥运会期间实施的严格空气污染控制措施。这一措施可谓人类历史上为改善短期空气质量而进行的规模最大的努力之一。自2007年底起,中国政府为了确保奥运会期间北京的空气质量,采取了全方位的严格空气质量保障措施。这些措施的力度之大,以及对老年痴呆发病率的外生性影响,使其成为了一种完美的准自然实验。这一背景为本研究提供了绝佳的机遇,用以解决空气污染的内生性问题。通过评估2008年北京奥运会期间实施的治理措施对空气污染的影响,能够获得关于空气污染对老年痴呆发病率影响的准实验性估计。
为了准确评估2008年北京奥运会期间所采取的治理措施对北京地区空气污染和老年痴呆发病率的因果影响,本研究需要构建一个可靠的反事实分析框架。这一分析旨在探究在缺少这些治理措施的情境下,北京的空气污染和老年痴呆发病率可能呈现的发展趋势。为此,本研究采纳了Arkhangelsky等(2021)提出的合成双重差分法(SDID),通过将北京的数据与未受治理措施影响的对照省份构建的合成反事实进行对比分析。合成双重差分法(SDID)与本研究的目标完美契合。合成双重差分(SDID)方法与本文的研究目标高度吻合。这种方法允许纳入单位固定效应,以捕捉北京与对照组在结果变量水平上的重要系统性差异。此外,这种方法还提升了那些与北京及奥运会前状况相似的未受管制省份在对照组中的重要性,以及与处理期相仿的奥运会前期阶段的重要性,为研究提供了一个强有力的分析工具。
在本研究中,重点分析了两组关键的数据集。第一组数据来自中国环境保护部,涵盖了2000年至2012年间的每日空气污染指数(API)以及主要污染物的记录。由于官方API数据未包含细颗粒物(PM2.5)的信息,并且在超过90%的时间内,主要污染物为直径10微米以下的颗粒物(PM10),因此本研究选择PM10作为衡量空气污染水平的指标。第二组数据则来自中国健康长寿调查(CLHLS),这是目前全球最大的百岁老人数据库,它不仅包含了百岁老人的数据,还涵盖了90岁以上、80岁以上以及65至79岁人群的对比数据。在CLHLS中,老年痴呆症的诊断是基于简易精神状态检查(MMSE)的评分来确定的。
本研究的主要发现概括如下:首先,2008年北京奥运会期间实施的治理措施显著提升了北京的空气质量。基准回归分析显示,这些措施使北京的PM10浓度平均下降了约26微克/立方米,这一结果与He等研究者在2016年的研究结果相吻合。更进一步的分析还揭示,这些治理措施显著降低了北京地区老年痴呆症的发病率,降幅达到了21.7个百分点。综合这些发现,可以得出结论:北京地区年均PM10浓度每减少1微克/立方米,老年痴呆症的发病率就会降低0.82个百分点,这一降低幅度占到了平均发病率的2.39%。
本文深入探讨了空气质量改善对不同人群老年痴呆症发病率影响的差异性,并揭示了性别、年龄和教育水平在这一过程中的重要作用。具体地,当空气中PM10的年均浓度每降低1微克/立方米时,女性老年痴呆症的发病率下降了0.80个百分点,而男性的变化在统计上并不显著。在不同年龄段中,高龄老年人群的老年痴呆症发病率下降更为显著:85至94岁的人群下降了0.72个百分点,95岁以上的人群更是下降了1.71个百分点。在教育水平方面,教育程度较低的老年人从空气质量改善中获益更多,其中小学和中学教育程度的人群老年痴呆症发病率分别下降了0.79和0.32个百分点,而高中及以上教育程度的人群变化不显著。婚姻状况和儿童时期的医疗条件同样对改善效果有所影响:离异或丧偶的人群老年痴呆症发病率下降了1.47个百分点,儿童时期缺乏医疗条件的人群下降了1.08个百分点,而已婚人群和有儿童时期医疗条件的人群分别只下降了0.22和0.58个百分点。这些分组分析显示,包括女性、高龄老年人、低教育水平人群、离异或丧偶老年人以及儿童时期缺乏医疗条件的人群在内的特定弱势群体,从空气质量改善中获益更多。
在本项研究中,采用了合成双重差分(SDID)方法来预测,如果未曾实施BOG08治理措施,北京及其对照省份可能会展现出怎样的趋势。为了确保研究结果的精确性,依照Clarke等(2023年)的研究方法,对比分析了BOG08政策实施前后北京与合成对照组之间的差异。事件研究的结果显示,没有明显证据表明存在这种差异。
人们可能会怀疑,除了空气质量的改善之外,是否还有其他因素在空气污染治理期间对老年痴呆发病率的降低有所贡献。为了全面解答这一疑问,本研究从多个维度进行了深入的分析:
首先,考虑到家庭收入和股市表现可能间接影响健康状况,本研究分析了2008年北京奥运会(以下简称BOG08)期间旅游业的增长是否显著提高了家庭收入,并评估了股市波动对健康可能产生的影响。其次,本研究调查了医疗基础设施和资源是否有所增强,包括医疗支出、医院数量、病床数量以及医生和护士的配备情况。第三,本研究探讨了吸烟、饮酒、运动、高血压和糖尿病等可调整的老年痴呆风险因素是否出现了显著变化。最后,为了进行对照分析,本研究还进行了额外的安慰剂检验,评估BOG08对非空气污染相关健康问题(如白内障、前列腺肿瘤、褥疮和关节炎)以及与空气污染相关健康问题(例如哮喘)的影响。这些测试有助于排除其他健康改善因素的干扰,确保研究结果的准确性。
研究结果显示,在BOG08期间,家庭收入、医疗基础设施和资源、常见的老年痴呆可调整风险因素以及非空气污染相关健康问题均未出现显著变化。这些发现进一步增强了本研究的观点,即老年痴呆发病率的降低更有可能是由于BOG08期间实施的空气污染治理措施所致,而非其他因素所引起。
此外,在2008年北京奥运会(BOG08)期间,除了PM10之外,臭氧(O3)、二氧化硫(SO2)和二氧化氮(NO2)等其他污染物的浓度也可能有所下降。本研究借鉴了Deryugina等学者在2019年的研究方法,专门分析了PM10在降低老年痴呆症发病率中的独特影响。研究结果表明,即使考虑了其他污染物的影响,PM10的减少对健康改善的贡献依然显著且稳定,这表明观察到的老年痴呆健康益处主要归功于PM10浓度的降低。
为确保研究结果的稳健性,本文进行了一系列的稳健性检验。检验结果显示,无论是基准结果还是异质性效应,对于控制变量的调整、对照组的选择、时间段的划分或是老年痴呆症发病率的测量方法的变化,研究结果都表现出了很高的稳健性。此外,采用标准的双重差分(DID)方法和固定效应工具变量估计法得到的结果也支持了本研究的结论。这些综合检验进一步证实了PM10浓度与老年痴呆症发病率之间的关系是稳健且显著的,并非由方法学偏差或偶然因素所导致。
最终,本文采用简易的估算方法,量化了通过提升空气质量减少老年痴呆症病例所能带来的成本节省。依据2010年《全球阿尔茨海默报告》中对每位老年痴呆症患者的成本估算,本文计算了减少老年痴呆症病例的经济效益。分析结果显示,在东亚地区,考虑到区域特定的老年痴呆症成本,改善空气质量可能带来的经济效益估计介于9.7亿至23.6亿美元之间。而在全球范围内进行成本估算时,潜在的经济效益可能从2.1亿美元到281亿美元不等。这些数字不仅突显了改善空气质量对健康的益处,也显示了其巨大的经济价值。
下面是空气污染老年痴呆症影响机制:
实证策略
在本节中,将详细说明本研究采用的实证策略,该策略旨在揭示空气污染(以PM10为衡量标准)与老年痴呆症发病率之间的因果联系。在确定因果效应的过程中,一个主要挑战是个体的空气污染暴露受到多种因素的影响,这使得空气污染成为一个内生变量。为了探索空气污染的外生变化,本研究将2008年北京奥运会(BOG08)期间实施的政策作为一个准自然实验。采用了Arkhangelsky等(2021年)提出的合成双重差分(Synthetic Difference-in-Differences, SDID)方法,用以评估BOG08政策对PM10浓度和老年痴呆症发病率的影响。通过这两个估计值,可以计算出空气污染对老年痴呆症发病率的具体影响。
识别挑战
本研究的策略在于利用北京在2008年执行的短期空气污染监管政策,并结合政策实施前后的面板数据,来识别BOG08政策对研究结果的因果效应。具体方法是比较实施政策的北京与其他未实施类似政策的省份在PM10浓度和老年痴呆症发病率方面的时间序列变化。核心任务是估计如果北京在2008年没有实施全面的空气质量保障措施,其PM10浓度和老年痴呆症发病率将如何变化。为此,本研究需要利用对照组中未受管制省份的信息,构建北京PM10浓度和老年痴呆症发病率的可靠反事实模型。
在本研究的分析框架中,主要采用了Abadie等(2003年、2010年、2015年)提出的合成控制法(Synthetic Control, SC)和Roth等(2023年)总结的双重差分法(Difference-in-Differences, DID)作为两种核心的估计手段。然而,这两种方法都不能完全消除关于如何准确识别2008年北京奥运会(BOG08)政策对PM10和老年痴呆症发病率因果效应的核心假设的疑虑。具体指的是,在控制了一系列变量后,北京与对照组省份的结果在没有空气污染管制的情况下不应存在系统性差异。
尽管单一处理单位和政策介入的时间点与合成控制(SC)方法的常规应用场景相吻合,但在为北京构建一个可靠的对照组时,仍面临挑战。SC方法未能充分考虑单位固定效应,而单位固定效应能够捕捉北京与对照组省份在结果水平上的重要系统性差异,这对于本研究来说至关重要。如图2的Panel(a)所示,北京的PM10平均浓度高于其他省份。此外,不同省份可能在其他影响结果的特征上存在差异,例如区域政策和居民生活方式等,而这些特征并不总是能够被完全观察到或量化。
为了更有效地应对这些挑战,本文采用了Arkhangelsky等在2021年提出的合成双重差分(SDID)估计量,这种方法结合了合成控制(SC)和DID方法的优势。
合成双重差分(SDID)方法
在这个方程中,Treatjt是一个指示变量,对于北京而言,2008年及以后年份其值为1,之前年份其值为0。省份固定效应用于控制各省份不随时间变化的特征(包括可观测和不可观测的特征),而年份固定效应用于控制所有省份共同面临的年度特定影响。向量Xjt包含了一组控制变量。在评估PM10的影响时,本研究控制了湿度和温度,因为研究显示这些因素会影响空气质量。在分析老年痴呆症患病率时,本研究进一步加入了性别、年龄和教育作为控制变量,因为这些因素被认为是老年痴呆症最重要的风险因素。本文关注的核心系数是β,它衡量了2008年北京奥运会治理政策(BOG08)对北京空气污染或老年痴呆症患病率的因果效应。
在这个过程中,省份权重的确定旨在使北京在2008年之前的PM10和老年痴呆症发病率与控制组中未受规制省份的加权平均结果大致平行,这与合成控制法(SC)中使用的权重有相似之处。时间权重 的设置则是为了确保控制组未受规制省份的加权平均结果在BOG08政策实施前后的一致性:如果某个特定的BOG08前时期更能预测BOG08后的结果,那么该时期会被赋予更高的权重。
合成双重差分(SDID)估计量融合了合成控制(SC)和双重差分(DID)方法的优势,并能有效应对前述的识别难题。首先,与SC方法相似,SDID强调未受规制省份的历史表现与北京的相似性,并匹配它们的处理前趋势,从而放宽了对原始数据“平行趋势假设”的严格要求。其次,与DID方法一样,SDID包含了省份固定效应和年份固定效应,这使得即便北京与未受规制省份在结果变量的水平上存在显著差异,也能构建出可靠的反事实。第三,SDID中加入的时间权重是SC和DID方法中所没有的,它通过降低与处理后时期差异显著的时间段的影响,提高了估计的精确度。最后,SDID方法能够为效应的点估计构造标准误差,即便在处理前时期较短的情况下也能进行系统性的推断。因此,本文将SDID方法作为主要的实证策略,并用以解释本研究的结果。
为了利用合成双重差分(SDID)方法为北京构建一个更为精确的合成对照组,本研究在基准估计阶段精心挑选了东部地区的5个未受规制省份作为对照组。根据中国国家统计局的区域划分,中国被划分为东部、西部、中部和东北四大区域。东部地区,包括北京在内,在经济、社会、环境、教育和健康等多个方面一直遥遥领先于其他地区。因此,在对照组的选择上,本研究更倾向于那些与北京特征更为接近的省份。然而,SDID方法中的额外惩罚项可能导致控制组中省份的权重分配较为分散,与合成控制(SC)方法相比,这可能会使得一些与北京差异较大的省份获得一定的权重,从而影响反事实对照组的精确度。在基准分析中,本研究特意排除了天津(东部)、河北(东部)、山西(中部)、辽宁(东北)和山东(东部)这些与北京地理位置接近或实施了补充措施的省份,以避免它们对估计结果造成干扰。在第7.2节中,本研究利用所有可用省份数据进行了稳健性检验,结果表明结论一致且具有统计学上的显著性。
在趋势识别方面,基于方程(2)的SDID估计量假设北京与通过省份权重和时间权重 构建的合成对照组在2008年之前具有相似的趋势。本研究对这一共同趋势的假设进行了验证。在计算标准误差时,本研究采用了Arkhangelsky等(2021年)提出的安慰剂方差估计方法,这种方法适用于单一处理组的情况。此外,本研究还进行了安慰剂检验,模拟了控制组中的某个未受规制省份被错误地标识为处理组的情形。通过这些安慰剂检验计算得到的SDID估计量的方差被用作效应估计的安慰剂方差,并据此构建置信区间。作为稳健性检验的一部分,本研究还运用了标准DID方法对方程(1)进行了估计,并采用了He等(2016年)提出的固定效应工具变量方法,以评估PM10对老年痴呆症患病率的影响。本研究的结果显示,所有结果在性质上均保持一致。
评估共同趋势假设
本节的核心任务是验证共同趋势假设,这对于确保研究结果的有效性至关重要。采用了Clarke等(2023年)在其综合分析框架中提出的方法,目的是探讨在政策实施前,处理组与合成控制组之间是否存在显著差异。这一验证步骤非常关键,它确保了两组在BOG08政策实施前的趋势具有可比性,从而为后续研究结果的可靠性打下了坚实的基础。
图3展示了政策实施前的趋势对比分析。图3的Panel A聚焦于PM10水平,显示处理组与合成控制组在政策实施前的趋势总体上是一致的,但在2001年出现了明显的偏差。这一特定的偏差已在稳健性检验部分得到了处理,以确保它不会对整体估计结果产生过大的影响。
*建议阅读全文内容。
*群友可直接在社群下载全文PDF和附录。 关于多期DID或交叠DID: 1.DID相关前沿问题“政策交错执行+堆叠DID+事件研究”, 附完整slides,2.交错(渐进)DID中, 用TWFE估计处理效应的问题, 及Bacon分解识别估计偏误,3.典范! 这篇AER在一图表里用了所有DID最新进展方法, 审稿人直接服了!4.最新Sun和Abraham(2020)和TWFE估计多期或交错DID并绘图展示结果!详细解读code!5.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习,6.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,7.交叠DID中平行趋势检验, 事件研究图绘制, 安慰剂检验的保姆级程序指南!8.欣慰! 营养午餐计划终于登上TOP5! 交叠DID+异质性稳健DID!9.用事件研究法开展政策评估的过程, 手把手教学文章!10.从双重差分法到事件研究法, 双重差分滥用与需要注意的问题,11.系统梳理DID最新进展: 从多期DID的潜在问题到当前主流解决方法和代码! 12.标准DID中的平行趋势检验,动态效应, 安慰剂检验, 预期效应教程,13.DID从经典到前沿方法的保姆级教程, 释放最完整数据和代码! 关于三重差分DDD估计,参看1.计量TOP刊最全三重差分DDD估计指导,2.TOP5最新文靶向了中国AI公司, 使用三重差分DDD进行实证评估,3.一些使用三重差分DDD的中文文章, 剔除其他干扰因素后获得政策的净效应!4.三重差分法运行和示例, 附上运行代码和结果解析!5.多期双(三)重差分法的操作指南(经典回顾),6.DID和DDD, 一个简明介绍, 双重和三重差分模型,7.曾国藩QJE: 权力之网, 运用DID, DDD, 事件研究方法!8.用9个示例系统讲解DID, DDD模型的用法, 并且都给出了数据和代码供操作!9.继发AER之后, 2021年再发Top5, 这是什么神仙组合? DID, DDD方法在顶刊仍然耐打!10.连续DID, DDD和比例DID, 不可观测选择偏差,11.AER上以DID, DDD为识别策略的劳动和健康经济学,12.做了一份Slides, 就Stata17中DID, DDD方法及使用策略, 代码做了总结
7年,计量经济圈近2000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle