JDE上最新文章将研究视野从人类扩展到了鸟类,特别是从生物多样性的角度进行了探讨。这篇文章的研究风格与中国学者的研究范式颇为相似,其中采用了DID-TWFE、Bartik工具变量(IV)以及零第一阶段检验(Zero-first stage test)等方法。特别是对工具变量合理性的安慰剂检验部分,可以借鉴和学习一下。
文章中的异质性分析和机制分析均属于常规操作。在分样本回归分析中,有些结果呈现出显著性,而有些则没有。至于机制分析部分,主要是将中介变量M对自变量X进行回归分析,以探究X对因变量Y影响的具体路径。
概览一下该文:
这篇文章的结构设计很中国,第一部分引言,第二部分提出了研究假说(假说1为表明X对Y存在负向影响,假说2为X对Y的影响机制),并介绍了用于检验这些假设的计量经济学模型。第三部分详细阐述了研究结果及其背后的潜在机制。第四部分探讨了风力发电与燃煤发电在鸟类死亡率方面的权衡问题。最后,第五部分对全文进行了总结。
研究设计与方法
研究假设提出
鸟类作为衡量生态系统健康与生物多样性水平的重要指标,其重要性已经得到了广泛的认可。中国位于全球九条主要鸟类迁徙路线中的四条之上,因此对于鸟类的保护工作具有特别的重要性。现有文献资料表明,风力发电场对鸟类种群的影响主要体现在两个方面:一是由于风力涡轮机与鸟类发生直接碰撞而产生的直接影响;二是通过导致鸟类的位移、资源的排斥、栖息地的改造以及阻断常规飞行路线从而增加鸟类能量消耗等间接途径产生的影响。一些研究已经采用红外成像或卫星跟踪技术,对特定风力发电场或区域的鸟类死亡情况进行了监测。尽管如此,目前对于风力发电设施增加对鸟类种群整体影响的系统性量化研究仍然不足。基于此,本文提出以下假设:
假说1 风力涡轮机的安装对鸟类生物多样性具有负面影响。
除了风力涡轮机与鸟类相撞的直接风险之外,风电场的建设和运营还可能对地表环境造成破坏,例如对森林和草原的损害,这将进一步影响鸟类的栖息地。此外,土地覆盖的碎片化也可能对鸟类的食物来源产生负面影响。风力涡轮机通过降低风速和增加湍流混合,改变了地表的气象条件。Song等(2023)的研究显示,风电设施的扩张与草地覆盖面积的减少之间存在相关性,而草地是许多食草性鸟类的主要食物来源。因此,风力涡轮机的安装可能通过影响食物链进而对鸟类的生物多样性产生影响。基于这些分析,本文进一步提出以下补充假设:
假说2a风力涡轮机的安装通过栖息地丧失的途径对鸟类生物多样性产生影响。
假说2b风力涡轮机的安装通过减少农作物产量,进而影响鸟类生物多样性。
数据
风力涡轮机安装
风能设施的安装数据源自华夏(2014),这一资料由中国的一家非政府组织提供。该数据集详尽地记录了中国各风电场的地理坐标、风力涡轮机的数量、装机容量以及评估完成的时间,覆盖了1989年至2011年间所有风电场的信息。此外,本研究还搜集了2012年至2022年期间,各省发展改革委员会(DRC)官方网站上公布的风电场数据。根据规定,风电场的建设必须经过省级DRC的批准,并且相关批准信息会在政府网站上公示。本研究共收集了1,810个风电场的数据,涉及109,408台风力涡轮机。在研究过程中,我们依据公告中提供的确切地址,并结合县级特征,对数据进行了地理编码。风力涡轮机的安装数量被汇总到了县-月-年的维度。为了确保研究结果的稳健性,本文还利用了《The Wind Power》发布的最新数据进行验证。
图1(a)展示了截至2022年底,按县级划分的风能装机容量的空间分布情况,其中红色和黄色分别表示风能装机容量较高和较低的县。在研究期间,平均有16%的县安装了风力涡轮机,每个县平均安装的风力涡轮机数量为18.56台。
为了探究风力涡轮机的位置与鸟类多样性之间的潜在联系,本文构建了一个工具变量模型来评估风力涡轮机的影响。该工具变量包括了2004至2014年间县级100米高度的平均风速的对数值以及全国风力涡轮机年安装增长率。具体而言,县级100米高度的平均风速数据引自ECMWF的第五代再分析数据(ERA5)。表1的Panel A显示,2004至2014年间100米高度的平均风速为1.97英里每小时,而2015至2022年间全国风力涡轮机安装的年增长率为5.78%。
鸟类观察清单
本研究所使用的鸟类观察数据源自《中国鸟类观察报告》(China Bird Watching Report, CBR)。这是一个由公民科学项目收集并整理的详尽数据集,包含了观察的具体日期和时间、地点以及观察到的鸟类种类和数量等详细信息,该数据集由CBR(2023)开发。在本研究中,每一份鸟类观察记录被定义为一个“观察清单”。我们根据现有方法,将鸟类分类信息与中国的CBR数据集进行了匹配。为了确定鸟类在中国的空间分布,本文采用了ArcGIS Pro软件,依据报告中提供的经纬度信息对每个观察清单进行地理编码,并确定了相应的县级行政区,然后将数据按照县-月-年-物种的层级进行汇总。CBR收录了自1995年起的鸟类观察清单。考虑到2015年之前观察清单的数量较少,本文的研究样本限定在2015年至2022年间。图1(b)展示了观察清单的空间分布,显示出观察活动主要集中在中国东部和中部地区。为了减少异常值可能带来的影响,本文对每个观察清单中的鸟类数量和观察时长的极端1%进行了剔除。在进行稳健性检验时,本文使用了未经剔除的原始数据,结果保持一致。
本文关注的两个关键鸟类多样性指标是鸟类丰度和物种丰富度,这两项指标在衡量鸟类生物多样性方面具有重要意义。鸟类丰度是指在每个观察清单中,按照县-月-年-物种层级计算的某一物种的平均数量。物种丰富度则是指在特定县、特定月-年层级观察到的不同物种的总数,这一指标能更全面地反映鸟类种群的多样性。鸟类丰度和物种丰富度的变化,能够反映出风力涡轮机安装前后鸟类种群的变化情况。
在本研究中,CBR(中国鸟类观察报告)数据集潜在的抽样问题和偏差是一个核心考量点。幸运的是,超过2.32亿份观察清单构成的庞大样本量有助于减轻这些偏差,提高研究的准确性,尤其是相较于样本量较小的情况而言更是如此。与eBird平台类似,CBR与生态学、地理学、计算机科学和统计学等多个学科的研究人员合作,建立了网站和移动应用系统中的数据处理标准,以确保上传的鸟类观察数据的质量。每份报告必须包含每个物种的最大数量、观察时长、观察区域大小以及可能观察到的物种信息。系统会自动检查报告者输入的数据,若不符合标准则提示错误。这些数据处理和验证工具有助于减少观察者错误。
其中,因变量是县c在小时h、日期d、月份m、年份y的观察清单g报告的鸟类数量的对数;Duration是鸟类观察的持续时间(小时);是小时固定效应,是误差项。估计后,本文预测,它反映了在控制了观察努力和小时固定效应后,某县某月某年物种I的鸟类丰度。然后,本文通过求和预测的值,计算出某县某月某年的预测鸟类丰度或物种丰富度。在稳健性检验中,本文用预测的鸟类丰度和物种丰富度值替换了实际观察值,排除了可能与某县内风能装置月度变化相关的鸟类观察清单特征。
为了深入挖掘可能的异质性影响,本研究搜集了若干解释性变量。“Red List”是一个二元变量,标识某一物种是否被国际自然保护联盟(IUCN)定级为“近危”或面临更高威胁等级。“CN key list”同样是一个二元变量,指示某一物种是否被纳入中国政府公布的《国家重点保护野生动物名录》。而“GDP per capita”也是一个二元变量,若某省人均GDP超出样本均值,则该变量值为1。此外,通过词频分析,本研究识别了2005至2015年间政府报告中频繁出现“生物多样性”一词的县,作为衡量政府对生物多样性关注程度的一个指标。
其他变量
为了评估栖息地环境的变动,本研究计算了县级层面的月均归一化植被指数(NDVI)和湿地面积的归一化水体指数(NDWI)。自20世纪70年代卫星技术兴起以来,NDVI已成为衡量植物生长状况和农业产出的关键指标。NDWI作为一种基于卫星数据的湿地绘图方法,因其对地表水分含量的高度敏感性而被广泛采用。具体而言,月均NDWI值大于0的区域被识别为湿地或常年有水区域。本研究进一步汇总了县内所有湿地网格的面积,以得出该县在特定月份的湿地总面积。同时,本研究还计算了耕地面积以及三大主要作物(玉米、小麦和水稻)的生长季节持续时间,以评估作物物候变化及其对产量的潜在影响。相关原始数据源自Luo等(2020)。
此外,本研究还纳入了多个可能影响鸟类观察活动和鸟类多样性的控制变量。具体来说,本研究从ECMWF再分析v5(ERA5)数据库中获取了包括平均气温、能见度、平均风速、降水量和臭氧浓度在内的月度气温和环境数据。人口密度数据则来源于奥克里奇国家实验室,而夜间光照数据则来自地球数据网站上的可见红外成像辐射计套件(VIIRS)。表1的Panel C概述了本研究所使用的主要变量。
实证模型
双向固定效应模型
在此模型中,表示鸟类多样性的对数值,基于县c、地级市p、月份m和年份y级别的鸟类丰度(或物种丰富度)观测数据,对特定物种i进行汇总。是一个指示变量,若县c在m月y年之后安装了风力涡轮机,则取值为1,否则为0。X代表随时间变化的特征变量向量,包括县-月份-年份级别的平均鸟类观察时长、平均气温、能见度、平均风速、总降水量、平均臭氧浓度、县内自然公园面积的百分比、平均人口密度和平均夜间光照值等。
本研究通过一系列固定效应来控制潜在的不随时间变化的不可观测因素:市-年份固定效应用于控制城市层面的政策变化等不可观测因素;市-季节固定效应用于控制季节性气候波动及其他影响因素;县固定效应用于控制县级的地理特征等不随时间变化的因素;月-年固定效应用于控制月份特征;物种固定效应用于控制物种的栖息地偏好等不随时间变化的因素。回归分析依据县-月份-年份的观测单数进行加权。
在此模型中,表示县c在m月y年已安装风力涡轮机数量的对数,若该县在该时间点未安装风力涡轮机,则取值为0。其他变量的定义与方程(2)相同。回归分析同样依据县-月份-年份的观测单数进行加权。根据假说1,本文预期系数α和β应为负值,表明风力涡轮机的安装对鸟类多样性产生负面影响。
风力发电机选址引起的潜在内生性问题
风力发电机的选址并非随机,自2003年中国政府发布风电场选址技术规范以来,一直强调优先选择风能资源丰富区域,并规避生态敏感区。这一选址策略可能导致样本违背TWFE模型的平行趋势假设。同时,不同地区和时间在执行选址政策上的差异,也可能对模型(2)和(3)中的TWFE模型估计造成偏差。
其中,代表县c在m月y年的处理变量,可以是模型(2)中的或模型(3)中的。表示2004至2014年期间县c在100米高度的平均风速对数值,代表风力发电机安装的全国年增长率。在此情形下,是基于第一阶段回归得出的预测值,如模型(5)所示。同样,回归分析依据县-月份-年份的观察单数进行加权。本文的主要系数表示已安装风力发电机对鸟类多样性的处理效应,根据假说1,预计该效应为负值。第3.2节将实施几个实证检验,以验证风力发电机工具变量的外生性条件。
工具变量的有效性
在本研究中,我们运用了工具变量估计模型,并综合控制了城市-年份固定效应、城市-季节固定效应、县固定效应、月份固定效应、观鸟活动和当地天气状况等变量。这种实证模型设计有助于排除风电机组建设与鸟类多样性之间的潜在伪相关因素,例如地形和气候等。然而,我们还需考虑到历史风速可能与一些未被观测的特征相关联,这些特征可能会对鸟类种群产生影响。
为应对这一挑战,本文参考了Guiso等(2016)和Lal等(2024)的研究,采用了“零第一阶段”(Zero-First-Stage, ZFS)检验。2013年,中国政府宣布建立国家公园体系,并在2015年启动了五个试点国家公园。这些国家公园是根据13个部委和委员会联合发布的《国家公园体系建设试点方案》设立的,其中包括国家发展和改革委员会(NDRC)。根据该方案,国家公园对生物多样性实施了最严格的保护措施,禁止任何与保护无关的建设活动。这一政策背景为本文设计ZFS检验提供了坚实的基础。直观来看,如果历史风速与一些未被观测的特征相关,并且这些特征仍然存在并影响鸟类种群,那么预计在国家公园内的县中不会观察到风电机组工具变量与鸟类多样性之间的相关性。为此,本文将样本划分为国家公园边界外的县和国家公园内的县(以下简称为“ZFS”子样本)。接着,利用这两个子样本对风电机组工具变量与鸟类多样性之间的关系进行了回归分析。表3 Panel A的结果显示,风电机组工具变量对国家公园外县的鸟类多样性产生了负向且显著的影响,无论是通过列(1)的鸟类丰度还是列(3)的鸟类物种丰富度来衡量皆是如此。此外,在“ZFS”子样本中,风电机组工具变量与鸟类多样性之间没有显著的相关性,如Panel A中的列(2)和(4)所示。这拒绝了历史风速可能与某些未被观测的特征相关,并且这些特征仍然存在并影响鸟类种群的假设。
在研究风速与鸟类多样性之间的联系时,本文注意到一个可能的偏差:那些风速较高的区域,尤其是沿海地区,原本就可能拥有更丰富的鸟类多样性,并且这些地方的电力需求通常也较大。即使没有风力发电机的建设,这些区域的鸟类多样性也可能会自然下降。为了检验历史风速对鸟类多样性影响的外生性,本研究借鉴了Goldsmith-Pinkham等(2020)的方法,开展了两项实证检验。
具体来说,本文选取2015年的夜间灯光数据作为衡量经济活动的代理变量,以此反映各县域的经济活跃度;同时,将2015年的人口数据和规模以上企业数量作为人口规模和工业电力需求的指标。然后,我们对风速(WindSpeedc)和风力发电机工具变量(WindSpeedc×NGy)与这些经济指标进行了回归分析。
表4的结果表明,高风速区域(WindSpeedc)与基期鸟类多样性之间并没有统计学上的显著关联。但是,我们发现地方经济活动和人口规模与历史风速(WindSpeedc)之间存在显著的相关性。在使用WindSpeedc×NGy作为因变量的回归分析中(列(2)),这些相关性依然显著,这与Goldsmith-Pinkham等(2020)的观点一致,即这些比例通常是均衡对象,可能与结果的水平共同决定,而Bartik类工具变量的有效性在于这些比例与结果的变化是外生的,而不是与结果变量的水平相关。
此外,还采用了事件研究方法,探讨了风力发电机安装前鸟类多样性的前期趋势。附录C中的图C.1显示,在风力发电机安装之前,鸟类多样性的趋势并没有显著差异。详细的研究方法和结果讨论请参见附录C.1。总体而言,本文提出的风力发电机工具变量(WindSpeedc×NGy)很可能满足工具变量估计的排除限制假设。
在分析风力发电机对鸟类多样性影响的过程中,我们面临一个潜在的问题:这种影响可能并非直接源于风力发电机本身,而是由于鸟类观察者在向中国鸟类观察报告(CBR)提交数据时的行为变化所致。为了验证这一点,进行了回归分析,探讨了检查单数量与处理变量之间的关系,旨在确定风力发电机的安装是否引起了观察次数的变化。具体结果详见附录C中的表C.1。根据该表中列(1)-(2)的两阶段最小二乘估计(TWFE)和列(3)-(4)的工具变量估计(IV)结果,本文并未发现风力发电机的安装对鸟类观察者提交检查单数量的行为有显著影响。
此外,我们还利用了2019年7月至2021年10月期间中国某城市的详细全球定位系统(GPS)数据。这些数据来自手机记录,用以衡量访问有风力发电机和无风力发电机区域的游客差异。该数据集包含了841万个网格单元的观测数据,覆盖了该市626个风力发电机所在的区域(手机记录的详细信息请参见附录B.2)。基于附录C中描述的方程B.1,我们进行了结果估计。如图C.2所示,与距离风力发电机9至10公里(作为对照组)的游客数量相比,特定距离网格上的游客数量没有显著差异。因此,本文的结果不太可能是由风力发电机导致鸟类观察者或其他游客行为的变化所驱动。然而,本文的结果可能受到风力发电机建设后地面覆盖变化引起的鸟类可见性变化的影响,尽管这一效应可能较小,且在其他条件不变的情况下,NDVI的减少(例如森林覆盖率降低)更可能增加鸟类的可见性。
后面就是各种异质性分析,使用的是分样本回归,有的显著,有的不显著;此外,还做了可能的机制分析,使用的方法就很简单,直接用M对X做回归,参见:当前, 更推荐用哪一种TOP5刊上的机制分析方法呢? 有相关文献么?
关于机制分析,参看,1.又被拒稿了!机制检验除了中介效应还有其他方法吗?2.实证中如何做竞争性假说的检验?AER范本的方法还能当机制分析用,3.这种机制分析方法受到经济学认可, 曾出现在经济学TOP5期刊上!4.计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论,5.关于影响机制的分析思路和实操策略, 我们能够做的就只有这么多了!6.学习机制分析应该阅读的经典材料有哪些?7.上双一流大学能多赚多少钱? 学习断点回归RDD, 机制分析的经典文章!8.Top5最新: 为什么富有的父母有富有的孩子? 一篇学好机制分析的佳作!9.必读, 宗教是如何阻碍经济发展的? 基于DID, IV和各种机制分析的AER量化史分析!10.期刊明确规定: 机制检验是本刊十分看中的实证内容, 是不可或缺的
群友可直接在社群下载全文PDF。 Bartik工具变量法最新发展,参考1.Bartik IV构建操作程序和步骤, 使用该IV策略的AER数据和code及中英文文献,2.此文的研究发现, 可能会与AER“上山下乡”一样充满争议, 连续DID, 队列DID和Bartik IV,3.AER: 中国城乡迁徙与企业生产, 移动份额工具变量法Bartik,4.Bartik工具变量是什么? 份额移动法IV应用越来越多,5.TOP5前沿: 时下最流行的移动份额工具变量SSIV研究设计指南!6.免费4门课程, 因果推断1和2, IV, 份额移动IV和高级DID, 附数据,代码,讲义和阅读清单,7.Bartik工具变量法最新发展和使用方法流程图总结
内生性问题的拓展性阅读 ,0.看完顶级期刊文章后, 整理了内生性处理小册子;1.“内生性” 到底是什么鬼? New Yorker告诉你;2.Heckman两步法的内生性问题(IV-Heckman);3.IV和GMM相关估计步骤,内生性、异方差性等检验方法;4.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题;5.毛咕噜论文中一些有趣的工具变量!;6.非线性面板模型中内生性解决方案;7.内生性处理的秘密武器-工具变量估计;8.内生性处理方法与进展;9.内生性问题和倾向得分匹配;10.你的内生性解决方式out, ERM独领风骚;11.工具变量IV必读文章20篇, 因果识别就靠他了;12.面板数据是怎样处理内生性的;13.计量分析中的内生性问题综述;14.工具变量IV与内生性处理的解读;15.一份改变实证研究的内生性处理思维导图;16.Top期刊里不同来源内生性处理方法;17.面板数据中heckman方法和程序(xtheckman);18.控制函数法CF, 处理内生性的广义方法;19.二值选择模型内生性检验方法;20.2SRI还是2SPS, 内生性问题的二阶段CF法实现;21.内生变量的交互项如何寻工具变量;22.工具变量精辟解释, 保证你一辈子都忘不了,23.审稿人: 为啥你不展示Y对工具变量Z的简约式回归结果呢?24.Two Sample IV, 双样本二阶段工具变量回归, TS2SLS充分利用2份数据的信息,25.Stata自救行动: 高维固定效应HDFE, 弱工具变量稳健性估计, 工具变量SVAR
7年,计量经济圈近2000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle