前有AER知青下乡, 今有AEJ人民的敌人, 实证策略值得每位量化史学者学习! 平衡性检验做得出彩!

学术   2025-01-21 16:00   江苏  

凡是搞计量经济的,都关注这个号了
稿件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

前有中国学界F4发表AER一篇! 知识青年上山下乡与农村教育问题!”及其争议,1.对陈,范,顾, 周四人AER文章数据, 实证, 机制和结论提出32页质疑!2.关于AER文章被质疑的紧急回应和答复, 对我们的质疑毫无根据纯属个人经验谬判!3.田国强教授就AER知青上山下乡一文的态度和意见, 并就DID等方法给出了自己的观点”。
今有AEJ: Macroeconomics上的“人民的敌人”,这有点像我国版本的知识青年上山下乡。

Toews, Gerhard, and Pierre-Louis Vézina. 2025. "Enemies of the People." American Economic Journal: Macroeconomics, 17 (1): 310–42.

这篇文章说了个什么情况呢?

话说,苏联时期曾强行将数百万“人民的敌人”送往各地的劳改营。这些所谓的“敌人”,实际上是受过良好教育的知识分子、科学家、商人等,他们被认为对苏联政权构成威胁。本文将这段历史视为一个“自然实验”,用以研究教育和技能(即人力资本)对后代的影响,以及这些影响如何推动经济增长。

本文结合了劳改营的档案数据和2018年俄罗斯企业的数据,发现那些靠近劳改营、尤其是“敌人”比例较高的地区,如今发展得更好。这种繁荣体现在企业工资更高、利润更多,以及夜间灯光更亮(这通常意味着经济活动更活跃)。

列宁在1917年曾说:“对这些人民的敌人、社会主义的敌人、工人阶级的敌人绝不宽恕!要对富人及其随从、资产阶级知识分子发动毫不留情的斗争……”

斯大林在1937年也说:“任何试图破坏社会主义国家统一的人,都是国家、苏联人民的死敌。我们将摧毁任何这样的敌人……我们将摧毁他的亲属、他的家庭。”

简要介绍一下这篇文章:

“人民的敌人”,俄语为“vragi naroda”,是指那些被认为对苏联政权构成威胁的知识分子、科学家、政治家和商人。他们与数百万无辜的非政治性囚犯一起,被送往苏联各地的强迫劳动营。这些营地被Aleksandr Solzhenitsyn形象地称为“古拉格(Gulag)群岛”。根据1954年苏联内务部的报告,从1921年到1953年,共有3,777,380人因煽动反革命被定罪,其中2,369,220人被送往古拉格。

由于这些“人民的敌人”在古拉格解体后仍留在原地,他们的流放产生了持久的影响。特别是通过人力资本的渠道,这种影响尤为显著,因为他们大多是受过高等教育的精英群体。

本文将苏联大规模流放“人民的敌人”视为一个“自然实验”进行研究。由于这些人被流放到不同地点几乎是随机的,因此可以用来观察受过良好教育的人对当地经济的长期影响。通过这一研究,本文证明了人力资本(即人的知识和技能)不仅能够代代相传,还能对经济增长产生影响。

本文不仅通过“人民的敌人”这一案例,帮助我们更好地理解人力资本对经济发展的作用,还通过这种自然实验的方法,为宏观经济学的研究提供了新的思路和证据。

本文的关键研究资料来源于俄罗斯国家档案馆(GARF)的微缩胶片,其中包含了苏联强迫劳动营(古拉格)的数据。它们帮助作者详细记录了那段恐怖的历史。

特别重要的是,这些数据还记录了古拉格囚犯被关押的原因,即他们被指控的“罪行”类型。通过这些信息,作者能够了解每个营地里关押的“敌人”身份,例如是知识分子、科学家还是商人。凭借这些细节,作者可以分析这些被流放的人对古拉格所在地区的长期发展产生了哪些影响。这么说吧!这些数据就像一把钥匙,帮助作者解开古拉格对当地发展影响的谜团。

本文首先介绍了“人民的敌人”被流放的历史背景,尤其是针对知识精英的逮捕和流放。本文指出,这些逮捕和流放是随机的,而且被流放者被分配到不同营地的过程也近乎随机。根据历史记载,这一过程主要由政治和意识形态驱动,而非出于工业发展的目的。例如,Khlevnyuk(2003)和Ertz(2008)的研究指出,流放的真正目的是消灭这些“敌人”,而非将他们作为古拉格项目中的强迫劳动力。

本文通过记录知识精英被逮捕的随机性,排除了他们是自愿移民的可能性。同时,由于这些人是被迫迁移的,也排除了他们自行选择流放地点的可能性。此外,本文还表明,无论是古拉格中的经济活动,还是有利的地理条件,都无法预测每个营地中“敌人”的比例。这一发现进一步确认了该研究的“自然实验”特征,使得本文能够准确识别流放对长期发展的影响。

本文利用2016年的一项家庭调查数据,首先发现“人民的敌人”的后代往往具有较高的受教育程度,并且更倾向于居住在“敌人”比例较高的古拉格附近地区。进一步的家庭和公司调查数据也显示,这些地区的整体教育水平较高,表明教育通过代际传递得以长期保持。

接着,本文将古拉格营地的地理位置与当前经济活动进行匹配(相关数据来源于俄罗斯所有公司的数据集)。通过这种方式,本文比较了受不同强度“敌人”流入影响的古拉格地区的当前经济成果。研究发现,2018年,在靠近古拉格的公司中,那些邻近“敌人”比例较高的营地的公司,支付的工资更高,每位员工的利润也更高。当以夜间灯光人均值作为本地繁荣的代理变量时,结果与上述发现相似。

具体地,从一个“敌人”占比19%的营地附近的城镇(这是古拉格系统末期和鼎盛时期的平均值)搬到一个“敌人”占比47%的营地附近,相当于从均值增加一个标准差,会使夜间灯光人均值增加46%,每位员工的利润增加14%,平均工资增加22%。如果将“敌人”的影响转化为长期教育回报参数,1952年大学受教育人数比例每增加1个百分点,2010年夜间灯光人均值将增加21%,2018年每位员工的利润增加7%,平均工资增加11%。

尽管1950年代的教育水平与今天的工资之间的关系与当代教育回报的估计并不直接可比,但这可能暗示了某种人力资本的外部效应,即受过大学教育的工人(在俄罗斯,其工资溢价约为30%)也会对低学历工人的工资产生积极影响。关于人力资本在解释跨地域收入差异中的外部效应,可参考Acemoglu和Angrist(2001年)的研究。

本文主要研究了“人民的敌人”流放事件对俄罗斯经济的长期影响。研究发现,这些流放事件对制造业、金融业、建筑业和酒店餐饮业等行业的工资影响是普遍存在的,而不是仅限于某个特定行业。即使排除了采矿企业和采矿城镇,结果依然一致。此外,研究也没有发现古拉格的运输基础设施、国防工厂或苏联后期的大学投资对结果有显著影响。

这篇本文的贡献主要有两个方面:

1.记录历史事件:通过数据记录了数百万“人民的敌人”被流放的历史事件,为俄罗斯经济历史的研究提供了新的视角(参考Zhuravskaya, Guriev和Markevich 2024年的研究)。

2.人力资本的作用:本文进一步探讨了人力资本(即人的知识和技能)对经济增长的推动作用。例如:

Hanushek、Ruhose和Woessmann(2017年)的研究发现,人力资本可以解释美国各州人均GDP差异的20%-30%。
Hendricks和Schoellman(2023年)的研究表明,人力资本可以解释国家间收入差距的50%-75%。
其他研究发现,受过教育的工人可以通过技术知识、更好的组织和管理能力来提高企业的生产力(如Abowd等2005年、Ilmakunnas等2004年、Haskel等2005年的研究)。

此外,本文还提到,许多类似的研究都依赖于历史上的自然实验来分析人力资本对发展的影响。例如:

Easterly和Levine(2016年)发现,欧洲殖民者的后代将人力资本带到新国家,使这些国家变得更富裕。

Rocha、Ferraz和Soares(2017年)发现,巴西某些地区在1900年左右通过政策吸引了大量高技能移民,如今这些地方的教育水平和人均收入更高。

Droller(2018年)发现,欧洲定居者提高了阿根廷县的识字率,促进了工业化。

Hornung(2014年)研究了17世纪末普鲁士接收法国技术移民的地区,发现纺织企业的生产率显著提升。

Bazzi等(2016年)发现,印度尼西亚的一项政策实验将农民重新安置到某些地区,他们带来了人力资本和技能,促进了当地的发展。

Fiszbein(2022年)指出,美国各县的劳动技能和长期增长与过去的农业多样性有关。

Chen等(2020年)发现,在毛泽东时期,1600万名高中毕业生被强制迁往偏远乡村,这使得当地农村儿童获得了额外的教育。

这些研究都表明,人力资本对经济发展有着深远的影响。

本文不仅通过研究“人民的敌人”这一特殊案例,为人力资本长期增长效应的研究做出了贡献,还提供了一个独特的“自然实验”。与其他研究不同的是,这里的受过教育的人并不是自愿迁移的,也没有选择自己要去的地方,他们的安置也不是基于战略安排的。

因为本文比较长,它的结构如下:

  1. 历史背景:介绍“人民的敌人”的概念及其历史背景。
  2. 数据展示:说明数据来源及其内容。
  3. 实证策略:介绍作者的分析方法。
  4. 结果和稳健性检验:展示研究结论及其可靠性检验。
  5. 总结:对前面的内容进行简要回顾。
下面主要介绍一下该文的实证策略,这对于我们理解该文及对我们今后的实证研究有不少帮助作用。
实证策略
在研究“人民的敌人”流放的影响之前,本文首先检查了这些“敌人”是否被随机分配到某些特定地区或行业。如果“敌人”被分配到条件较好的地方,例如土壤肥沃的地区、靠近大城市或技术密集型行业,那么这些地方本来就可能发展得更好,这会干扰研究结果。因此,本文需要确认“敌人”的流放是否像自然实验一样随机。
为了检查“敌人”是否被随机分配,本文分析了“敌人”比例较高的劳改营和其他劳改营在工业和地理特征上是否存在显著差异。本文在表2中展示了“敌人”比例与劳改营的偏远程度、活动类型、地理特征以及规模之间的关系。

参看: 在DID评估中, 这种balance test表格或图可以用起来, 比较直观.

  • 第一列显示了通过回归分析得出的“敌人”比例与营地特征之间的关系系数。
  • 第二列是这个系数的标准误。
  • 第三列是自助法标准误。
  • 第四到第六列是p值,用来判断这些关系是否显著,同时考虑了多重假设检验中的第一类错误率(Type I Error Rate)。
  • 第五列和第六列是经过Bonferroni-Holm和Sidak-Holm调整的p值,第四列是Westfall和Young p值,这些方法都考虑了p值之间的依赖性。

结果显示,营地的任何特征(无论是地理位置还是规模)都与“敌人”比例无关。第五列和第六列的结果表明,“敌人”比例高的营地通常位于1926年人口密度较低的地方,偏北、气候寒冷、土壤质量差。这说明“敌人”并没有被分配到条件好的地方,反而是条件较差的地方。

此外,本文还检验了地理变量的联合显著性,结果发现这些变量在统计上并不显著。第七列报告了基于偏远程度、地理、自然资源和经济活动等变量组的联合显著性F检验的p值。结果显示,整体上发现自然资源这一组变量对研究结果有一定的显著性影响(即它们与研究对象之间存在某种统计关联)。然而,当进一步分析具体变量时,发现唯一真正显著的变量是营地是否拥有铁矿。换句话说,只有“营地是否有铁矿”这一变量对结果有显著影响,而其他自然资源变量的影响并不显著。
总体上,这些分析表明“敌人”的分配是随机的,没有被系统性地分配到条件较好的地方,这为研究提供了一个自然实验的基础。
此外,“敌人”在劳改营之间的分配几乎是随机的。研究并未发现“敌人”比例与任何特定经济活动(例如能源生产、金属工业、林业、农业、机械工程、轻工业,甚至是研发活动)之间存在正相关关系。换句话说,“敌人”并没有被集中分配到某些特定行业。
在基础设施发展方面,研究同样没有发现“敌人”比例与采矿、住房、制造业或物资基础设施发展之间存在任何关联。这并不令人意外,因为劳改营的主要管理部门并不负责营地的企业和投资项目,这些事务是由内务人民委员会(NKVD)负责的。劳改营的管理部门主要负责囚犯的监视、住宿、健康问题,以及纪律和宣传活动。
为了进一步确认这些变量(无论是地理还是经济活动相关)是否与“敌人”比例存在稳健的关系,本文还采用了LASSO模型。这种模型能够帮助识别哪些变量最能预测劳改营中“敌人”的比例。结果显示,只有4个变量在某些模型中被选中,但没有任何一个变量在所有模型中都显著相关。研究发现,营地规模(以囚犯总人数衡量)和到铁路的距离可能是“敌人”比例的相关预测变量,而是否有研发活动则与“敌人”比例呈负相关。然而,当在LASSO模型中加入地区固定效应后,结果发生了变化,只有“是否有铁矿”这一个变量被选为预测变量,而这一结果主要由某个特定营地所主导。因此,LASSO结果进一步证实了“敌人”在营地之间的分配是接近随机的。
尽管统计检验表明,营地的任何特征都没有系统性地与“敌人”比例相关,但本文在稳健性检验中仍然选择控制一些特定地点的特征。例如,本文控制了偏远程度变量(如纬度和经度、1937年铁路轨道的距离),以及1926年100公里范围内的人口,这些变量可以帮助捕捉劳改营之前的开发水平。同时,本文还控制了营地规模,因为它可能反映了与营地发展相关的其他不可观察的特征。
本文还通过回顾劳改营的历史叙述,检查是否存在“敌人”分配的系统性偏差,结果没有发现任何这种系统的迹象。驱逐过程通常被描述为匆忙且杂乱无章,伴随着随机逮捕和火车集结。Solzhenitsyn(1973)指出,“敌人”被与其他囚犯混在一起,以避免叛乱行为。本文还与多位专门研究俄罗斯当代历史的历史学家进行了讨论,他们也表示并不知晓任何关于“敌人”分配的规则。唯一的例外是1948年至1949年间专门为“敌人”设立的九个特殊劳改营。这些劳改营(在线附录图A.3中)被标记为“内务部特殊劳改营”,本文在实证分析中考虑了这些特殊案例。
或许最能体现强制驱逐“敌人”本质的方法是引用Khlevnyuk(2003)的一段话,他写道:“大恐怖的主要目的是从一开始就将‘敌人’进行物理消灭,而不是将他们作为廉价劳动力使用……恐怖的政治动机绝对优先于经济动机。”Ertz(2008)也指出:“在苏联,逮捕从来不是由对强迫劳动者的假定需求所决定,而是由政治和意识形态的考虑驱动的。从劳改营管理者的角度来看,囚犯的数量基本上是一个外生变量,常常受到不可预见的波动影响,这也带来了管理上的问题。”
因此,无论是历史证据还是数据,都没有显示“敌人”在具有特定工业或地理特征的营地中存在系统性的分配,而这些特征可能是今天繁荣和企业生产力的驱动因素。相反,“敌人”更有可能被送往人口稀少、气候条件恶劣的地区。因此,劳改营中“敌人”的分配可以被视为一个自然实验,使本文能够识别教育持久性对长期繁荣的影响。

为了检验“敌人”对家庭教育水平以及劳改营附近不同“敌人”比例的企业工资和利润的长期影响,本文在家庭或企业层面估计了以下模型:

其中,Yi 是家庭i报告的教育水平,或者是企业i每位员工的工资或利润;Enemies( 是距离家庭或企业i 100公里内的劳改营g中“敌人”所占的比例;αr(i) 是地区固定效应(按州级划分)。在稳健性检验中,本文展示了将半径从10公里扩展到100公里后,结果依然稳健。在分析企业层面的结果时,本文根据企业的员工数量对观测值进行加权,以捕捉它们对当地工资的贡献。由于许多家庭或企业在特定地点受到同一劳改营或同一组劳改营的影响,本文按地理集群对误差项ϵi进行聚类,即按处理级别进行聚类。
尽管本文的平衡检验表明没有营地特征与“敌人”比例系统性相关,但本文仍在估计时加入了额外的控制变量。本文选择了一个包含位置特定控制变量的计量模型,包括纬度和经度;以及偏远性控制变量,如距离1937年铁路轨道的距离和1926年100公里范围内的人口,以捕捉劳改营之前的开发水平。本文还控制了营地规模,因为它可能捕捉到与发展相关的、不可观测的营地特征。本文通过采用Oster(2019)的方法计算估计结果的界限,以检查与营地规模相关的不可观察因素是否可能在本文的估计中引入偏差。

长按下方二维码查看全文:

*群友可直接在社群下载该文全文及数据和code。
关于固定效应,参看:1.交互项! 交互项! 固定效应回归模型中的交互项!2.在Stata中如何做2SLS, DID, DEA, SFA, 面板PSM, 二值选择, 固定效应和时间序列?3.一定要控制时间固定效应吗?4.公司和个体固定效应总是更好吗? 关于固定效应使用和解释的最全指南!5.使用固定效应FE时良好做法对应的检查清单,6.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,7.快速估计带有高维固定效应的泊松模型, 这计算速度真快, 真实用!8.不能直接控制某个固定效应时, 我们能尽量做些什么呢?9.时间固定效应和时间趋势项的区别, 可以同时加?10.省份/行业固定效应与年份固定效应的交乘项固定效应,11.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理,12.广义合成控制法gsynth, 基于交互固定效应的因果推断,13.固定效应模型+测量误差=有问题, 如何解决这问题呢?14.到底控制什么层面的固定效应? 最低, 最高, or随意?15.固定效应: 目前看到解释的最清楚的帖子, 救命!16.固定效应模型+测量误差=有问题, 如何解决这问题呢?17.TOP5被质疑用log(1+x)数据转换, 固定效应, 双重差分事件图, 结论不可靠!18.审稿人: 如何在双向固定效应下还能估计出不随个体变化的宏观变量呢?
关于聚类标准误的使用及其聚类层级的问题,1.啥时候使用聚类标准误, 以及数据聚类的修正方法? 2.在什么级别上标准误聚类, 个体, 县, 省或行业, 时间?3.什么时候用双聚类稳健标准误? 在个体和时间层面上考虑依赖性问题!4.双重聚类cluster咋做? 线性, logit, tobit可以双聚类吗? 5.聚类标准误精辟解释, 保证你一辈子都忘不了!6.4位计量领域大佬在TOP5上为聚类标准误问题提供了实证建议!7.完整解读TOP5刊的"什么时候和如何对标准误做聚类调整?" 4位计量大佬的合作!
一些讨论,1.七大常见计量问题讨论汇总, 涉及控制,异质,机制,DID,DDD,调节,固定,平行,安慰等,2.关于双重差分DID政策评估中的控制变量选取标准?3.在平行趋势检验中对政策前后系列年份进行缩尾处理?4.使用异方差稳健而不是聚类稳健标准误, 在固定效应模型中能接受吗?5.平行趋势通不过, 该采取什么方法来更好地满足平行趋势呢?6.QA: 基尼太美, 农业数据, 机制检验, 组间差异, 博士论文创新, 控制函数, FM回归 7.审稿人: 你2SLS-IV回归中为啥R方是负数呢?

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 机制调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

计量经济圈
凡是搞计量经济的,都关注这个号了。
 最新文章