PNAS:通过机器学习扩展历史人均GDP估计的可用性

学术   2024-12-24 21:59   美国  

本期推荐一篇最新发表在PNAS上的论文《通过机器学习扩展历史人均GDP估计的可用性》。历史人均GDP数据的匮乏严重限制了我们对长期经济发展的理解,尤其是对于时间跨度长且地理范围广的欧洲和北美地区而言,历史经济数据尤为稀缺。传统的经济历史研究主要依赖于有限的文献和消费数据记录,这使得学者难以全面捕捉过去几个世纪的经济发展变化趋势。该研究旨在探索是否可以利用历史人物传记数据,通过机器学习技术,生成覆盖广泛地区和长时间跨度的历史人均GDP估计,以解决直接经济数据缺乏的问题。

研究团队首先通过Wikipedia和Wikidata收集了涵盖欧洲和北美地区的56万多条历史人物传记信息,包括人物的出生地、死亡地和职业等特征。这些特征被用作经济发展代理数据,即通过知名历史人物的地理和职业分布来间接反映区域的经济水平。接着,研究者利用弹性网络回归模型(Elastic Net Regression)进行分析,这一模型结合了岭回归和套索回归的优点,能够有效筛选出关键特征,避免模型过拟合的问题。在模型构建过程中,研究团队根据历史时期将时间段划分为五个主要阶段,分别为晚中世纪、早期现代、革命时代、机器时代和信息时代,以适应不同历史时期的经济特征。此外,模型通过交叉验证调优,并对不同时期的特征进行独立选择,以便动态调整模型参数,确保预测的准确性和适用性

研究结论表明,通过传记数据构建的模型能够有效生成较为准确的历史人均GDP估计,解释了约90%的GDP变异性。这一结果成功再现了1300年至1800年欧洲南北经济的“反转现象”,验证了大西洋贸易对北欧经济发展的积极作用。模型估计结果还与替代性经济发展指标(如城市化率、18世纪身高和教堂建筑活动)高度相关,证明了该方法的可靠性。该研究的意义在于,提供了一种全新的历史经济估算方法,为长期经济发展的研究开辟了新的数据来源和分析视角,为经济史研究带来了跨学科的创新思路。

论文原文:
PNAS,Vol. 121 No. 39,September 2024
Augmenting the availability of historical GDP per capita estimates through machine learning
Philipp Koch, Viktor Stojkoski, and César A. Hidalgo


唧唧堂学院推荐订阅


以下专栏及课程,安卓手机用户可通过下方小程序链接订阅,苹果手机用户请通过文末“阅读原文”链接访问唧唧堂学院H5页面订阅。


论文导读


**经济金融**

经济金融论文导读会员(年度)

2024 经济学顶刊论文导读/数据库

2024 金融学顶刊论文导读/数据库

中国主题经济学论文导读专栏

AER百年最经典论文导读专栏

人工智能主题论文导读专栏


更多经济金融论文导读专栏请访问

唧唧堂学院



数据库


管理学论文理论数据库

管理学论文数据集数据库

管理学论文量表数据库



方法班课程


AMJ(2022)微观研讨班

计量经济学论文研讨班

行为和心理科学顶刊听读研讨班

中介调节顶看方法班-单层(学生)

中介调节顶刊方法班-多层(学生)

经验取样顶刊方法班(学生)


更多方法班直播课程请访问

唧唧堂学院



咨询+开票+团购


唧唧堂
从数据到洞见,全面解读学术研究!
 最新文章