使用报纸数据文本分析的叙事经济学:对 1928-1936 年美国白银购买法案和中国价格水平的新见解

文摘   2024-11-03 20:50   江苏  

『柏拉图说』是由南京大学计算传播学实验中心的成员们于20224月发起的论文精读与推介活动,我们将定期推送新闻传播学TOP期刊最新内容、新闻传播学前沿及相关量化研究方法论文。我们致力于深耕传播学领域,紧跟专业研究热点,延伸学术视角,拓展群体智慧。

柏拉图说 论文推介第 157 



Hsu, C., Yu, T., & Chen, S.-H. (2021). Narrative economics using textual analysis of newspaper data: New insights into the U.S. Silver Purchase Act and Chinese price level in 1928–1936. Journal of Computational Social Science, 4(2), 761–785. https://doi.org/10.1007/s42001-021-00104-0


摘要

在经济叙事分析的近期发展启发下,我们开发了一种计算文本分析方法来研究经济历史。这种方法通过收集报纸上的叙事数据来衡量经济趋势。特别是,将叙事(关键词)在报纸上的流行度(频率)作为与叙事术语相关联的经济活动的代理变量;高频率表明与叙事术语相关的经济活动量很大,反之亦然。然后应用正则化回归算法于叙事频率数据,以识别那些相关的微观经济活动对宏观经济产生影响的叙事术语。我们将该方法应用于研究中国经济学研究中的一个经典话题:美国白银购买法案和1928-1936年中国物价水平。我们的结果为这一有争议的主题提供了新的见解。例如,我们发现与叙事术语“银库存”相关的经济活动对中国物价水平没有影响,这与Friedman和Schwartz之前关于该主题的研究相反。与此同时,与叙事术语“美国白银购买法案”和“银出口”相关的经济活动被发现对中国物价水平有负面影响。这表明,当时对美国白银购买法案对中国经济影响的担忧并非没有道理。

背景

研究的核心问题是要探究美国白银购买法案(U.S. Silver Purchase Act)如何影响1928-1936年间中国的物价水平。

1934 年《美国白银购买法案》由富兰克林-D-罗斯福总统发起,旨在增加货币供应量和刺激美国经济。当该计划于 1933 年 12 月首次获得授权时,其支持者认为该计划将提高中国的购买力,因为中国的货币体系与白银挂钩。

弗里德曼和施瓦茨认为世界白银价格的上涨导致中国白银出口增加,白银外流导致货币供应量收缩,加速了通货紧缩,严重影响了中国的经济表现。布兰特和萨金特基于新的数据,认为中国的货币供应量没有下降,经济活动也没有收缩,中国价格水平(以银元衡量)的变化是世界价格水平(以美元衡量)和世界白银价格(以银元 / 美元汇率衡量)变化的产物,美国白银购买计划没有引发一系列不良经济事件并最终迫使中国放弃白银、采用法定标准。博德金通过对相关数据的分析,认为白银价格和美国的白银购买对中国价格和汇率有重要影响,白银购买法案对上海的繁荣产生了直接且严重的影响。

经济历史研究领域尚未充分关注文本分析的应用。特别是,在战争时期,收集和保存经济绩效数据非常困难,高质量的数据难以获得。本文假设报纸上叙事的流行度(关键词的频率)能够反映与这些叙事术语相关的经济活动的量,并且这种关系可以通过计算算法来量化。

数据

研究者从《申报》(翻译为Shunbao)收集了与美国白银购买法案和中国物价水平相关的叙事数据(关键词)。同时,也收集了经济绩效数据,包括纽约银价、汇率、上海银库存量和上海批发价格指数。

对收集的叙事数据进行了文本挖掘,提取了与研究主题相关的关键词,并计算了它们在报纸上的月度出现频率。对经济绩效数据进行了自然对数转换,并进行了平稳性检验。

研究方法

  1. 1.       建立向量自回归模型 (VAR)

要构建有意义的 VAR 模型,数据必须是平稳的并且没有协整(如果两组序列是非平稳的,但它们的线性组合可以得到一个平稳序列,那么我们就说这两组时间序列数据具有协整的性质)。否则,模型结果将在每个时期产生偏差,并且模型的递归时间序列方程将无限扩大偏差。

  • 使用纽约银价、汇率、上海银库存量和上海批发价格指数这四个时间序列数据构建VAR模型。VAR模型能够捕捉多个时间序列之间的线性相互依赖性。

  • 通过了单位根检验,以确保数据的平稳性。

  • 使用信息准则(如AIC和BIC)和似然比顺序来选择最佳的滞后阶数,最后选择的最佳滞后阶数为2。

通过Johansen检验来评估变量之间的协整关系,发现模型中协整方程的个数为0。

  1. 2.       Granger因果检验

在VAR模型的基础上,进行Granger因果检验来识别变量之间的因果关系。下表显示了纽约白银价格对上海银库存量的双向因果关系。

  1. 3.       脉冲响应分析

下面四张图表(分别为,纽约银价对汇率,汇率对纽约银价,上海批发价格指数对纽约银价,纽约银价对上海批发价格指数)绘制了 10 个时间步长的四个已识别因果关系对的 IRF(脉冲响应函数)。实线代表点估计,而灰色区域给出 95% 置信区间。由于 IRF 基于 VAR(2) 模型,我们将分析两个时间步长的“原因”增加一个标准差对“结果”的影响(即扰动项,即与序列均值的偏移程度,增加一个标准差时,step期的y的改变)。如第一张图表示,纽约银价在滞后 1 时对汇率单位上涨做出负反应 (2%),然后在滞后 2 时做出正反应 (4%)。

注:陈强《计量经济学与Stata应用》中对IRF的解释如下:

综上所述,我们对经济数据的多元时间序列分析表明,纽约银价对上海批发价格指数有影响,而白银库存和汇率对上海批发价格指数的影响并不显著。

正则化回归模型

研究者构建了三种正则化回归模型:岭回归(Ridge regression)、LASSO回归以及弹性网(Elastic Net)。三种模型的区别在于惩罚项的不同:当 α = 0 时,为岭回归;当α = 1 时,模型是LASSO;当 0 <α<1 时,为弹性网络。

下图为回归结果因变量是上海批发价格指数,Best λ是惩罚项前的最佳系数,使回归具有最小的平均交叉验证误差。在高影响变量方面,3个模型均选择了相同的5个变量(粗体),其系数如预期均为负值。七个与经济表现相关的关键词中的两个被选为高影响变量:“白银价格上涨”和“物价下跌”。白银价格上涨的受欢迎程度用来衡量白银价格的走势。正则化回归算法表明,白银价格对WPI有影响,而白银库存和汇率对WPI的影响并不显着。这些结果与我们在VAR模型中对经济绩效数据的多元时间序列分析一致。

结论

  • 与“银库存”(silver stock)相关的经济活动对中国物价水平没有影响,这与先前的研究相反。

  • “美国白银购买法案”(U.S. Silver Purchase Act)和“银出口”(silver export)相关的经济活动对中国物价水平有负面影响。

  • 报纸叙事数据可以作为缺失/无法获得的经济绩效数据的合理替代,用于进行经济历史研究。


作者信息

徐靖(Ching Hsu)毕业于台湾政治大学,目前是台湾师范大学的博士后。

陈树衡(ShuHeng Chen)是台湾政治大学副校长,计算经济学的先驱和开拓者之一,上世纪末将遗传算法引入经济行为分析,推动了计算经济学的发展。在利用计算机仿真模拟方法理解与解决经济问题的研究工作方面,产生了广泛和深远的国际影响。他所领导的人工智能经济学研究中心,是扬名国际的计算经济学、行为经济学与实验经济学研究重镇。chen.shuheng@gmail.com。


分享者

范宏瑞

https://fanhr.github.io/

南京大学新闻传播学院传播学专业硕士

研究生南京大学计算传播学实验中心成员

研究方向:计算传播、计算叙事

张潇逸

XiaoyiZhang833.github.io

南京大学新闻传播学院2024级专业硕士研究生

南京大学计算传播学实验中心成员

研究方向:文本分析、新闻史

计算传播学园
寻找人类传播行为的基因,通往计算传播研究之路
 最新文章