【JFE论文速递】一图胜千言:机器学习度量投资者情绪

学术   财经   2024-06-17 21:02   上海  

  • 这是“金融学前沿论文速递”第1447篇推送

  • 选文:李静远 审稿:张泽宇 终审:戚豪凯 编辑:李甜

  • 仅用于学术交流,原文版权归原作者和原发刊所有


原刊和作者:

Journal of Financial Economics 2021年6月

Khaled Obaid (California State University-East Bay) 

Kuntara Pukthuanthong (University of Missouri)


摘要

本文对图片进行机器学习,准确且低成本地分类情绪,从大量新闻图片中获得每日市场层面的投资者情绪指数(图片悲观度)。与行为模型一致,图片悲观度能预测市场收益反转和交易量。该关系在套利限制高的股票和恐慌情绪高涨时期最明显。图片悲观度与文本悲观度在预测股票收益上的作用是替代关系。


一个好的小品胜过一个冗长的演讲。

——拿破仑·波拿巴


研究背景

金融学者普遍接受了机器学习的使用。机器学习技术通常用于文本分析。例如,Manela and Moreira (2017)用机器学习从《华尔街日报》文本中构建新闻隐含波动率指数。Buehlmaier and Whited (2018)通过分析财务报表构建了一个财务约束指标,发现该指标与获得资本及股票收益有关。最近,资产定价学者将机器学习用于金融数据,以预测风险溢价(Gu et al., 2020)并探索真正的风险因子(Feng et al, 2020)(阅读相关)


机器学习的最新技术可以分析大量图片。大量研究发现,投资者情绪能帮助理解和预测市场收益时序和股票横截面收益。本文从美国新闻图片中构建一个日度市场层面的投资者情绪指数(图片悲观度Photo Pessimism),考察新闻中的视觉内容如何影响金融市场


研究创新 

首先,本文证实了视觉内容在预测市场收益方面的重要性。构建日度投资者情绪指数:图片悲观度(PhotoPes),即某日预测为负面的新闻图片的比例。本文发现,图片悲观度负向预测次日市场收益,并与剩余交易周的市场收益正相关。这种收益反转突出表明,本文的度量指标对收益具有非信息性影响。与投资者情绪代理指标一致,本文表明图片悲观度预测次日交易量的增加,并且更好地预测高套利限制股票的收益。


其次,本文展示如何用机器学习来分类大规模图片,以克服金融市场研究中视觉内容重要性的关键障碍。由于现代技术发展和对快速信息的需求,新闻摄影越来越受欢迎。已有研究表明,图片比文字能更有效地传达情绪信息,因而研究新闻图片中提取的情绪如何影响市场活动很重要。然而,分析图片很复杂,手动筛选大量图片成本高昂、易错且乏味。依靠调查或众包网站(如Amazon Mechanical Turk, MTurk)来评估图片已成为提取图片信息的主流方法。除了成本高,经济学家对调查数据持谨慎态度,因其主观性,不能通过“客观的外部度量”来验证。例如,Singer (2002)表明,当问题涉及敏感主题且答案取决于受访者的感知时,受访者往往缺乏足够动机认真和诚实地回答问题。本文用机器学习方法减轻了这种担忧,因为嵌入在图片中的情绪是由机器统一提取的。具体而言,应用卷积神经网络(convolutional neural networks, cnn),一种用于分类图片的机器学习技术,基于情绪对大量新闻图片进行准确、可验证且经济有效的分类。


再次,本文比较了图片悲观度与文本悲观度的预测能力。发现图片悲观度与文本悲观度是相互替代的。此外,当图片抓人眼球而凸显时,图片会转移人们对文字的注意力。具体而言,在消极或积极图片情绪占绝对优势的时期,图片悲观度占主导地位。相比之下,在图片情绪中性或混合的时期,文本悲观度占主导地位。据本文所知,尚未有研究从新闻图片中获取投资者信念的有用和新颖的信息,以及这些信息如何与文本信息相互作用。


研究内容

本文用卷积神经网络法从大量新闻图片样本中构建投资者情绪指数。使用一个预训练的Google Inception (v3)模型,虽然该模型未经专门的情绪识别训练,但却包含大量图像领域的知识。为了定制模型来对图片的情绪进行分类,使用迁移学习(transfer learning,即向预训练模型提供一个额外的训练图片样本,这些图片带有情绪标记,用只包含消极和积极两类情绪的新图层取代原始模型的图层)。该模型考虑了图片的许多方面,包括物体、颜色和面部表情,以做出预测。在对模型进行训练后,根据测试样本来验证准确性。测试样本达到了87.1%的准确率。接下来,用该模型对《华尔街日报》图片进行投资者情绪预测。用这些情绪预测构建每日投资者情绪指数:图片悲观度(PhotoPes),即某日预测情绪为负面的图片的比例。本文研究图片来自《华尔街日报》2008.9-2020.9的在线文件。该来源图片使本文能专注于最广泛传播的新闻,这是已有研究认为可以在金融市场发挥重要作用的内容类型。


研究设计

(一)主检验:图片悲观度与市场收益预测

1. 图片悲观度预测市场收益反转

通过各种检验,本文表明图片悲观度具有代理投资者情绪的特征。首先,检验图片悲观度与美国主要股票指数和交易所交易基金(ETFs)的关系。行为模型预计,投资者情绪应预测市场收益反转。也即,当情绪高涨(低迷)时,非理性投资者将增加(减少)资产需求,推动价格上涨(下跌),远离基本面。由于套利限制,错误定价不会立即纠正。然而,随着时间推移,理性投资者将利用错误定价,导致价格回到基本面水平。本文发现,图片悲观度与次日市场收益负相关,与剩余交易周的市场收益正相关。这种反转突出表明,本文度量指标对收益产生了非信息影响。从图片悲观度与次日市场收益间的关系大小看,图片悲观度一个标准差变化对CRSP价值加权指数的平均影响为4.2个基点。利用图片悲观度及文本悲观度的反转模式的交易策略可以获得5.45%的年度五因子alpha,结果具有统计和经济意义。


2. 图片悲观度与文本悲观度的预测替代作用

其次,本文发现图片悲观度与文本悲观度(TextPes)显著相关,表明这两个变量捕获的信息存在一些共性。接下来,研究图片与文本中的悲观情绪如何相互作用。研究发现,图片与文本中的悲观情绪相互替代。此外,当图片凸显时,图片会从文本中吸引注意力。


(二)机制检验:图片悲观度代理了投资者情绪

1. 何种情绪最易通过图片传播:恐慌情绪

考察何种信息能通过图片在金融市场上更有效地传播。研究发现,在高度恐惧时期,图片悲观度系数比基准时期高出两倍以上,而文本悲观度的系数基本不变。该证据与图片比文字更有效地传达创伤性信息是一致的(Chemtob et al.,1999)。在高度恐惧时期,图片悲观度对市场收益的影响最显著:恐惧期,图片悲观度的一个标准差变化会导致价值加权指数变化10.3个基点。


2. 对何种股票影响最大:最难套利股票

进一步验证若图片悲观度代理了投资者情绪,应该对难以套利的股票有更大的影响。由于套利成本最高的股票对投资者情绪冲击最敏感(Baker and Wurgler, 2006),本文基于公司特质波动率和规模大小构建组合,发现图片悲观度对最高特质波动率和最小公司组合的收益影响最大。就量级而言,图片悲观度一个标准差变化对最高特质波动率的价值加权五分位组合的平均影响为7.1个基点。


3. 情绪作用机制:交易量

本文还做了额外检验,以更好地理解图片悲观度与市场收益相关的作用机制。研究发现,图片悲观度的高低可以预测次日异常交易量的增加(De Long et al.,1990)。该证据进一步证实了图片悲观度捕捉到了投资者的情绪。


(三)稳健性检验

本文进行了一系列稳健性检验。最值得注意的是,本文主要结果在不同的变量构造标准下是稳健的,甚至在控制了极端收益后。此外,图片悲观度产生了显著的样本外R平方。


结论

本文用机器学习技术从大量新闻媒体图片样本中提取信息,并将该信息转化为每日投资者情绪指数:图片悲观度。本文对文献有三个重要贡献:

  • 首先,证实图片悲观度可以预测市场收益反转。这种收益反转模式与情绪引起的短暂错误定价一致。该关系在难以套利的股票中最明显。此外,图片悲观度也可以预测市场交易量。

  • 其次,研究发现图片悲观度与文本悲观度在预测收益上的作用相互替代。此外,新闻图片中的悲观情绪在图片凸显时会吸收对文字的注意力。在恐慌加剧期,图片悲观度能更好地预测市场收益。

  • 再次,本文展示了尖端图片分类技术在金融市场大量新闻图片信息处理中的应用。依赖调查或众包网站来评估图片有缺点,这使得研究大量图片不可行。然而,随着人工智能技术发展,擅长分析图片的机器学习技术必然会越来越受欢迎,并不断改进。该项技术的发展能提高分析能力,将网上数十亿图片中的丰富信息用于研究金融核心的公司金融和资产定价问题。

在富媒体时代,未来的研究者应尝试推进图片分类的机器学习技术。这可以弥合图片与文本分类模型间的差距,更好地捕捉情绪,发掘新闻图片中的其他重要内容。


原文:

Obaid, Khaled, Kuntara Pukthuanthong, 2022, A Picture Is Worth A Thousand Words: Measuring Investor Sentiment By Combining Machine Learning And Photos From News, Journal of Financial Economics 144.


 

【长按二维码自动识别】查看摘要或原文



本文所属系列和领域(点击阅读)

系列:国际顶级前沿

领域资产定价机器学习



关于我们

微信公众号“金融学前沿论文速递”精选推送国内外金融学顶级期刊最新论文。欢迎转载。本号由上海财经大学讲席教授徐龙炳、陆蓉带领的“上财金融创新团队”负责。联系方式:FinanEx@163.com。

分类检索文献:点击标题下面蓝字“金融学前沿论文速递”,关注,进入公众号,页面下方按“系列”、“领域”或“期刊目录”分类检索。

“系列”包括:国际顶级前沿、国内顶级前沿、ESI高被引系列、趣文推荐系列、专题系列、平台及团队介绍、上财金融风采系列。

“领域”包括:资产定价、公司金融、行为金融、投资者行为、金融市场、金融中介、金融工具及其他。

“期刊目录”包括:JF、JFE、RFS、《经济研究》、《管理世界》《金融研究》等。

金融学前沿论文速递


金融学前沿论文速递
精选推送国内外最前沿的金融学论文。服务学术研究、投融资实务和政策决策,推动国内金融学研究快速与国际接轨。关注人数超过14万。本号由上海财经大学讲席教授徐龙炳、陆蓉带领的“上财金融创新团队”负责。
 最新文章