中金研究
近期我们观察到部分主流价量因子效果有所波动,而使用新闻数据构建的行业配置模型有效性不断持续,在2023年8月底报告发布以来,多头行业组合相对中信一级行业等权的超额收益率达17.4%,最近12个月超额收益率也达到12.5%。我们认为新闻数据的有效和传统因子的波动一定程度上受到长短期双重因素影响:长期新媒体持续发展提升信息传导效率,短期个人投资者参与占比提升明显,以及以上因素的相互作用。
Abstract
摘要
部分主流因子表现发生波动,新闻数据行业配置有效性持续
我们去年在另类数据策略系列报告中推出的新闻情感因子在行业配置任务中有效性较强,近期样本外跟踪发现样本内效果仍可以稳定延续至样本外。自2023年8月底报告发布以来多头行业组合相对中信一级行业等权的超额收益率达17.4%,最近12个月超额收益率也达到12.5%。尤其是在今年2月和10月份A股市场发生较大波动的环境下仍能产生稳定甚至更高超额收益。我们发现新闻因子的前瞻性较强,换仓时点准确。如今年3月由于“以旧换新”政策将家电调至多头首位,9、10月将计算机通信调入持仓,获得较大多头超额。
同时我们也观察到近期主流价量因子波动较大。以经典的动量反转因子为例,BARRA动量因子的IC序列在2024年以来表现波动,多头的超额收益也一度在10月份发生回撤。我们自己构建被证明长期有效的价量因子中,除了低流动性因子以外,其他因子的有效性在此期间均有显著波动,且超额收益发生明显回撤。现有的经典价量因子的有效性来源于A股市场长期以来形成的交易模式,而因子失效背后受多重因素的共同作用。我们认为这些变化主要与投资者结构改变和新媒体的迅速发展提高信息传导效率较为相关,且与市场波动加剧也有一定关联。
个人投资者参与占比短期提升明显,新媒体长期发展提升信息传导效率
我们认为不管是新闻因子持续有效还是主流因子短期波动,都会受到长短期双重因素影响:短期个人投资者参与占比受情绪催化明显提升,长期新媒体持续发展提升信息传导效率,以及他们的相互作用。
短期来看,A股今年9月到10月的大幅波动结合自媒体对信息的催化作用吸引了大量个人投资者参与,个人投资者占比快速跳升。我们使用A股的日内高频交易数据,通过傅里叶变换拆解成交信号构造个人投资者交易热度指数,发现10月初的个人投资者交易热度明显升高,这一变化与A股账户新增开户数量变化趋势基本一致。
而长期来看,A股市场个人投资者在过去仅能从机构研究报告、官方新闻媒体等渠道单向获取信息,随着新媒体的快速发展,逐渐转变为从抖音、小红书等各类新媒体直接获取信息甚至产生信息,这一变化将较大程度提高信息在个人投资者之间的传导效率。当每个人都可以在快速便捷地发布更多类似信息时,信息共振效果会不断增强,从而更容易形成某一共识,进而提高资产定价的能力,当该资产流动性偏低时这一现象会尤其明显。这与之前大部分投资者只能作为信息的接收者而非发出方有本质的区别。近年来已有多篇学术论文深入探讨新媒体对于金融市场信息传导效率的提高作用,我们将结合2021年的GME大涨事件来进一步详细说明新媒体的发展对股票市场的影响。
总体来说,我们认为新媒体长期发展带来的金融市场信息共振的影响将会持续存在,新闻等充分利用此类信息的另类数据或将因此受益,其有效性仍有较大概率保持。但由于投资者结构短期变化带来的主流因子波动的影响可能较难持续,我们对其长期的有效性仍持乐观态度。
风险提示:模型基于历史数据构建,未来可能存在失效风险;全文模型结果较大程度基于数据来源的稳定性,当数据来源发生变化或原始数据处理方法变更可能对模型表现有影响;本文提到的所有量化模型仅在特定的测试框架下可以达到文中展示的测试效果,测试框架改变可能对模型表现有一定影响。
Text
正文
部分主流因子表现发生波动、另类数据有效性持续
另类数据有效性持续
新闻数据应用在量化策略中的固有问题
在去年8月份的《另类数据策略(2):如何优化新闻文本因子》中我们提出,新闻数据用于量化策略有着其固有的诸多问题,如新闻冗余程度较高,信噪比较低等。针对这些问题我们使用标签筛选的方法确定了基于ChinaScope新闻数据的新闻筛选标准。在使用多个标签对新闻提出筛选后新闻信噪比大大提升,有效性也显著增强。
图表1:新闻数据应用于投资的优缺点
资料来源:中金公司研究部
新闻数据优化后的行业配置模型有效性显著
做完筛选和聚合后的行业因子得分落到行业层面时,有效性较为显著。自2023年8月底报告发布以来多头行业组合相对中信一级行业等权的超额收益率达17.4%,最近12个月超额收益率也达到12.5%。尤其是在2024年2月和10月份A股市场发生较大波动的环境下仍能产生稳定甚至更高超额收益。
图表2:新闻情感得分行业配置策略超额基准持续稳定升高
资料来源:ChinaScope,Wind,中金公司研究部
图表3:新闻情感得分行业配置策略样本外实际配置情况
注:公用事业即中信一级电力及公用事业行业;统计区间2023/09/01-2024/11/29;2024年12月由于没有完整月度涨跌幅数据,因此仅展示持仓
资料来源:ChinaScope,Wind,中金公司研究部
新闻配置行业的关键时点切换及归因分析
从上节新闻情感因子的行业配置可以看出,在2023年8月至2024年8月的多头持仓以煤炭、石油石化等红利风格为主,而这个阶段也是价值长期跑赢成长的阶段。计算机和通信这种高成长风格的行业样本外被选择的次数相对较少,其中计算机在2024年9月模型首次推荐,而当月成长大幅跑赢价值指数,且模型及时调出偏价值的煤炭行业,计算机、通信行业在2024年9月、10月相对行业等权的超额收益均超过10%,计算机超过20%。
图表4:成长价值风格收益及持仓择时判断
注:统计区间2023/08/01-2024/11/29
资料来源:Wind,中金公司研究部
图表5:中信计算机一级行业月度收盘价及超额
注:统计区间2023/08/01-2024/11/29
资料来源:Wind,中金公司研究部
我们再从底层新闻数据试举一例说明为何模型会有这样的选择。使用百度搜索可以得到,关于家电“以旧换新”的政策反响的高点在今年3月份,当时国务院发出了“关于印发《推动大规模设备更新和消费品以旧换新行动方案》的通知”[1],通知提出:“推动大规模设备更新和消费品以旧换新是加快构建新发展格局、推动高质量发展的重要举措,将有力促进投资和消费,既利当前、更利长远”。在通知发出后,各大媒体纷纷转载评论,此举也被视为政府刺激国内消费的重要举措。
而其实在更早的2月23号中央财经委员会第四次会议[2]里,习近平主席就提到 “推动新一轮大规模设备更新和消费品以旧换新 有效降低全社会物流成本”。新闻数据则更敏锐在2024年2月末捕捉到了“以旧换新”政策将整体利好家电消费,模型则在2024年2月底将家电得分打到全行业最高值,并且接下来的2024年3月、4月和5月连续三月家电的舆情得分持续名列中信一级行业新闻得分首位。以下是2024年2月底“以旧换新”政策被提出后主流媒体对此发布的新闻记录,情感倾向明显偏向正面,显示出对政策发力的期待和认可。
图表6:2024年2月底与家电以旧换新相关新闻成为热点
注:情感倾向中1为正向、2为负向、0为中性倾向;得分权重代表该新闻的置信程度
资料来源:ChinaScope,Wind,中金公司研究部
主流价量因子表现近期发生波动
2024年9月以来,我们观察到近期主流价量因子多头失效较为明显。下图统计了常见BARRA风格因子的有效性和多头收益的变化,可以看到除了市值(SIZE)与反转(MOMENTUM)因子以外,其余风格因子的有效性均出现不同程度减弱,累计IC序列向因子相反方向变化。其中失效较为显著的包括低波动率(VOLATILITY)、盈利(EARNINGS)和BETA因子,随市场风格明显切换,多头超额表现有所回撤。
图表7:常见风格因子历史有效性累计IC序列
注:BARRA因子根据构建方式使用Wind数据复现且需要全大写;统计区间2019/01/01-2024/11/29
资料来源:Wind,中金公司研究部
除了BARRA因子以外,我们在《量化多因子系列(7):价量因子手册》构建的部分过往表现较好的价量因子同样在2024年9月以后出现明显回撤。除了低流动性因子以外,其他因子的有效性均有显著波动,且超额收益发生明显回撤,尤其是低波动和动量因子,其指标底层逻辑均在市场反弹期间失效。由于主流价量因子的回撤,量化策略本身表现同样承压。2024年9月底市场快速反弹行情以来,风格快速切换,量化指增策略的超额出现回撤,也是由于策略本身高度依赖于主流因子的有效性。
图表8:量化策略产品2024年整体表现波折,9月以来回撤明显
注:公募指增平均表现为规模加权收益率累乘净值;统计区间2019/01/01-2024/11/29
资料来源:Wind,中金公司研究部
现有的经典价量因子的有效性来源于A股市场长期以来的交易模式,而因子失效背后受多重因素的共同作用:1)首先,投资者结构的变化使得个人投资者的定价权有所上升,投资偏好发生变化,因此市场情绪维度的信息重要性上升;2)宏观不确定性的增加可能导致了市场对某些因子的短期偏好改变;3)高波动性市场往往伴随着更高的风险和不确定性,这可能导致一些基于历史数据和趋势的因子投资策略暂时失效,尤其是偏基本面和防御类的因子;4)此外,随着因子投资策略的普及,一些因子可能因为过度拥挤而失效,阶段性有效的因子需要叠加一定因子择时判断进行使用。
图表9:因子失效可能受多重因素的共同作用
资料来源:中金公司研究部
短期来看,我们认为2024年10月的因子失效主要由第一点,即投资者结构变化所引起,且市场大幅反弹及波动加剧也是因子失效的部分原因。在下一章我们将讨论如何利用日内高频数据设计指标表征投资者结构变化,并结合海外例子分析投资者结构的变化会对A股市场带来何种影响。
个人投资者参与度指标持续走高,新媒体催化交易热情
使用高频指标计算个人投资者参与度
不论是新闻数据的持续有效,还是传统因子的短期波动,我们认为都和A股投资者结构的变化息息相关。为了表征我们在《资金结构系列(2)如何利用日内交易数据左侧预警机构成交拥挤度》中使用傅里叶变换拆解出不同频率的成交信号,将周期性较强的信号占比认为是机构成交信号。同理我们也可以将周期性较弱的信号拆解为个人投资者成交信号,计算其占比。
图表10:傅里叶变换拆解转换不同频率的信号
资料来源:中金公司研究部
我们再从个股维度,根据宽基指数的成分股和权重数据,将个股的个人投资者占比指标加权聚合到指数维度,从而判断宽基指数的个人投资者成交占比。我们观察到中小盘股中低频成交占比信号2024年10月有较为显著的变化,这一变化与A股账户新增开户数量变化趋势基本一致。从以上两个指标可以同步看出,2024年9月到10月个人投资者占比快速提升,达到2018年以来的区间高点,显示出较高涨的交易热情。
图表11:低频成交占比月均数据和A股月度账户新增开户数量变化趋势基本一致
注:统计区间2018/01/01-2024/11/29
资料来源:Wind,中金公司研究部
新媒体催化个人投资者交易热情
我们认为A股近期个人投资者热度的提高主要因素可能来自近期新媒体对于A股信息的传播能力逐渐增强,尤其是一些知名度较高的金融财经类博主。这种影响力导致A股市场共识的形成速度和群体范围发生了显著变化,个人投资者或游资的定价能力也随之增强。新媒体平台如微博、抖音、快手等,因其实时性和广泛的用户基础,能够迅速传播市场信息,激发投资者情绪,放大市场反应。这种传播的实时性有助于快速形成市场共识,尤其是在重大政策出台或市场异动时,新媒体上的讨论声量会快速升高。
近几年学界关于新媒体如何提高金融市场的信息传导效率也有较多研究。Ferah(2023) [3]文献综述了社交媒体在金融领域的使用情况,发现社交媒体使金融新闻传播更快,提高了投资者获取信息的效率,并可以进一步影响投资者投资决策。Jinhan等(2024) [4]探讨了社交媒体如何成为资本市场中的重要信息源和关键沟通渠道,并确认了社交媒体平台上的信息源可信度可以影响信息效率。研究表明,社交媒体的互动和动态特性被现有文献忽视,未能探索投资者-公司在线互动与股票价格信息效率之间的关系。2021年美股GME大涨事件也很好地说明了个股投资者力量崛起对金融市场信息传导的深远影响。
图表12:GME事件时间线及社媒影响
资料来源:ChinaScope,中金公司研究部
我们认为不管是新闻因子持续的有效性还是主流因子的短期波动,都与A股投资者结构和信息传导模式息息相关。新闻数据的有效和传统因子的波动一定程度上受到长短期双重因素影响:短期个人投资者参与占比提升明显,长期新媒体持续发展提升信息传导效率,以及他们的相互作用。
图表13:新媒体发展使得信息传播效率提高
资料来源:中金公司研究部
A股市场个人投资者在过去仅能从机构研究报告、官方新闻媒体等渠道单向获取信息,随着新媒体的快速发展,逐渐转变为从抖音、小红书等各类新媒体直接获取信息,这一变化将较大程度提高信息传导至个人投资者的效率。当个人投资者信息传导效率较高,而每个人又可以通过自媒体在熟悉的社区发布更多类似信息时,信息共振会不断增强,从而更容易形成某一共识,进而提高资产定价的能力,当该资产流动性较差时这一现象会尤其明显。这与之前大部分投资者只能作为信息的接收者而非发出方有本质的区别。
总的来说我们认为新媒体长期发展带来的金融市场信息共振的影响将会持续存在,新闻等充分利用此类信息的另类数据或将因此受益,其有效性仍有较大概率保持。但由于投资者结构短期变化带来的主流因子波动的影响可能较难持续,我们对其长期的有效性仍持乐观态度。
[1]https://www.gov.cn/zhengce/content/202403/content_6939232.htm
[2]https://www.gov.cn/yaowen/liebiao/202402/content_6933834.htm
[3]Ferah, G., Sumer, S.I., (2023). A literature review on social media in finance. PressAcademia Procedia (PAP), 17, 149-152.
[4]Jinhan Shu, 2024,Social media, investor‒firm interactions and informational efficiency of stock prices: Evidence from China. Finance Research Letters, Volume 69.
Source
文章来源
本文摘自:2024年12月26日已经发布的《另类数据策略(4):近期新闻数据为何持续有效?》
分析员 郑文才 SAC 执业证书编号:S0080523110003 SFC CE Ref:BTF578
分析员 陈宜筠 SAC 执业证书编号:S0080524080004 SFC CE Ref:BTZ190
分析员 周萧潇 SAC 执业证书编号:S0080521010006 SFC CE Ref:BRA090
分析员 胡骥聪 SAC 执业证书编号:S0080521010007 SFC CE Ref:BRF083
分析员 刘均伟 SAC 执业证书编号:S0080520120002 SFC CE Ref:BQR365
Legal Disclaimer
法律声明