论文:行业投资的时序可预测性
Park J S, Newaz M K. Time-Series Predictability for Sector Investing[J]. Financial Analysts Journal, 2023, 79(3): 136-154.下载地址:
https://doi.org/10.1080/0015198X.2023.2208028
01 摘要
本研究识别了行业层面时间序列可预测性的指标。研究表明,投资者可以预期波动性更大的行业具有更高的可预测性。在发达市场中,价格下跌趋势、较低的交易量和较高的股息收益率表明了更强的可预测性。周期性和敏感性超级行业随着流动性的下降而变得更具可预测性。特别是在周期性超级行业,较小的市值和较大的期限利差也表明了可预测性,而基于这些指标的行业选择可以产生经济效益。
02 引言
在投资过程中,识别预期收益将超过市场整体水平的行业极为重要。投资者可能会进一步选择行业中的个别证券,但也可能简单地持有行业投资组合、基金或行业交易所交易基金。这种策略通常被称为“行业投资”,寻求的是被动指数投资和主动选股投资之间的平衡。行业投资不仅仅是选择最佳行业进行投资,还基于地理位置或商业周期对行业进行轮换。它需要进行行业分析,这包括许多方面,如检查基本面和行业环境。然而,投资者对特定行业未来股票回报的预测能力往往被忽视。
使用所有非价格公共信息得到的可预测性通常被称为“横截面可预测性”,其中财务比率,例如股息收益率和市盈率是最常被测试的因子。一些研究人员测试了预测因子的组合,以提取比单个预测因子更多的信息。然而,即使在更常见的横截面可预测性研究中,行业层面的可预测性也往往被忽视。然而,行业层面的可预测性可能比市场层面的可预测性更强,并且不同行业之间可能存在差异,也就是一些行业的可预测性比其他行业更高。原因可能是投资者在某些行业中获得了更有价值的定价信息,或者所拥有的信息和对信息的处理在不同行业之间是异质的。
行业层面的可预测性很重要,因为实际上投资者并不持有充分多样化的投资组合。家庭投资者倾向于持有针对少数行业的单一投资组合,这不仅是因为行为偏见,也是因为金融约束和有限的借贷机会。当共同基金相信某些行业将跑赢市场或基金拥有有关特定行业的优质信息时,它们也会持有集中于这些特定行业的投资组合。研究表明,投资者将从投资某些行业中大大受益,例如美国的科技和金融行业。
如果追求行业投资的投资者想要确定最能预测未来回报的行业,他们需要了解某些行业因子或特征是如何与行业层面的可预测性相关联的。例如,Westerlund和Narayand的研究表明,相对估值指标,如账面市值比,可以解释行业层面的可预测性。风险溢价也可以在行业层面有所变化,如使用Fama-French三因素模型和资本资产定价模型的研究所示。
本文的研究有三个主要目标。首先,我们调查是否存在时间序列可预测性,以及它是否在不同的行业和时间上会有所不同。接下来,我们检验哪些行业层面的特征可以表明时间序列可预测性的程度。注意,时间序列可预测性的指标与回报预测指标不同。时间序列可预测性指标表示通过过去和当前回报预测未来股票回报的程度,但回报预测指标试图预测未来的回报。最后,我们以可预测性和投资回报收益的形式评估时间序列可预测性对于投资管理,尤其是行业投资的经济意义。
许多研究没有考虑从可预测性中受益的投资者类型。投资者通常被假设能够获得大量公共信息,从而能够利用横截面可预测性。实际上,似乎很少有投资者能够利用这种可预测性,此外,某些类型的投资者可能需要并愿意追求时间序列可预测性而不是横截面可预测性。在这方面,我们的研究关注与理性投资者不同的投资者,他们不像理性投资者那样使用全部信息,我们将这些投资者称为“不太理性的投资者”,我们假设不太理性的投资者只使用过去的历史价格进行预测,并知道同时期的某些行业基本面信息以进行行业选择。此外,他们结合单变量模型的预测,并根据不断变化的市场环境更新他们的模型。采用不太理性的投资者的好处是,他们的预测模型的可预测性将趋于保守,不会因为有限的信息而被高估。此外,我们的发现可以推广到更理性或“有能力”的投资者。
本研究旨在为不太理性投资者的行业投资确定行业层面时间序列可预测性的指标。我们采用了两步方法,通过滚动窗口法测量每个行业的时序可预测性,然后通过面板回归模型识别时间序列可预测性的指标。我们探索了两个更大的维度——市场发展程度和超行业。一方面,新兴市场预计比发达市场更具可预测性,因为流动性较低,市场微观结构不够成熟,例如缺乏交易系统自动化、内幕交易法规和会计标准化。另一方面,它们更多地受到异质地方信息的指导,与全球市场的关联度较低,并且经常受到金融改革的影响。因此,新兴市场的可预测性可能比成熟市场更随时间变化。晨星将超级行业定义为周期性、防御性和敏感性,并根据其对商业周期的敏感性进行分类。随着市场在商业周期中的变化,回报的可预测性在各个超级行业中可能会有所不同。
03 方法
在本节中,我们讨论了如何测量时间序列可预测性,识别此类可预测性的指标,选择候选指标,并测试行业层面可预测性的经济意义。
3.1 测量时间序列可预测性
我们通过滚动窗口基础上不太理性的投资者的预测表现来衡量时间序列的可预测性。每个滚动窗口包含大约一年的交易数据,共250个交易日。窗口的前200个交易日是估计期,用于估计预测模型的参数。在这个阶段,使用历史数据来识别可能影响未来回报的因素。紧接着估计期的25个交易日是训练期,用于调整预测模型的权重。在训练期间,对不同的预测模型进行测试,并选择最佳的模型或模型组合。紧随训练期的25个交易日是评估期,用于评估预测模型的性能,在这个阶段,使用模型对实际发生的回报进行预测,并计算预测误差。在完成一个窗口的分析后,将窗口向前移动25天(大约一个月),然后重复估计期、训练期和评估期的过程。这个过程一直持续到数据集的末尾,从而产生一个时间序列的预测性度量。我们对每个样本行业和市场重复该过程,最终获得了每月可预测性的面板数据。
本文考虑了三种简单的预测模型:天真模型(Naive Model)、指数平滑模型(Exponential Smoothing Model)和自回归移动平均模型(ARMA Model)。这些模型仅基于过去的价格信息进行预测,不涉及其他复杂的金融指标。如果我们将它们的预测准确性作为可预测性来测量,可预测性水平应该是保守的,不会被高估。此外,这个水平可以被认为是更理性或“有能力”的投资者的最低可预测性水平。天真模型使用估计期内回报的历史平均值作为未来预测,它也作为计算预测性能的基准。简单的指数平滑模型预测未来回报为当前回报和最近预测的加权平均值,权重通过最小化 Schwarz 信息准则(SIC)来进行估计。最后,ARMA 模型使用回报的过去值以及同期和过去的误差来预测未来回报。具体来说,我们基于 SIC 选择最佳的AR和MA阶数,测试最多三个滞后。
三种模型的单一预测进一步合并为组合预测,已知组合预测的表现更好,变化性小于单一预测模型。我们使用六种组合方法,组合预测值为三个单一预测的加权平均值,其中wi是单一预测i的权重。第一种和第二种方法分别是平均值法和中位数法,分别计算三个预测的平均值和中位数,它们通常优于更复杂的方法。第三种方法是最小二乘法通过在训练期间最小化预测误差来确定组合权重wi。第四种方法是排名法由Aiolfi和Timmermann提出,评估训练期间单一预测的表现,并按表现排名qi计算wi:
Akaike(第五种)和贝叶斯(第六种)信息准则方法从信息准则(C)的值计算wi:
在每个滚动窗口中,相对于天真模型预测误差的最大减少量被衡量为时间序列可预测性(PD),PD表示所有单一和组合预测模型中的最佳预测准确性:
其中M是预测回报和实际回报的均方根误差,m是除天真模型(Mv)外的单一或组合预测模型。这种度量本质上类似于在候选预测模型中寻找具有最大的样本外R2的模型。
3.2 识别时间序列可预测性的指标
我们将每个行业生成的PD序列数据汇总为动态面板,然后识别行业层面时间序列可预测性的指标。技术上,我们估计滚动窗口的估计期内各个指标的值与滚动窗口的评估期的可预测性之间的关联。我们采用了两种动态面板模型:动态固定效应(FE)模型和动态共同相关效应(DCCE)模型。
第一个模型是带有PD自回归项的动态FE模型:
其中s是一个行业,α是一个截面固定效应,x是一个可预测性指标,β是它的系数,γ是滞后PD的系数向量,ϵ是误差项。
我们添加了PD的八个滞后值,以考虑由滚动窗口法中的重叠估计期可能引起的自相关。每个滚动窗口s中的指标值,为相应估计期内的平均值。我们单独测试每个指标,这是研究回报预测指标的常见方法。
DCCE模型通过包括同期和滞后横截面平均值,进一步解释了横截面之间未观察到的共同因素,这可能产生横截面依赖性。DCCE模型公式如下:
其中: ,
3.3 选择候选指标
本文参考了大量的学术研究,特别是关于横截面可预测性的研究,以确定哪些变量可能影响时间序列可预测性。选择的指标通常与股票的基本面、市场估值和交易活动相关,这些因素在理论上被认为会影响股票回报的可预测性。本文选择了以下几类指标作为候选指标:
(1)价格和交易相关指标:包括价格下跌趋势、波动率、交易量、市值、流动性和超额回报
(2)相对估值指标:股息收益率、市盈率和市净率
(3)公司基本面指标:净资产收益率
(4)宏观经济指标:商业周期、短期利率和期限利差
3.4 测试经济意义
了解行业层面可预测性的指标可以帮助投资者做出决策,但证明这确实能提供经济意义是至关重要的。本研究首先调查基于这些指标识别的行业是否比其他行业提供更强的时间序列可预测性,无论是在样本内还是样本外期间。此外,更强的可预测性最终需要为投资者带来更强的经济利益。因此,我们还检验了基于我们的指标构建的交易策略是否容易实现经济意义。一个常见的框架是比较交易策略的回报与买入持有基准策略的回报,当然,当投资者知道行业层面可预测性较强的指标时,他们也可以采用许多交易策略。作为演示,我们测试了一些简单的基于时间序列的策略:如果这些简单的策略能够胜过基准策略,更有能力的投资者可能会用复杂的策略做得更好。
我们假设投资者知道他们需要根据本文中识别的指标选择哪些行业。他们的投资基于滚动窗口,在每个滚动窗口的估计期之后,投资者选择每个指标中排名10的行业——例如,在周期性超级行业中流动性最差的前10个行业,投资者持有这些行业的股票组合,跨越评估期(25个交易日),将选定行业的投资回报与市场整体的买入持有策略进行比较,以评估超额回报。
投资者的交易策略如下。第一种交易策略是,投资者找到在前一个滚动窗口中预测效果最好的模型,并根据其对当前评估期的预测来做多或做空股票。他们只在选定的前10 个行业进行交易,期望预测模型在这些行业中表现更好。第二种交易策略是投资者采用天真预测模型,根据估计窗口内的平均历史收益来做多或做空股票。同样,投资者期望这些行业具有更高的可预测性,因此交易了前10个行业,并天真地相信在这10个行业里,可预测性将转化为盈利能力,因此只需购买并持有这些行业即可。最后一种方法是行业投资中的买入持有策略,前两种策略是带有预测元素的买入持有策略的变体。
04 数据
样本数据涵盖1999年1月2日至2022年6月30日期间47个国际股票市场(见表1)。
对于每个市场,使用1个全市场指数和11个行业指数。每个回报系列的每日观测数为6310 个,总计3273203个。每个日回报序列最终通过滚动窗口方法转换为可预测性序列。每个行业和市场的窗口数量为236个,总数为84692个。每个系列中的前185个窗口(截至2016年9月22日)用作样本内周期(IS),以估计时间序列可预测性指标模型。然后,2016年9月23日至2022年6月30日之间剩余的50个窗口被用作样本外期间(OOS),它们被等分为COVID-19大流行前样本外时期(OOS1)和COVID-19大流行时期(OOS2)。期间 OOS1 和 OOS2 按世界卫生组织宣布公共卫生紧急状态的日期划分:2020年1月31日。本文股票价格的主要数据来源是Thomson Datastream全球股票指数,该指数为国际股票指数的比较研究提供了标准化方法。相应的财务和会计变量来自Datastream Worldscope和 Eikon。
行业分类遵循行业分类基准:能源(ENEG)、基础材料(BMAT)、工业(INDU)、消费自由选择(CODI)、消费必需品(COST)、电信(TELC)、技术(TECN)、金融(FINA)、公用事业(UTIL)、医疗保健(HLTH)和房地产(RLES)。行业部门进一步被分类为三个超级行业:(1)周期性,包含BMAT、CODI、FINA和RLES;(2)敏感性,包含ENEG、INDU、TELC和TECN;以及(3)防御性,包含COST、UTIL和HLTH。周期性超级行业在跟随商业周期和具有高Beta风险方面最具周期性,敏感性超级行业与商业周期有中等程度的关联,防御性超级行业是逆周期的,以低Beta风险为特征,因为股票价格通常不受经济波动的影响。防御性超级行业中的公司在经济衰退期间以及商业周期的其他时期都会产生收入,因此表现出低波动性。
使用 MSCI 国家分类标准,本文还根据市场发展程度将样本行业分类为三个子组,即发达(DEV)、新兴(EMG)和前沿(FRT)。前沿市场只包括在全样本分析中,而不包括在子样本分析中,因为它们的样本量小。
可预测性指标按每个滚动窗口估计期内的平均值计量。具体而言,一般风险水平是通过回报的标准差来衡量的。市值由所有指数成分股的普通股总价值表示,单位为百万美元。美元交易量或成交量(TV)是交易的股票数量乘以收盘价的总和,单位为千美元。非流动性(IL)是根据Amihud的非流动性指标来衡量的:绝对回报除以美元交易量加1。股票表现(PF)是由股票指数收益率减去无风险利率。DY、P/E、ROE和B/P由成分股的市场价值加权。根据国家经济研究局的商业周期日期,商业周期(BC)指标的扩张值为1,收缩值为0。无风险利率的短期利率由短期(3个月)政府债券收益率代表。对于没有这些数据的国家,本文采用下一个最短期限的政府债券收益率(1年或2年)。期限利差(TS)是长期(10年期)政府债券和RF之间的收益率差距。这些指标的相关性在表2中展示,数据在1%和99%处进行缩尾处理,以减少异常值的影响,并在回归前进行标准化处理。
05 结果和讨论
时间序列可预测性存在于所有测试部门约14%的滚动窗口中(表3,面板A)。测量的可预测性(PD)的平均值约为0.013(1.3%),这基本上量化了不太理性投资者相对于天真预测的预测性能(表3,面板B)。
在行业间观察到一定程度的时间序列可预测性的横截面变化(如表3的面板A和B所示)。例如,周期性超级行业比其他超级行业更具可预测性。金融、房地产、工业和技术行业表现出更高的可预测性。从表3的面板B可以看出,新兴市场和前沿市场比发达市场更具可预测性。表3的面板C清楚地表明,与扩张期(BC = 1)相比,经济衰退期(BC = 0)的时间序列可预测性更强。周期性超级行业在商业周期中的变化比其他超级行业更大,它们的可预测性也可能具有周期性。
表4总结了影响所有行业和市场时间序列可预测性的指标。显然,动态FE结果倾向于夸大可预测性指标的显著性。因此,我们更关注DCCE的结果,因为在动态结构和横截面依赖性下它们的估计值是无偏的。在DCCE结果中,流动性(IL)、价格下跌趋势和表现(NT和PF)显著影响时间序列可预测性。与相对估值、营业绩效和宏观经济相关的指标在行业或市场层面均未显示出显著性。
首先,流动性与行业层面的时间序列可预测性呈正相关。一方面,这一发现验证了早期的发现,即流动性较差的行业阻碍了套利者,从而具有更高的可预测性。因此,不太理性的投资者可以从他们的预测方法中获得更多的收益。另一方面,这种正相关关系可能部分反映了股票收益率与流动性溢价之间的横截面联系。众所周知,投资者要求持有流动性较差的股票的溢价,如果流动性溢价随时间变化,它可能会随后影响时间序列可预测性。
其次,行业股票表现(PF)与时间序列可预测性在市场层面有强烈的负相关关系,股票市场表现越强(弱),其可预测性越低(高),价格下跌趋势的市场(NT)甚至具有更高的可预测性。这一发现意味着在表现不佳的市场中,不太理性投资者的预测将更加准确。这一证据与商业周期和市场可预测性之间的宏观经济层面联系一致。股票市场在经济衰退期间更可预测,但在经济扩张期间则不那么可预测,原因可能是投资者在经济衰退时要求更高的溢价增加了可预测性。
第三,与公司基本面相关的指标,如股息收益率和经营业绩,与时间序列可预测性没有显著关联。尽管基本面是股票定价模型中重要的理论构建块,但它们对股票回报的预测能力尚无定论,它与时间序列可预测性的联系可能同样薄弱。最后,尽管股票的相对估值指标,如市盈率和账面价值比,作为回报预测指标具有预测能力,但它们与时间序列可预测性没有关联。
与DCCE模型不同,FE模型夸大了指标的显著性。这可能是由于FE模型在忽略横截面依赖性和动态模型中引起偏差的局限性,这些指标包括波动性、交易量和市值,商业周期指标(BC)仅在FE模型中显著,尽管其符号和显著性与先前研究一致,但FE和DCCE模型结果在估计系数的符号方面并无本质不同。因此,那些在DCCE结果中不显著的指标值得进一步通过子样本分析进行研究,即在每个子样本内计算它们的横截面平均值。
第一个子样本分析比较了发达市场和新兴市场的行业部门,如表5左面板所示。第一个区别是波动性在两个市场中都显著正相关,这与全样本结果(如表4所示)不同,说明不太理性投资者的预测性能在波动性更大的行业中更强。当较高的估计不确定性导致整体定价过低并且随后的修正随着时间的推移产生可预测性时,就会出现这种相当不直观的结果。因此,即使是不太理性的投资者也可以从容易发现的模式中受益。第二个区别是流动性在两个市场中都失去了显著性。众所周知,新兴市场的流动性不足和流动性溢价较大(Amihud 等人,2015 年),结构性风险也较高(Donadelli 和 Persha,2014 年),但它们可能与时间序列的可预测性无关。行业层面的股票表现(PF)在两个市场中都保持着同样显著的负面效应。
发达市场和新兴市场之间的一个显著区别是,较大的交易量仅会降低发达市场的时间序列可预测性。交易量可能反映了市场中的过多噪音,从而降低了可预测性。然而,发达市场的投资者可能更有能力,因此他们的交易提高了市场效率,同时降低了可预测性。同样,子样本分析可以揭示哪一个具体指标在两类市场之间更占主导地位。例如,发达市场中的行业随着价格下降趋势(NT)或更高的股息收益率(DY)而变得更加可预测。因此,不太理性的投资者在发达市场应该寻找有关价格和股息的信息。商业周期、短期利率和期限利差等宏观经济因素在发达市场和新兴市场之间没有表现出任何差异,都是不显著的。这一发现与早期关于回报预测因子的研究结果并不相符,我们的结果表明可预测性指标的表现与回报预测指标不同。
第二个子样本分析分别检验了三个超级行业:周期性、敏感性和防御性,如表5右面板所示。在所有三个超级行业中,波动性(SD)仍然与全样本一样密切相关。然而,每个超级行业都有独特的指标。首先,周期性超级行业与最多数量的指标相关:NT、SD、MC、IL和TS。周期性超级行业对商业周期的高度敏感可能是这些指标显著性的原因,如果这些指标共享这种敏感性,可能会增加回报可预测性。然而,与商业周期指标的直接联系在这里并不像全样本结果那样明显。其次,敏感性超级行业有三个已识别的指标—SD、IL和PF,防御性超级行业只有一个—SD。这一发现表明,波动性是超级行业可预测性的普遍指标,而其他指标可能在一定程度上与商业周期有关。
总之,更强的时间序列可预测性可以通过特定行业中的八个指标找到:
(1)价格下跌趋势,特别是在发达市场和周期性超级行业;
(2)更高的波动性;
(3)更高的流动性,特别是在周期性和敏感性超级行业;
(4)在敏感性超级行业,较低的股价表现;
(5)在发达市场中,较小的交易量;
(6)在周期性超级行业,较小的市值;
(7)在发达市场中,较高的股息收益率;
(8)在周期性超级行业,较大的期限利差。
表6总结了基于每个识别指标选择的八个行业组与其余行业相比在可预测性方面的净增长。显然,选定的行业确实提供了比其他行业更高的可预测性,尽管可预测性增长的绝对大小不大。增长不仅是样本内期间(IS)正的,而且在两个样本外期间(OOS1和OOS2)也是正的。COVID-19大流行对可预测性的影响并不明显。
因此,可以设计交易策略来从更强的可预测性中获得经济意义——例如,更高的回报。表7展示了当基于研究中确定的六个指标构建行业投资交易策略时,行业投资的回报净增长。我们排除了两个指标,NT和PF,因为它们直接与行业股价表现相关,因此在计算行业层面回报的增长时并不理想。具体来说,我们测试了三种交易策略:最佳预测模型策略(BST)、动量策略(MOM)和简单的行业买入持有策略(B&H)。
结果以非选定行业的净收益(左面板)和市场买入并持有策略的净收益(右面板)来总结。表7显示,回报增长仅限于某些指标和交易策略。例如,当在具有较大市值、较高流动性和较大期限利差的行业中测试时,B&H策略一致地产生了较高的回报增长。这些行业的可盈利交易策略的回报增长幅度平均约为每25个交易日0.6%。MOM策略在高流动性行业中也是有利可图的,这些增长没有受到COVID-19大流行的影响(OOS2)。我们假设采用市场买入持有策略和三种测试交易策略的交易成本对于相同金额的投资是相似的,因为这些测试策略也是行业层面的买入持有方法。然而,需要一定时间序列预测技能的BST策略并没有胜过市场。这一发现意味着任何其他更复杂的策略,它们需要比B&H和MOM策略更复杂的预测或更频繁的交易,可能会发现很难产生足够的收益,因为它们的交易成本可能会更高。
06 结论
本研究确定了行业层面时间序列可预测性的指标。具体关键发现如下:时间序列可预测性在不同行业之间有所不同,并与行业层面的可预测性指标相关。投资者可以通过仔细选择基于特定指标的行业来获得更强的时间序列可预测性。例如,在发达市场中,他们可以选择价格下跌趋势、交易量较低和股息收益率较高的行业。如果要投资于周期性或敏感性超级行业,流动性高度不足的行业或股价表现不佳的行业是不错的投资选择,因为它们具有更高的可预测性。对于周期性超级行业,投资者还可以选择在期限利差较大的市场中的小行业板块。波动性较大的行业通常有更高的可预测性。使用选定的指标,投资者即使在包括COVID-19大流行期间的样本外期间,也能获得可预测性的增长,投资者们还可以通过遵循某些指标和使用简单的交易策略获得回报的增长。
如果有好的建议,请留言给我们。
"大于研究"是华南理工大学经济与金融学院、金融工程研究中心于老师和学生对外分享研究成果和学习的心得的公众号。
对我们的研究感兴趣的可以联系fofscut@scut.edu.cn