如果在式(2)中,我们将信息量改写为股票和债券收益的平均 Z 值平方,并用式 (1)代替单期相关性,那么相关性就变成了:
式(3)简化为股票和债券 z 分数在完整样本上的平均乘积,相当于股票和债券收益的全样本协方差除以其全样本标准差的乘积,该式通常用于度量时间序列相关性。 在这一点上,本文已经证明了单期相关性比月收益率的相关性更能代表五年期收益的相关性;它捕捉了股票和债券收益的漂移,而月度收益的相关性则没有。它也优于独立的五年收益率或重叠的五年收益率的相关性,因为它捕捉了股票-债券相关性的时变性质,而全样本相关性则没有。 04 基本预测因子本文认为,长期股票和债券收益率的相关性反映了影响股票和债券收益率逐步漂移的基本因素。我们定义了四个基本预测因子来预测五年期股票和债券收益的相关性,如下:
经济增长(工业生产的同比百分比变化)
通货膨胀(居民消费价格指数的同比百分比变化)
股票和债券的相对收益率(股票的盈利收益率(即市盈率的倒数)的自然对数与10年期国债收益率的自然对数进行比较来衡量的,数据从Robert J. Shiller’s网站获得)
股票和债券收益率的相对波动率(过去五年股票盈利收益率的波动性与10年期国债收益率波动性的自然对数比较来衡量的,数据从the Federal Reserve Bank of St. Louis获得)
之所以选择经济增长和通货膨胀,是因为它们分别是股票和债券收益的关键驱动因素,它们之间的相互作用可能会影响股票与债券的相关性。例如,积极的需求冲击将增加增长和通胀,这可能会导致股票和债券表现的背离。相比之下,1970年代的石油危机等供给侧冲击可能导致通胀上升,但经济增长放缓,这可能会将股票和债券价格推向同一方向。我们还选择股票和债券收益率的相对水平和波动性,因为它们可能会影响投资者对股票与债券的需求。例如,当股票和债券收益率相似时,两种资产都具有相似的吸引力,这意味着股票与债券之间存在正相关性。然而,当股票收益率明显高于债券收益率或风险更大时,我们可能会预期股票与债券之间存在负相关性。 05 模型设定本文将感兴趣的变量定义为随后的五年单期相关性,因为正如本文所讨论的,本文认为投资者更关心股票和债券在整个投资期限内如何共同移动,而不是它们每月如何移动。我们测试了五个模型来预测随后的五年的单期相关性。在所有情况下,我们都使用从1926年1月开始的数据来预测从1930年1月到2018年12月的五年单期相关性,并且我们每年更新预测。在讨论基于回归的模型(下面的模型2到5)之前,本文转换因变量以防止模型预测违反负相关和正相关的界限。首先,我们移动并重新调整单期相关性,使其范围从0到1: 是经过移位和重新缩放的单期相关性,范围从 0 到 1。然后,我们对其进行 probit 变换,使其成为无约束的正态分布。 在式(6)中,y 是移位和重新缩放的相关性 的概率,估计为标准正态分布的累积分布函数与概率 的倒数。进行回归后,我们将生成的预测转换回来,使它们的相关性范围从负到正: 在该方程中, 是从负向正的预测单期相关性, 是移位和重新缩放的相关性的预测概率, 表示标准正态分布的累积分布函数。接着,我们依次讨论5个模型:模型1:简单外推(naïve extrapolation of trailing correlation)。该模型只是推断前五年的月度股票和债券收益率的相关性,以预测下一个五年的单期相关性。这种方法不仅是对股票-债券相关性进行建模的最简单方法,也是迄今为止最常用的方法。模型2:基于滞后相关性的回归(regression on trailing correlation)。在这个模型中,我们将转换后的五年期单期相关性与前一个五年期的月度股票和债券收益的相关性进行回归分析。这种方法与简单外推不同,因为截距和斜率将不同于0和1。模型3:基于基本因子的回归(regression on fundamental factors)。在这个模型中,我们回归了四个基本因子的转换后的五年单期相关性:工业生产、通货膨胀、股票和债券的相对收益率,以及股票和债券收益率的相对波动性。预测变量是在估计单期相关性之前的时期结束时测量的。模型4:基于相关性过滤的基本因子回归(regression on fundamental factors filtered for relevance)。在此模型中,我们使用与模型3相同的预测因子,但我们基于一种称为部分样本回归的技术,过滤历史观测值的相关性。部分样本回归依赖于数学等价。线性回归的预测是因变量过去值的加权平均值的函数,其中权重是过去观测值与自变量的相关性。在这种情况下,相关性具有确切的含义。它是过去观测值与自变量当前值的统计相似性之和,前者是自变量的马氏距离的负值,是过去观测值的信息性之和,后者等于自变量的马氏距离与自变量的平均值的相等。式(8)测量 和 之间的多元相似性。它与 和 之间的多元距离正好相反(负值)其中, 是自变量当前值的向量, 是自变量先前值的向量,符号 ′ 表示矩阵转置, 是 X 的逆协方差矩阵,其中 X 包含所有自变量向量。在其他条件相同的情况下,与当前观测值更相似的自变量先验观测值比相似度较低的先验观测值更相关。然而,并非所有的相似性度量都是一样的。接近其历史平均值的观测值可能更多地是由噪声而不是事件驱动的。因此,这些普通事件的相关性较小。与历史平均值相距甚远的观测值是不寻常的,因此更有可能受到事件的驱动。鉴于这种直觉,本文将先前观测值 的信息量定义为它与平均值 的多变量距离。这种信息性的定义与以前用于计算 Pearson 相关性的定义相同,但我们现在包括协方差矩阵的非对角线元素,因为它们与 X 变量有关,而 X 变量独立于y。 观测值 的相关性等于其相似性和信息量之和 概括地说,相似性等于 的先前观测值与其当前观测值 的马哈拉诺比斯距离的负值。信息量等于 与其历史平均值的马哈拉诺比斯距离。相关性等于相似性和信息性之和。换句话说,与当前时期相似但与历史平均值不同的前期比不相似的前期更相关。一旦我们确定了自变量过去观测值的相关性,我们就可以利用前面提到的等价关系--即线性回归的预测值是因变量过去值的加权平均值的函数,其中的权重是自变量过去观测值的相关性。通过这一等价关系,我们可以利用等下面的式(11)和 (12),从相关观测数据的子集中得出股票与债券相关性的新预测值。模型5:基于基本因子路径的相关性过滤回归(regression on the path of fundamental factors filtered for relevance)。在这个模型中,我们将工业生产和通货膨胀重新定义为路径。我们不再只包含工业生产和通货膨胀的前期值,而是包含了前五个时期的值,以及股票和债券收益率的前期值和股票和债券收益率的相对波动率的前期值。因此,将t+1期的五年单周期相关性与t期、t-1期、t-2期、t-3期和t-4期的工业生产和通货膨胀率、t期的股票和债券相对收益率以及股票和债券收益率的相对波动率进行回归。此外,与模型4一样,我们对历史观测数据的相关性进行了过滤。图2显示了模型预测的相关性和五年回报率的实际后续单期相关性。该图还揭示了一些有趣的现象。首先,预测股票与债券相关性最常用的方法是推断月度收益的相关性,但这是最不可靠的方法。它与将五年单期相关性与前五年的股票和债券月度收益相关性进行回归的方法水平相同。拟合观测值可使截距和斜率分别偏离0和 1,但并不能提高解释力。引入基本预测因子来预测股票与债券的相关性能显著提高解释力,但最大的改进来自于对历史观测数据的相关性过滤。用路径替换工业生产和通货膨胀的单一观测值也有进一步的好处。接下来,我们通过应用称为Henriksson-Merton检验的非参数方法来评估这些模型,以确定这些模型对股票债券相关性的后续水平是正还是负的预测程度。具体来说,我们计算每个模型预测后续相关性在正值时为正值次数的百分比,当值为负值时,预测相关性为负值次数的百分比。本文还进行了测试,以确定这些模型预测后续相关性的变化是正的还是负的。如果模型完美地预测了股票与债券相关性水平或变化的结果,则这些百分比的总和为2。如果模型无法确定随后的水平或相关性变化是正的还是负的,则这些百分比的总和将为1。1和2之间的任何值都表示一定程度的预测能力。小于1的值表示模型比随机模型差。下表给出了我们测试的五个模型的Henriksson-Merton分数。由表可知,总的来说,前面描述的创新有利于预测股票与债券相关性的水平和变化的后续结果。它们结合在一起,提供了最可靠的预测。 06 结论 投资者依靠股票与债券的相关性来构建最佳投资组合、设计对冲策略和评估风险。在大多数应用中,投资者不太关心股票和债券在每月之间的共同走势,而更关心它们在投资期限内的共同走势。估算股票和债券长期相关性的最常见方法是推断月度收益的相关性,然而,这种方法明显不可靠。本文为预测股票和债券的长期相关性引入了几项创新。本文引入了单期相关性的概念,以解决股票和债券收益的自相关性和滞后交叉相关性不为零,以及长期相关性随时间变化的问题。然后,本文确定了几个基本变量来预测长期股票与债券的相关性。本文在回归中纳入了路径和单一观测值,并对历史观测值进行了统计相关性过滤。我们发现,这些创新大大提高了我们预测股债相关性的可靠性。 讨论时刻: 本文重新审视了依赖短期收益数据来预测长期股票与债券相关性的常规途径,通过提出单期相关性的概念和一系列基本预测因子,为投资者提供了一种更为精细和可信的分析工具。这种方法不仅提升了预测的准确性,而且在风险管理和投资组合构建的决策过程中,为投资者提供了一种更有效的分析方法。