市场上有很多量化基金,或者叫多空对冲基金,他们用什么样的方法赚钱呢?
方法五花八门。这里我介绍一篇英文文章来说明这样一种方法,作者分别是纽约大学的教授和一家法国的金融分析和培训公司的研究人员。文章比较理论,但值得学习。如无特殊需要解释,我就直接引用。
这段简介是这样:我们这篇文章研究美国股票的一种模型驱动的统计套利策略。模型里用到的交易信号通过两种方式产生:一种是使用主成分分析法(PCA),另一种用行业 ETF。在这两种情况下,我们都会考虑股票收益(在被这些信号解释之后)的残差,也可以称为特异性成分,并将其建模为均值回复过程,这自然而然地会产生 “逆向(思维) ”交易信号(Contrarian)。本文的主要贡献在于对基于市场中性的 PCA 策略和基于 ETF 的策略进行了回溯测试和比较。回溯测试表明,计入交易成本后,基于 PCA 的策略在 1997 年至 2007 年期间的年均夏普比率为 1.44,2003 年之前的表现更为强劲:2003 年至 2007 年期间,基于 PCA 的策略的平均夏普比率仅为 0.9。另一方面,基于 ETF 的策略在 1997 年至 2007 年期间的夏普比率为 1.1,但在 2002 年之后也出现了类似的绩效下降。我们引入了一种在信号中考虑每日交易量信息的方法(使用 “交易时间 ”而非日历时间),这个方法让我们观察到基于 ETF 的信号的表现有了显著改善。从 2003 年到 2007 年,使用交易量信息的 ETF 策略的夏普比率达到 1.51。本文还将均值回复统计套利策略的表现与股市周期联系起来。我们特别详细研究了 2007 年夏季流动性危机期间策略的表现。我们得出了与 Khandani 和 Lo(2007 年)一致的结果,并验证了他们关于 2007 年 8 月量化基金缩减的 “平仓 ”理论。
引言
统计套利一词包含多种策略和投资方案。它们的共同特点是 (i) 交易信号是系统的,或者说是基于规则的,而不是由基本面驱动的;(ii) 交易账簿是市场中性的,即与市场的贝塔系数为零;(iii) 产生超额收益的机制是统计性的。其理念是利用股票分散投资的优势,进行许多预期收益为正的投注,从而产生一种与市场无关的低波动投资策略。持有期从几秒钟到几天、几周甚至更长。
业界普遍认为“配对交易”是统计套利的 “鼻祖”。如果股票 P 和 Q 处于同一行业或具有相似的特征(如埃克森移动公司和康科菲利普斯公司),那么在控制贝塔系数后,我们预期这两只股票的收益会相互跟踪。因此,如果 Pt 和 Qt 表示相应的价格时间序列,那么我们可以将系统建模为
或者用微分方程来表示的话:
这里要说的就是这两个股票基本走向一致,只是差了一个系数贝塔。
但重要的是看那个“残差”X。
我们假设Xt 是一个静态或均值回复过程。在本文的其余部分,这一过程将被称为协整(cointegration)残差,简称残差。在许多我们感兴趣的情况下,漂移 α 与 Xt 的波动相比很小,因此可以忽略。这意味着,在控制贝塔系数后,多空投资组合会在某种统计均衡附近震荡。该模型提出了一种逆向投资策略,即如果 Xt 较小,我们做多 1 美元的股票 P,做空 β 美元的股票 Q;反之,如果 Xt 较大,我们做空 P,做多 Q。随着估值的收敛,投资组合有望产生正收益(有关统计套利和协整的全面综述,请参见 Pole (2007))。均值回复范式通常与市场过度反应有关:相对于一种或几种参考证券,资产暂时定价过低或过高(Lo and MacKinley (1990))。
另一种可能是考虑其中一只股票在相当长一段时间内的表现会优于另一只股票的情况。在这种情况下,协整残差不应该是静态的。本文主要关注均值回复,因此不考虑这种情况。
“广义配对交易",即一组股票对另一组股票的交易,是配对交易的自然延伸。为了解释这一观点,我们考虑生物技术股这一板块。我们按照前面方程(1)或(2)对该板块的每只股票与基准板块指数(如生物技术 HOLDR (BBH))进行回归/协整分析。股票 Q 的作用由 BBH 承担,P 则是生物技术行业中的任意股票。根据 Xt 的大小对残差的分析表明,有些股票相对于该行业是便宜的,有些是昂贵的,而有些则是价格合理的。广义的配对交易账簿或统计套利账簿由股票相对于 ETF 的 “配对交易 ”集合(或更广义地说,解释系统性股票回报的因素)组成。在某些情况下,我们可能会持有个股的多头头寸,而同时持有 ETF 的空头头寸;在其他情况下,我们会做空个股,同时做多 ETF。由于多头和空头头寸相抵,我们预计 ETF 的净头寸只占总持仓量的一小部分【因为ETF是个股的集合体,所以ETF中包含的很多个股实际上与所持有的个股相抵消,因此,这个组合的真正有效部分就是剩下的少量个股成分了】。因此,交易账簿看起来就像单只股票的多空组合。本文关注此类策略的设计和绩效评估。
残差分析将是我们的出发点。我们用到的信号将以一个行业或一组同行内的相对价值定价为基础,然后,我们将股票收益分解为系统性部分和特异性部分,并对特异性部分进行统计建模。一般分解如下:
其中项 F (j)^ t , j = 1, ..., n 代表与所考虑市场相关的风险因子收益。【这也是方程(3)与上面的(2)不同的地方。那里方程右边是另一个股票Q。但实际上没有两个股票可以彼此说明,实际上,一堆股票,或一个行业里的股票都是由多个风险因子来决定的。】
这就引出了一个有趣的问题,即如何在实践中推导出方程 (3)。这个问题也出现在经典的投资组合理论中,但方式略有不同:在经典的投资组合理论中,我们要问的是从风险管理的角度来看,什么才是一组 “好的 ”风险因子。在这里,我们强调的是分解后的剩余部分。我们论文的主要贡献在于研究不同的风险因素及如何导致不同的残差,从而导致统计套利策略的不同盈亏(PNL)。
以往关于均值回复和逆向策略的研究包括 Lehmann(1990 年)、Lo 和 MacKinlay(1990 年)以及 Poterba 和 Summers(1988 年)。在最近的一篇论文中,Khandani 和 Lo(2007 年)讨论了 Lo-MacKinlay 逆向策略在 2007 年流动性危机中的表现(另见其中的参考文献)。后者的策略与本文中的策略有几个共同点。Khandani 和 Lo(2007 年)通过对股票收益进行量化排名,并以美元中性的方式进行 “赢家对输家 ”交易,从而实现了市场中性。在这里,我们使用风险因子来提取交易信号,即检测绩优股和绩差股。我们的交易频率是可变的,而 Khandani-Lo 的交易时间间隔是固定的。在参数方面,Poterba 和 Summers(1988 年)使用自回归模型研究了国际股票市场的均值回复。本文的模型与后者的主要区别在于,我们将股票与市场因素进行了免疫,即我们考虑的是残差(相对价格)而非价格本身的均值回复。
本文的结构如下:第 2 节,我们使用两种不同的方法研究市场中性问题。第一种方法是利用主成分分析法(Jolliffe (2002))提取风险因子。第二种方法使用行业部门 ETF 作为风险因子的替代物。我们效仿其他作者的做法,表明对美国大股票市场的相关性矩阵进行 PCA 分析,可以得出具有经济意义的风险因子,因为它们可以被解释为行业部门的多空投资组合。此外,对某一因子贡献最大的股票不一定是特定行业中市值最大的股票。这表明,与 ETF 不同,基于 PCA 的风险因子并不偏向于大市值股票。我们还观察到,固定数量的 PCA 特征向量所解释的方差在不同时期有显著差异,这让我们猜想,描述股票回报率所需的解释因子数量是可变的,而且这种可变性与投资周期或投资股票市场的风险溢价变化有关。
在第 3 节和第 4 节中,我们将构建交易信号。这包括利用收盘前的历史数据,在每个交易日收盘时对每只股票的过程 Xt 进行统计估算。估算时总是基于历史记录回顾,从而模拟真实自动交易中的决策。利用每日收盘(EOD)数据,我们对每日交易信号进行了全面计算,在某些情况下可追溯至 1996 年,而在其他情况下则可追溯至 2002 年。
为避免数据挖掘,估算和交易规则保持简单。对于全局中的每只股票,都使用 60 天的跟踪估计窗口进行参数估计,这大致相当于一个盈利周期【财报周期】。在模拟中,窗口的长度固定下来就不变,也不会因股票的不同而改变。我们使用相同的固定长度估算窗口,选择偏离均衡状态 1.25 个标准差的残差作为交易的入场点,如果残差小于均衡状态的 0.5 个标准差,我们就退出交易,所有股票都是这样。
在第 5 节中,我们反向测试了使用不同因素及生成残差的不同策略,即:基于资本化加权指数的合成 ETF、实际 ETF、由 PCA 生成的固定因素数、由 PCA 生成的可变因素数。由于上文所述的用于生成交易系统的机制,模拟是样本外的,即对时间 t 的残差过程的估计仅使用在此之前可用的信息。在所有情况下,我们假设每笔交易的滑点/交易成本为 0.05% 或 5 个基点(往返交易成本为 10 个基点)。
在第 6 节中,我们对该策略进行修改,即用 “交易时间 ”而不是日历时间来估算信号。在统计分析中,将交易时间用于 EOD 信号实际上等同于将每日收益乘以一个与过去一天交易量成反比的系数【如不明白见之后细谈】。这种修改突出了(即倾向于)低交易量下的逆向价格信号,而减轻了(即倾向于不支持)高交易量下的逆向价格信号。这就好比我们 “更相信 ”高成交量时出现的价格信号,而不愿意与之对赌。使用交易时间信号对统计套利策略进行反向测试,可以改进大多数策略,这表明成交量信息在均值反转中很有价值,即使在 EOD 时间尺度上也是如此。
在第 7 节中,我们讨论了统计套利在 2007 年的表现,尤其是在 2007 年 8 月流动性危机爆发前后的表现。我们将均值回复策略的表现与 Khandani 和 Lo(2007 年)近期研究的策略进行了比较。结论见第 8 节。
2 风险因素和市场中性的定量观点
我们将世界划分为 “指数持有者 ”和 “市场中性代理人”。持有指数者寻求对整个市场或特定行业板块的投资。他们的目标通常是做多市场或行业,并在每只股票中占有适当的权重。市场中性代理人寻求与市场无关的回报。
我们用表示交易范围内不同股票在任意一天内(从收盘到收盘)的收益率。让 F 代表 “市场投资组合 ”在同一时期的收益率(如标准普尔 500 指数等资本化加权指数的收益率)。我们可以为宇宙中的每只股票写出
这是一个简单的回归模型,将股票收益分解为系统成分 和(不相关的)的特异成分 R˜ i。另外,我们还可以考虑以下形式的多因子模型
这里有 m 个因子,可以看作是代表系统因子的 “基准 ”投资组合的收益。如果投资于每只股票的美元金额投资于每只股票,使得
那么我们就说这是个风险中性组合,因为这时这个组合就不依赖这些风险因子了。
系数对应于投资组合对不同因素的贝塔或投资组合收益对不同因素的投射。在(6)成立的时候,这是个市场中性投资组合,因为为0了;它与市场投资组合或驱动市场回报的因子无关了。因此,投资组合收益满足:
这样,一个市场中性投资组合就只受特异性回报的影响了。我们将在下面看到,在每个八国集团经济体中,股票收益大约可以用 m=15 个因子(或 10 到 20 个因子)来解释,股票收益的系统性成分大约可以解释 50%的方差(见 Plerou 等人(2002 年)和 Laloux 等人(2000 年))。问题在于如何定义 “因子”。
2.1 PCA 方法:你能听出市场的形状吗?
从数据中提取因子的第一种方法是使用主成分分析法(Jolliffe (2002))。这种方法使用的是 N 只股票的一段历史股价数据,比如说追溯到历史上的 M 天。为简化说明,我们假设这个范围与投资范围完全相同,实际情况不必如此。
让我们用下面一个矩阵来表示任何给定日期 t0 的股票收益数据,我们追溯 M + 1 天:
其中,Sit 是股票 i 在 t 时间的价格,我们已对股息进行调整,Δt = 1/252。由于有些股票的波动性比其他股票大,因此使用标准化收益率比较方便,也就是说,我们做了下面这样的标准化:
有了这些数,数据的经验相关矩阵定义如下:
这个矩阵是对称且非负定的。注意,对于任何指数 i,我们都有
ρ 的尺寸通常是 500 乘 500 或 1000 乘 1000,但相对于需要估计的参数数量,这个数据是很小的。事实上,如果我们考虑每日收益,就会面临一个问题,即很长的估计窗口是没有意义的,因为那样考虑的就是与经济无关的遥远过去。另一方面,如果我们只考虑过去一年的市场行为,那么我们面临的事实是,相关矩阵中的条目比数据点要多得多。
从数据中提取有意义信息的常用方法是主成分分析法。我们考虑经验相关矩阵的特征向量和特征值,并将特征值按递减顺序排列:
我们将相应的特征向量表示为
粗略看一下特征值,就可以发现它包含几个大的特征值,它们与其他部分分离开来(见图 1)。
我们还可以观察态密度
对于接近零的区间(x, y),函数 D(x, y) 相当于相关矩阵的 “大体谱 ”或 “噪声谱”。位于频谱顶端的特征值与大体频谱相隔离,显然具有重要意义。从图 1 和图 2 中可以立即看出的问题是,“分离 ”的特征值比行业部门少。因此,我们预计 “重要 ”特征值和 “噪声 ”特征值之间的界限会有些模糊,并对应于 “总体频谱 ”的边缘。这就导致了两种可能性:(a) 我们考虑固定数量的特征值来提取因子(假设数量与行业部门的数量相近),或者 (b) 我们根据估算日期,考虑不同数量的特征向量,从而使保留的特征值之和超过相关矩阵迹的给定百分比。后一个条件等同于截断解释了系统总方差的一定百分比。
设 λ1,...,λm,m < N 为上述意义上的重要特征值。对于每个指数 j,我们考虑一个相应的 “特征组合”,即投资于每只股票的相应金额定义为
那么,这个特征组合的收益率就是
不难发现,特征组合收益是不相关的,即在 j和k不同的时候,Fj 和 Fk 的经验相关性是0。PCA 方法中的因子就是这些特征组合收益率。
资领域中的每只股票收益都可分解为其在 m 个因子上的投影和残差,如公式 (4) 所示。因此,PCA 方法提供了一组自然的风险因子,可用来分解我们的收益。不难验证,这种方法相当于将股票收益的相关矩阵建模为一个与重要频谱相对应的 m 级矩阵和一个全等级对角矩阵之和。
这里。这意味着我们只保留相关矩阵的重要特征值/特征向量,并添加一个对角 “噪声 ”矩阵,以保持系统的总方差。
(未完待续)