【广发金工】2024精选深度报告系列之十:档位突破因子
财富
财经
2024-09-16 10:07
广东
提升采用频率挖掘量价因子。
随着传统因子逐渐为更多参与者所使用,由此产生的集中买卖可能损耗因子溢价、导致因子失效或反转。就量价因子挖掘而言,提升信息采样频率是拓展因子体系多样性较为直接的方式。Level2快照以约3秒为间隔对个股的日内成交情况及十档挂单状况做存储。更新频率提升使投资者得以观察更小时间尺度上的市场变化;盘口档位数量的提升能够提供更多市场深度及流动性方面的信息,投资者可通过分析订单簿的动态更好地理解市场情绪与微观结构。
档位突破因子。
分档限价单的量与价体现了买卖双方在当前时刻的估价分歧,而主动交易单承担了弥合分歧的角色。我们可通过短期内主动交易单对限价单的消耗量来判断该时刻买方或卖方的强度与意志。通过记录大额主动交易单进场时对价格层级的击穿信息,包含每次击穿(档位突破)信号的类型(买或卖)与深度(击穿档位数),我们以日度层面击穿信号的平均水平构造档位突破因子,用以衡量当日个股的多空强弱对比。
档位突破具有额外信息。
档位突破信号衡量了短期内价格突破的方向及程度,其与收益率相似却不同,差别在于档位突破在某种意义上对订单堆叠的时序信息做了标准化。从与日度或累计收益率间的相关性上看,档位突破较收益率具有额外信息。
因子表现概览。
因子具有较显著的IC,将“档位突破”因子剥离收益率后的提纯“档位突破”因子则在多头端有进一步改善,且今年以来超额增长更佳;分调仓周期看,周度选股的ICIR较月度更高,但交易成本的损耗使得周度多头与月度差异较小;分选股域看,因子在中证1000内的多头业绩更稳定,且今年以来超额继续增长;
因子表现明细。
2017年以来,“档位突破”因子行业市值中性后全市场月度选股IC均值3.1%,年化ICIR2.1,t值5.75;提纯“档位突破”因子中证1000内行业市值中性月度选股IC均值2.9%,年化ICIR2.1,t值5.80,十分组多头费后年化超额8.3%,IR1.5,相对最大回撤7.7%。
风格正交测试。
“档位突破”因子与主要风格相关性均较低,行业及风格正交后,提纯“档位突破”因子中证1000内月度选股IC2.0%,t值4.65,十分组费后多头年化超额6.8%,IR1.3。
风险提示。
1. 本报告中所述因子测试结果是用量化方法通过历史数据统计、建模和测算完成,所得出的结论与规律在政策、市场环境发生变化时可能存在失效的风险;2. 模型在市场结构及交易行为改变时存在失效风险;3. 本文中基于模型得到的组合不代表任何投资建议。
基本面因子、量价因子、另类数据因子、机器学习因子是常见的量化选股因子。其中,基本面因子旨在依据公司的财务和经营状况来深度挖掘企业的基本面信息、评估股票的内在价值和未来潜力,最终寻找被市场低估或高估的投资标的。从1977年Sanjoy Basu的低市盈率异象研究,到1992年Eugene Fama和Kenneth French基于规模(SMB,Small Minus Big)和价值(HML,High Minus Low)对CAPM模型的扩展,再到如今学界及业界持续拓宽财报异象的数据来源及挖掘手段,基本面因子已成为量化投资重要的实践指南。常见的基本面因子包括盈利、质量、成长、价值等。另一方面,量价因子也同样在量化选股中起重要作用。与基本面因子相信财务状况蕴含了未来的经营趋势不同,量价因子认为不论影响价格的因素有多复杂,市场是最终的“投票器”,若市场数据有规律可循(如价格趋势、波动性、交易量等),那么投资者就可通过捕捉市场行为模式、寻找市场情绪和动力来把握投资机会。从早期的技术分析,到1990年Allen B. Atkins对反转效应的研究,再到1993年Narasimhan Jegadeesh和Sheridan Titman关于动量效应的研究,以及现如今投资者通过价量关联等组合维度拓宽因子范围,量价因子的应用场景和理论基础不断丰富。此外,另类数据因子和机器学习因子近年来也在大数据和计算能力的双重进步下逐渐在量化投资领域内兴起。另类数据指除传统财务报表及市场交易数据以外的信息,通常来源于社交媒体、卫星图像、消费者行为、供应链活动等。同时,机器学习(尤其是深度学习)的发展,为投资者处理、解析大规模、非结构化数据提供了抓手,其通过非线性的特征提取方式捕捉传统统计方法不易发现的复杂模式,为量化投资提供了新的研究范式。
在A股市场上,投资者对基本面因子与低频量价因子的研究由来已久,相关体系的成熟也带来因子拥挤的风险。随着传统有效的基础因子逐渐为更多参与者所使用,由此产生的集中买卖可能损耗因子溢价、导致因子失效或反转。在此背景下,不论是基本面抑或量价因子都需持续更新迭代。就量价因子挖掘而言,提升信息采样频率是拓展因子体系多样性较为直接的方式。从日度交易数据到分钟级别数据,再到Level2的快照数据,随着数据频率的提高,投资者得以触及更精细化的市场结构,在更小的信息颗粒度上追寻Alpha的线索。分钟数据通常由Level1数据聚合而成,包含每分钟个股的开盘价、最高价、最低价、收盘价(OHLC)、成交量及五档挂单信息。分钟数据频率适中,较日度数据时序信息更丰富、但不及Level2数据精细,常用于价格趋势和波动模式识别。Level2的快照数据以约3秒为间隔对个股的日内成交情况及十档挂单状况做存储。与分钟线数据相比,采样频率的提升使投资者得以观察更小时间尺度上的市场变化;同时,盘口档位数量的提升能够提供更多市场深度及流动性方面的信息,投资者可通过分析订单簿的动态更好地理解市场情绪与微观结构。本报告尝试基于Level2快照数据,利用更深的订单簿数据挖掘Alpha因子。具体的,我们对如何利用分档挂单数据捕捉个股微观流动性、卖卖压力等特征做初探。直观上,分档限价单的量与价体现了买卖双方在当前时刻的估价分歧,而主动交易单承担了弥合分歧的角色。据此,我们可通过短期内主动交易单对限价单的消耗量来判断该时刻买方或卖方的强度与意志,具体而言,当一个大额主动交易单进场时,其可能击穿多个价格层级上的限价单。通过记录每次击穿(档位突破)信号的类型(买或卖)与深度(击穿档位数),并以日度层面全天的击穿信号平均水平作为因子值,我们可以衡量当日个股的多空强弱对比。
直觉上,档位突破信号衡量了短期内价格突破的方向及程度,其与收益率相似却不同,差别在于档位突破信号在某种意义上对订单堆叠的时序信息做了标准化。从两个维度考察档位突破因子与个股收益率间的相关性我们可以看到,档位突破较收益率具有额外信息。首先,我们考察因子与日度收益的时序相关性,在滚动20天的窗口内考察日度档位突破因子与收益率的相关性。为避免重复计算,我们仅在每个月末计算个股的相关系数,最后对结果取截面、时序均值。从结果看,不同域内时序相关性均在20%左右。其次,我们考察因子与累计收益的截面相关性,具体而言我们考察因子20日均值与20日累计收益率的截面相关性,同样的,我们仅在每个月末计算相关系数,最后对结果取时序均值。从结果看,截面相关系数在各域内均不高,且随考察域市值减小而降低。在全A内,截面相关系数均值约为-14%。
档位突破因子与收益率的低相关暗示了其可能具有额外的选股信息,本文尝试对该因子做测算。具体的,我们通过三种简单方式将日度因子与调仓频率对齐:20日窗口内取均值、取标准差、取均值比标准差(强度)。由于均值保留了因子的原始内涵,下文中我们以“档位突破因子”指代均值因子。
分因子看,“档位突破”因子及强度因子具有较显著的IC,其中“档位突破”因子的多头表现更优;将“档位突破”因子剥离收益率后的提纯“档位突破”因子则在多头端有进一步改善。波动因子则未呈现出明显的选股能力。分调仓周期看,周度选股的ICIR较月度更高,但受换手提升的影响,交易成本的损耗使得周度多头未较月度有明显提高。分选股域看,因子在中证1000内的多头业绩更稳定,且今年以来超额继续增长。从风格相关性看,“档位突破”因子与主要风格相关性均较低,行业及风格正交后业绩较行业市值中性结果差异不大。具体看,回测期内“档位突破”因子行业市值中性后全市场月度选股IC均值3.1%,年化ICIR2.1,t值5.75,十分组多空年化收益11.5%,多空夏普2.3;周度全市场选股IC均值2.5%,年化ICIR3.93,t值10.6,十分组多空年化收益17.9%,多空夏普3.4;提纯“档位突破”因子行业市值中性后中证1000内月度选股十分组多头费后年化超额8.3%,IR1.49,周度选股多头费后年化超额8.4%,IR1.53。(具体业绩明细参见下文)。选股范围:全A市场及宽基指数域;
调仓周期:每月/周最后一个交易日;
股票预处理:剔除ST/ST*、涨跌停板、上市未满60个交易日股票;
因子预处理:去极值、标准化、行业市值中性化;
回测区间:2017.01.03 - 2024.06.28;
分档方式:将股票根据当期因子值由小到大分为十档;
多头组业绩基准:全A选股以万得全A为基准,宽基指数内则以自身指数为基准;
交易费用:双边千二;
我们首先以月度为调仓周期测试因子低频化效果。具体的,我们以滚动20交易日为窗口构建均值、波动、强度因子作为调仓因子,因子做行业市值中性。从全A的选股效果看,“档位突破”因子(即均值)表现较优,回测期内月度选股IC3.1%,年化ICIR2.1,t值5.75,十分组多空年化收益11.5%,多空夏普2.3,多头费后相对万得全A年化超额2.4%,信息比率0.26。
此外,我们看到因子在中证1000内的表现更为突出,尤其是多头端测得更好的超额业绩。中证1000内,“档位突破”因子月度选股IC3.2%,年化ICIR2.3,t值6.2,十分组多空年化收益13.1%,多空夏普2.0,多头费后相对中证1000年化超额7.6%,信息比率1.35。今年以来,因子多空及多头超额均保持增长。
接着,我们考察“档位突破”因子(即均值因子)周度调仓的效果。从回测结果看,因子ICIR较及t值较月频有明显提高,分组收益更单调,而多头较月频调仓受费用损耗影响更大。回测期内,“档位突破”因子中证1000内周度选股IC2.4%,年化ICIR3.7,t值10.0,十分组多空年化收益17.4%,多空夏普2.7,多头费后相对中证1000年化超额6.6%,信息比率1.2,相对最大回撤6.9%。
前文我们提到,档位突破实际是对订单堆叠时序信息标准化后的价格变动,其与收益率在逻辑上具有相似性。为了提纯因子信息,我们尝试从档位突破因子中剥离收益率影响。并考察提纯后的因子选股效果。回测结果显示,提纯因子行业市值中性后多头表现较提纯前在月度、周度层面均有进一步提升,且今年以来的超额增长同样更佳。回测期内,提纯“档位突破”因子中证1000内月度选股IC2.9%,年化ICIR2.1,IC胜率79%,t值5.8,十分组多空年化收益12.2%,多空夏普1.9,多头组费后相对中证1000年化超额8.3%,信息比率1.5;周度调仓多头组年化超额8.4%,信息比率1.53。
上文展示了行业市值中性后的因子业绩,本节我们做更严格的中性测算。风格相关性测试结果显示,“档位突破”因子与主要风格相关性均较低。行业及主要风格正交后,因子业绩差异不大。提纯“档位突破”因子中证1000内月度选股十分组费后多头IR1.29,周度选股IR1.27。
随着传统有效的基础因子逐渐为更多参与者所使用,由此产生的集中买卖可能损耗因子溢价、导致因子失效或反转。在此背景下,不论是基本面抑或量价因子都需持续更新迭代。就量价因子挖掘而言,提升信息采样频率是拓展因子体系多样性较为直接的方式。Level2的快照数据以约3秒为间隔对个股的日内成交情况及十档挂单状况做存储。与分钟线数据相比,采样频率的提升使投资者得以观察更小时间尺度上的市场变化;同时,盘口档位数量的提升能够提供更多市场深度及流动性方面的信息,投资者可通过分析订单簿的动态更好地理解市场情绪与微观结构。本报告基于Level2快照中更深的订单簿数据,对如何利用分档挂单捕捉个股微观流动性、卖卖压力等特征做初探。具体的,我们认为短时间内主动交易单对限价单的消耗可以指征买方或卖方的强度与意志,通过记录大额主动交易单进场时对价格层级的击穿信息,包含每次击穿(档位突破)信号的类型(买或卖)与深度(击穿档位数),我们以日度层面击穿信号的平均水平构造了档位突破因子,用以衡量当日个股的多空强弱对比。在第一章中,我们介绍了Level2快照与传统分钟线数据的各自特点。在第二章中,我们简要阐述了档位突破的原理,其本质是对订单堆叠时序信息标准化后的价格变动,与收益率相似但不同。接着,我们通过相关性分析说明了档位突破较收益率依然有额外的信息。随后,我们介绍了本文将日度因子低频化调仓的方式,并简要概括了回测结论。在第三章中,我们详细介绍了因子回测的业绩效果。总结来看,“档位突破”因子及强度因子具有较显著的IC,其中“档位突破”因子的多头表现更优;将“档位突破”因子剥离收益率后的提纯“档位突破”因子则在多头端有进一步改善;分调仓周期看,周度选股的ICIR较月度更高,但受换手提升的影响,交易成本的损耗使得周度多头未较月度有明显提高;分选股域看,因子在中证1000内的多头业绩更稳定,且今年以来超额继续增长;最后,从风格相关性看“档位突破”因子与主要风格相关性均较低,行业及风格正交后业绩较行业市值中性结果差异不大。1. 本报告中所述因子测试结果是用量化方法通过历史数据统计、建模和测算完成,所得出的结论与规律在政策、市场环境发生变化时可能存在失效的风险;2. 模型在市场结构及交易行为改变时存在失效风险;3. 本文中基于模型得到的组合不代表任何投资建议。本微信号推送内容仅供广发证券股份有限公司(下称“广发证券”)客户参考,其他的任何读者在订阅本微信号前,请自行评估接收相关推送内容的适当性,广发证券不会因订阅本微信号的行为或者收到、阅读本微信号推送内容而视相关人员为客户。
完整的投资观点应以广发证券研究所发布的完整报告为准。完整报告所载资料的来源及观点的出处皆被广发证券认为可靠,但广发证券不对其准确性或完整性做出任何保证,报告内容亦仅供参考。
在任何情况下,本微信号所推送信息或所表述的意见并不构成对任何人的投资建议。除非法律法规有明确规定,在任何情况下广发证券不对因使用本微信号的内容而引致的任何损失承担任何责任。读者不应以本微信号推送内容取代其独立判断或仅根据本微信号推送内容做出决策。
本微信号推送内容仅反映广发证券研究人员于发出完整报告当日的判断,可随时更改且不予通告。
本微信号及其推送内容的版权归广发证券所有,广发证券对本微信号及其推送内容保留一切法律权利。未经广发证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。