在现有的多因子体系中,大多数都是从个股自身特征出发进行构造的因子。然而,股票市场上有着数千只相互交织、相互作用的个股标的,个股与整体市场之间蕴含着大量可以剖析的信息。经过测试我们发现,当个股在价格趋势和成交量上与整体市场形成有效的共振关系时,其未来收益通常较好。基于这个结论,我们在分钟级数据视角上建立出了量价选股因子——价变共振因子。
在价格趋势方面:
我们对个股与市场分钟收益率相关系数因子进行了有效性测试,发现其具有一定的正向选股有效性。这说明,当个股与市场形成较好的共振效应时,未来收益表现较好;而走势背离于市场,走出独立行情的个股往往收益表现较弱。
由于金融时间序列数据具有信噪比低、高度随机的特征,其中必然包含了大量的无意义噪音。因此在个股交易过程中,短时间内出现价格显著变化时的市场特征可能更值得我们去关注。
因此,我们可以统计每个交易日日内分钟收益率最高和最低时的市场收益率来考察个股与市场的共振情况,并计算相同时间的市场分歧度对共振结果进行修正,得到描述个股表现相对较好和较差时其与市场共振情况的 CO_MAX 和 CO_MIN 因子。
在成交量方面:
当个股形成独立于市场的成交量异动时,既说明其可能会受到交易过热的反噬,也将不利于其形成与市场的有效价格共振。
延伸在价格趋势方面因子构建的逻辑,我们统计日内分钟收益率最高和最低时个股成交量市场占比的情况。经过测试,我们发现同步成交量异动因子的选股效应并不稳定,但领先成交量异动因子(PRE_AMT_MAX和 PRE_AMT_MIN)表现相对稳健。
在将前述的四个因子进行等权复合之后,我们得到了一个复合的价变共振因子。经过测试,该因子具有相对稳健的选股能力,IC 均值为 6.32%,年化ICIR 为 4.64。这说明,当个股与市场能形成相对有效共振时,未来的预期收益相对较高。并且,该因子与常见因子相关性较低,正交化后 ICIR 略有提升。在各宽基中也都能构建出具有稳健超额收益的指数增强策略。
风险提示:本报告结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在失效的风险;本报告所提及个股或基金仅表示与相关主题有一定关联性,不构成任何投资建议。
前言
在现有的多因子体系中,大多数都是从个股自身特征出发进行构造的因子。而从另一个角度来看,股票市场上具有数千只同时交易的个股,每一只个股的价格变化和买卖成交共同形成了市场的冷暖,而市场的整体环境又必然会影响个股的交易情绪。因此个股与市场之前存在着相互作用相互影响的关系,其中蕴含着大量可以剖析的信息。本次我们将另辟新径,在分钟级数据的视角之下观察个股与市场的关系,试图构建出具有一定有效性的量价选股因子。
对于如何从个股与市场之间的联系构建因子这一问题,我们不妨从一个经典的趋势性问题寻找一些灵感——动量和反转。
众所周知,在A股市场中,反转效应是个股投资中非常显著的一个投资特征,那么这是否意味着动量在A股市场不存在呢?实则不然, A股市场上的动量效应存在于具有相同特征的股票组合之中。
根据测试,我们可以发现在风格或者行业视角下,股票组合的收益率呈现出了动量效应。这是因为个股更容易出现超买或超卖,进而导致个股收益率本身反映出了反转的效应。而如果我们从股票组合视角去观察收益率时,股票组合之中的超买超卖噪音将被相互中和。只有真正作用于整体导致的共同趋势才会反应到组合收益率上,而这样在收益率上进行过相互确认的趋势将具有更高的正确率,例如由景气改善或宏观变化导致的行情趋势。而从另一个角度来说,能够形成一股共同趋势,进而影响整体市场变化的一批股票通常代表着当时的市场主线,这样类型的市场主线往往具有在投资上的可延续性。因此,如果个股能够与其他股票形成有效的市场共振,那么这样的个股有可能是值得我们去关注的。
价变共振因子明细构建
在本次回溯测试中,我们将采用周度频率进行测算,默认采用十分组。在构建收益组合时,对ST股票、停牌股票和新上市股票作剔除,不买入涨停股票,不卖出跌停股票。交易按照因子值可获得时间的次日收盘价进行买卖。在第二节的因子构建测试之中,暂时不考虑交易费用。在第三节的策略测试之中,记入双边千分之一的手续费。
2.1、价格趋势上的一致性和分歧度
谈到个股与市场之间的价格趋势,我们会马上联想到一个描述个股特性的重要指标,即贝塔系数。作为非常典型的Barra因子,其反应的是个股收益相对市场收益的弹性。
其中,rt代表着个股收益日序列,rm,t代表着市场收益日序列,通常采用一年及以上的数据进行回归系数的计算。事实上,通过建立回归方程得到的β系数,可以蕴含着两部分信息——波动率和一致性。由于高弹性意味着较高的一致性和较高的波动率,因此贝塔系数较高的个股通常在牛市期间表现较好,但在震荡市和熊市则表现较差。无论从其构建方法和其实证效果来看,贝塔系数一直都被投资者视作一种典型的风险因子,而不是选股因子。
而在构建贝塔系数时,为了得到个股与市场之间较为确定性的关系,通常会在较长时间维度下进行回归。并且其在考量弹性时结合了个股的波动率特征,因此贝塔系数类似于个股的一种属性,并不会随着时间变化发生变化。
然而,个股在短期的交易资金和情绪的引导之下,是有可能形成与长期状态下截然不同的收益特征。而一种短期的、会随时变化的相关性趋势,或许正是我们想要观察的特征。进一步的,我们可以构建一个在短期视角下的一致性指标——以分钟收益率构建个股与全市场等权收益率的相关性。
其中,ri,t代表着t分钟个股i的收益率,rm,t代表着t分钟的全市场等权收益率。按照式中的计算,我们可以得到当日个股与全市场收益率的相关系数,再回溯过去5日做均值即可得到一个市场相关性因子。
从IC测试来看,分钟相关性的IC均值为2.39%,ICIR为1.05。可见,当个股与市场形成较好的同步效应时,即具有一定相关性时,未来收益表现较好;而走势有驳于市场,走出独立行情的个股往往收益表现较弱。
接下来,我们希望对个股与市场在趋势上的一致性的考察上,进行一些除了相关系数以外的更多尝试。众所周知,金融时间序列数据具有信噪比低、高度随机的特征(De Prado,2018)。而在构建相关系数时,在计算过程中是对个股所有时间范围内的收益率数据都与整体市场进行了一致性的考察,其中必然包含了大量的无意义噪音。事实上,在个股交易过程中,可能在短时间内会出现脉冲式的价格剧烈变化,而在这短时间内的关键交易特征,往往更值得我们去关注。
由于价格是围绕价值中枢变化的,结合个股反转效应的现象,当个股快速上涨时我们可以视其出现了可能需要付出的“代价”, 而当个股快速下跌时其拥有未来可能得到的“补偿”。而在交易过程中,个股面临的“代价”和“补偿”是不可避免的。当个股必须承担“代价”时,我们希望其“代价”是全市场趋势共振作用的,这样的“代价”是被普遍认可的,是较不容易形成反噬的。而当个股拥有“补偿”时,我们希望这个“补偿”是市场恐慌性错杀带来的,这样更容易在后续得到及时的修正和补偿。
为了验证这一猜想,我们统计了个股在日内中最高和最低的N(M)个分钟收益率期间,对应全市场等权收益率的均值,分别记为RM_MAX(N)和RM_MINM)。我们将N分别取3、5、15、30、45和60都分别构建了RM_MAX(N)和RM_MIN(M)因子,并进行了IC测试。
其中,ri,t为个股i在t时刻的收益率,n1,n2…nN为日内分钟收益率最高的若干个分钟,m1,m2…mM为日内分钟收益率最低的若干个分钟,最后将近5日因子值取均值得到测试因子对象。
当RM_MAX取值越大时,说明个股是在市场表现较好时同步出现价格上涨。同理当RM_MIN取值越小时,则说明个股是在市场相对较差时出现下跌。从结果来看,刻画收益率显著变化期间所刻画出的共振现象相对于关注完整时间的相关性具有更好的选股有效性。总体对比来看,N和M取5时的因子IC表现最好。
进一步的,我们分别将RM_MAX5和RM_MIN5构建分组测试。总体来看,两个因子都表现出相对稳健的选股有效性。RM_MAX5的高因子组年化超额为9.07%,信息比率为1.07;RM_MIN5的低因子组年化超额为13.99%,信息比率为1.54。
在前述的讨论中,我们实际上是对个股与市场之间在收益率时间序列上的一致性关系进行了统计。而另一方面,我们还可以从截面上统计市场个股收益率的离散状态来进一步考察市场共同趋势的共振情况。当市场的收益分歧程度越小,则说明了此时市场所有个股之间的趋势也较为相似,这样的市场趋势更具有市场代表性。
延伸在一致性方面的构建逻辑,我们可以重点观察个股收益率最大或最小时,市场整体收益的分歧程度。具体来说,我们可以计算个股在日内中最高和最低的5个分钟收益率期间,全市场收益率标准差的均值,分别记为STD_MAX和STD_MIN。
其中,rt为t时刻的全部个股收益率序列,n1,n2…n5为日内分钟收益率最高的5个分钟,m1,m2…m5为日内分钟收益率最低的5个分钟。从测试结果来看,当STD_MAX和STD_MIN取值越大,个股未来收益率越低。即个股若是在市场整体分歧程度较大时形成显著价格变化,说明其没有与市场形成有效的共振,未来可能表现相对较弱。
最后再将一致性和分歧度的指标进行融合则可以得到在收益率显著变化时的市场共振因子。
(1)计算个股在日内中最高和最低的5个分钟收益率期间,全市场收益率标准差的均值,分别记为STD_MAX和STD_MIN。
(2)计算了个股在日内中最高和最低的5个分钟收益率期间,对应全市场等权收益率的均值,分别记为RM_MAX和RM_MIN。
(3)对RM_MAX做截面上的正序排名名次归一化,对RM_MIN做截面逆序排名名次归一化。这一步骤是为了使得RM_MAX和RM_MIN在数值上均为正数,以保证后续因子构建符合逻辑。
(4)将变换的RM_MAX和RM_MIN分别除以STD_MAX和STD_MIN得到CO_MAX和CO_MIN因子。
(5)取5日因子值均值作为最终因子。
根据IC测试结果,可以看到结合了分歧度之后,RM_MAX的IC均值由3.47%提升至4.43%,ICIR由2.30提升至3.40;RM_MIN的IC均值由3.34%提升至4.19%,ICIR由2.00提升至3.03。
2.2、异常成交量
在讨论完价格趋势的因子之后,我们希望在量能方面也同样构建一些有效的选股因子。众所周知,异常的成交量放大往往意味着交易过热的信号,因此交易过度活跃的个股往往未来收益表现偏弱。延伸前述逻辑,我们可以关注个股在分钟级别下剧烈变化时的成交量情况进行指标构建。如果个股脉冲式收益率是伴随着个股区别于市场的成交异动出现的,那么这样的价格变化可能是由自身成交量的异动造成的,这将不利于个股与市场保持共振。
具体来说,我们首先计算日内每一分钟内的个股成交额占全市场总成交额的比值作为个股成交额占比,再将日内最高和最低的N(M)个分钟收益率期间的个股成交额比值的均值除以当日240个分钟的成交额比值的均值,记为AMT_MAX(N)和AMT_MIN(M)。我们将N和M分别取3、5、30、45和60都分别构建了AMT_MAX(N)和AMT_MIN(M),并进行了IC测试。
其中,AMTi,t为个股i在t时刻的成交额,AMT_Percenti,t则为个股i在t时刻的成交额占比,n1,n2…nN为日内分钟收益率最高的若干个分钟,m1,m2…mM为日内分钟收益率最低的若干个分钟,同样取5日均值作为因子值。从IC测试结果来看,分钟级别下的异常成交量IC值虽具有一定选股效应,但整体表现并不稳健。
在做进一步思考后,我们意识到价格剧烈变化和成交量变化的关系本身并非完全同步的。在交易过程中,往往是量带动价变化,因此我们需要关注的应该是脉冲式收益率之前的成交量情况。所以,我们将统计对象改为日内最高和最低的N(M)个分钟的前一分钟的成交量占比情况。
对比测试结果可以看到,在考虑成交量领先情况之后,异常成交量因子形成了显著的边际改善。对比来看,当N和M取30时,整体指标的有效性最好,后续我们就将N和M取30作为该指标的计算参数。
经过分组,可以看到PRE_AMT_MAX和PRE_AMT_MIN分组收益单调性良好。PRE_AMT_MAX因子多头组合年化超额为6.45%,信息比率1.26;PRE_AMT_MIN因子多头组合年化超额为6.19%,信息比率1.06。
复合因子的详细测试
在第二节,我们对价格变化时点中收益率的市场特征以及领先成交量特征进行了考察,并构建出了CO_MAX、CO_MIN、PRE_AMT_MAX和PRE_AMT_MIN四个具有一定有效性的选股因子。进一步的,我们将当日计算得到的四个因子分别做截面排序归一化后,进行等权复合即可得到当日复合因子因子。为了使因子值在时间序列上更加平滑,我们将每日计算得到的复合因子值以20日为回溯期,以5日为半衰期进行时间序列衰减加权即可得到最终的价变时点市场共振因子(简称价变共振因子)。
基于该因子,我们可以挑选出一批在价格脉冲式发生变化时,能够与市场保持较好趋势共振的个股标的。后续,我们将对该因子进行详细的因子测试和策略构建。在本节的测试中,我们将计入千分之一的双边手续费。
3.1 复合因子测试
首先,我们对价变时点市场共振因子做IC测试,可以看到,复合因子IC均值为6.32%,IC胜率为72.60%,T值为11.01。
经过分组测试,价变共振因子分组测试单调性良好。2019年以来,多头组合年化超额8.89%,信息比率1.39;多空组合年化收益率为59.07%,夏普比率4.64。
此外,我们还对该因子做了详细的逐年收益测试和手续费敏感性测试。经过统计,该因子多头组合自2019年以来每年均能获得一定的超额收益,并且多空收益十分显著。在手续费敏感性测试下,双边千分之二时该因子多头组合年化超额为6.60%。
3.2 相关性测试
接下来,我们将对价变共振因子与Barra风格因子进行了相关性分析。从测试结果来看,价变共振因子与Barra因子相关性并不高。除Beta和残差波动率以外,相关性均在0.2以下。
进一步的,我们将价变共振与这些因子做正交化,并将中性化后的因子做进一步的有效性测试。从IC测试来看,中性化后虽然IC均值从6.32%下降至4.35%,但ICIR基本没有显著下滑,且T检验结果有所提升。因此从结果上来看,价变共振因子相对常见因子能提供一定的增量信息。
3.3宽基测试
接下来,我们将尝试基于价变共振因子构建指数增强策略,具体构建方案如下:
(1)指数基准:沪深300指数、中证500指数和中证1000指数。
(2)权重计算:在限制个股权重偏移(1.2%、1%、0.8%)、行业权重偏移(8%)和市值权重偏移(0.5个标准差)的约束条件之下,最大化组合在价变共振因子的暴露。
(3)策略构建:以周频为回测频率,以因子可获得交易日的下一个交易日收盘价进行调仓,并在交易时考虑涨跌停限制,剔除ST、停牌股票。
从测试可以看出,价变共振因子在各宽基指数中均能形成一定的选股效应。具体来说,价变共振因子在沪深300中能获得4.65%的年化超额,信息比率为1.35;在中证500中能获得4.82%的年化超额,信息比率为1.12;在中证1000中能获得7.93%的年化超额,信息比率为1.53。
结语
在本文之中,我们基于分钟数据构建了描述个股与市场之间关系的价变共振因子。
具体来说,我们在经过测试后发现,与市场形成有效共振的个股往往具有更高的预期收益,因此我们在这个结论上尝试进行了更多的因子构建。在考虑到金融数据序列具有普遍的噪音后,我们认为个股在价格大幅变化时的共振现象更具有意义,基于此,我们构建了描述一致性的RM_MAX和RM_MIN因子,描述分歧度的STD_MAX和STD_MIN因子,并将二者结合构建出了CO_MAX和CO_MIN因子。除此之外,我们还对异动成交量进行了统计讨论,发现价格大幅变化时的领先市场成交量占比(PRE_AMT_MAX和PRE_AMT_MIN)同样具有选股效应。
在将前述因子结合之后,我们对复合得到价变共振因子进行了有效测试,发现其具有相对稳健的选股能力,并能基于因子实现对各宽基指数的增强策略。后续我们将持续进行相关方面的研究,感兴趣的投资者可以持续关注我们!
重要申明
文章节选自2024年12月16日外发的报告《“青出于蓝”系列研究之九:基于分钟数据的价变共振因子》,具体细节以报告为准。
风险提示
本报告结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在失效的风险;本报告所提及个股或基金仅表示与相关主题有一定关联性,不构成任何投资建议。
分析师承诺
负责本研究报告的每一位证券分析师,在此申明,本报告清晰、准确地反映了分析师本人的研究观点。本人薪酬的任何部分过去不曾与、现在不与,未来也将不会与本报告中的具体推荐或观点直接或间接相关。
本报告分析师
任 瞳 SAC职业证书编号:S1090519080004
麦元勋 SAC职业证书编号:S1090519090003
许继宏 SAC职业证书编号:S1090524070003
特别提示
本公众号不是招商证券股份有限公司(下称“招商证券”)研究报告的发布平台。本公众号只是转发招商证券已发布研究报告的部分观点,订阅者若使用本公众号所载资料,有可能会因缺乏对完整报告的了解或缺乏相关的解读而对资料中的关键假设、评级、目标价等内容产生理解上的歧义。
本公众号所载信息、意见不构成所述证券或金融工具买卖的出价或征价,评级、目标价、估值、盈利预测等分析判断亦不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。该等信息、意见在任何时候均不构成对任何人的具有针对性、指导具体投资的操作意见,订阅者应当对本公众号中的信息和意见进行评估,根据自身情况自主做出投资决策并自行承担投资风险。
招商证券对本公众号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。对依据或者使用本公众号所载资料所造成的任何后果,招商证券均不承担任何形式的责任。
本公众号所载内容仅供招商证券股份客户中的专业投资者参考,其他的任何读者在订阅本公众号前,请自行评估接收相关内容的适当性,招商证券不会因订阅本公众号的行为或者收到、阅读本公众号所载资料而视相关人员为专业投资者客户。
一般声明
本公众号仅是转发招商证券已发布报告的部分观点,所载盈利预测、目标价格、评级、估值等观点的给予是基于一系列的假设和前提条件,订阅者只有在了解相关报告中的全部信息基础上,才可能对相关观点形成比较全面的认识。如欲了解完整观点,应参见招商证券网站(http://www.cmschina.com/yf.html)所载完整报告。
本公众号所载资料较之招商证券正式发布的报告存在延时转发的情况,并有可能因报告发布日之后的情势或其他因素的变更而不再准确或失效。本资料所载意见、评估及预测仅为报告出具日的观点和判断。该等意见、评估及预测无需通知即可随时更改。
本公众号所载资料涉及的证券或金融工具的价格走势可能受各种因素影响,过往的表现不应作为日后表现的预示和担保。在不同时期,招商证券可能会发出与本资料所载意见、评估及预测不一致的研究报告。招商证券的销售人员、交易人员以及其他专业人士可能会依据不同的假设和标准,采用不同的分析方法而口头或书面发表与本资料意见不一致的市场评论或交易观点。
本公众号及其推送内容的版权归招商证券所有,招商证券对本公众号及其推送内容保留一切法律权利。未经招商证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。