【国盛金工 量价选股】逐笔买卖差异中的选股信息——条件成交不平衡因子

民生   财经   2024-10-10 08:15   上海  

研究摘要

前言:本文为国盛金工《“量价淘金”选股因子系列研究》的第八篇报告,基于逐笔成交数据的主买、主卖信息,构建有效的选股因子。

成交不平衡因子初探:计算每日的净买单强弱程度,初步构建成交不平衡因子。该因子的表现不佳,其中一项重要原因在于:若当月的净买单数量较多,通常情况下会造成股票的当月涨跌幅较高;而当月涨跌幅与未来涨跌幅呈现显著的负相关性,因此会削弱成交不平衡因子对未来收益的正向预测能力。基于上述分析,将成交不平衡因子对同期涨跌幅进行正交化处理,得到反转残差成交不平衡因子,稳定性可显著提升。

孤立与非孤立成交单的划分对于每一笔成交单,根据其成交时间点附近是否还存在其他的成交单,将其定义为孤立或者非孤立的成交。通常情况下,非孤立成交对应的市场信息更为丰富。

反转残差非孤立成交不平衡因子:对逐笔成交数据进行筛选,提取其中的非孤立成交单、计算买卖单不平衡指标,同样对同期涨跌幅做正交化处理,构建反转残差非孤立成交不平衡因子。回测期2017/01/01-2024/08/31内,在全体A股中,该因子的月度IC均值为0.048,年化ICIR为2.71;10分组多空对冲的年化收益为21.54%,信息比率为2.71,月度胜率为81.11%,最大回撤为6.88%。在剔除了市场常用风格和行业的影响后,纯净因子的稳定性可进一步提升,年化ICIR达到3.26,全市场10分组多空对冲的信息比率提升至3.05。

风险提示:以上结论均基于历史数据和统计模型的测算,如果未来市场环境发生明显改变,不排除模型失效的可能性。

报告原文下载链接:

https://pan.baidu.com/s/1pyO4jkOFffGYEnYb7Ycj_g? 

提取码:sqta


1. 前言

逐笔成交数据,即投资者在交易平台上实际成交的买卖订单数据,它们按照成交的时间顺序排列,并显示成交的价格、数量、方向等信息。‌该数据反映了每笔交易的具体细节,时间精度可达毫秒级别,可以帮助投资者更加深入地了解市场的微观结构。

图表2展示了平安银行(000001.SZ)在2024年8月30日的逐笔成交数据片段,其中有一列“方向”数据,列明了每一笔成交的买卖方向,标签为“B”代表这一笔成交为主动买入单,即对应着在这一笔成交中,买单是主动吃单方,卖单是挂单方、等待成交;标签为“S”则代表该笔成交为主动卖出单,即买单是挂单方、等待成交,而卖单是主动吃单方。这一“主买”或“主卖”的方向差异,在一定程度上反应了交易双方的激进程度以及对市场未来走势的预期差异,可以作为一项重要的观测指标

本文为国盛金工《“量价淘金”选股因子系列研究》的第八篇报告,将从逐笔成交数据入手,探索其中的投资者交易行为。具体地,我们聚焦上述提供主动买入、主动卖出信息的“方向”数据,基于逐笔成交的买卖差异,构建有效的选股因子。


2. 因子初探:成交不平衡因子

2.1 成交不平衡因子的构建

我们猜测,若股票过去一段时间的(主买单数量-主卖单数量)较多,则说明整体来看买方占据主动成交的优势,将导致股票未来收益也较高。基于此,构建初步的成交不平衡因子:

(1)每个交易日,统计每只股票当日所有逐笔成交中主动买入和主动卖出的成交单数,计算(主买成交单数-主卖成交单数)/ (主买成交单数+主卖成交单数),得到每日的成交单不平衡指标,用于衡量当日的净买单强弱程度;

(2)月底回看过去20个交易日,计算20日成交单不平衡指标的平均值,做横截面市值中性化处理,得到成交不平衡因子

以2017/01/01-2024/08/31为回测时间段,以全体A股(剔除其中的ST股、停牌股、上市未满60个交易日的次新股)为研究样本,成交不平衡因子的月度IC均值为0.029,年化ICIR为1.46,月度RankIC均值为0.028,年化RankICIR为1.13。

图表3展示了成交不平衡因子的10分组及多空对冲净值走势。该因子具有一定的有效性,但整体表现一般,尤其是最近几年的波动和回撤明显增大。整体来看,成交不平衡因子10分组多空对冲的年化收益为14.16%,年化波动为9.07%,信息比率为1.56,月度胜率为75.56%,最大回撤为7.06%。

2.2 剔除同期涨跌幅的影响:反转残差成交不平衡因子

我们认为,成交不平衡因子表现不佳的一项重要原因在于:若当月的(主买单数量-主卖单数量)较高,影响的不仅仅是股票的未来表现,必定已经对其当下表现产生影响,推动当期股票上涨。因此,我们直觉上猜测,买卖单强弱程度与同时段的涨跌幅存在相关性。经过测算发现,成交不平衡因子与同期反转因子(20日的累计涨跌幅)的横截面相关系数为17.59%,秩相关系数为32.19%,两者确实存在一定的正相关性。

更进一步,由于成交不平衡因子的IC为正,而反转因子的IC为负,但两者又呈正相关,因此反转因子会削弱成交不平衡因子对股票未来收益的正向预测能力,导致其效果不佳

基于上述分析,我们剔除同期涨跌幅对成交不平衡因子的影响:

(1)每个交易日,统计每只股票当日所有逐笔成交中主动买入和主动卖出的成交单数,计算(主买成交单数-主卖成交单数)/ (主买成交单数+主卖成交单数),得到每日的成交单不平衡指标;

(2)月底回看过去20个交易日,计算20日成交单不平衡指标的平均值,做横截面市值中性化处理,得到成交不平衡因子

(3)将成交不平衡因子,对过去20个交易日的累计涨跌幅进行正交化处理,得到反转残差成交不平衡因子

图表5展示了反转残差成交不平衡因子的10分组及多空对冲净值走势,图表6比较了成交不平衡因子、反转残差成交不平衡因子的各项绩效指标。回测发现,剔除当期涨跌幅的影响后,因子的稳定性明显提升,反转残差成交不平衡因子的月度IC均值为0.035,年化ICIR为2.13,月度RankIC均值为0.038,年化RankICIR为1.85;在全市场10分组多空对冲的年化收益为15.71%,年化波动为7.69%,信息比率为2.04,月度胜率为75.56%,最大回撤为5.69%。

3. 因子增强:条件成交不平衡因子

3.1 订单划分:孤立与非孤立成交

本节内容提出一种逐笔成交单的划分方式,并基于此方式对成交信息进行筛选与精炼,从而对前文的成交不平衡因子进行增强。

我们认为,非孤立的成交单通常由以下两种原因造成:

(1)某段时间内整个市场的交易非常火热,导致交易者下的订单都在短期内快速成交,相邻两个成交单之间的时间间隔自然很短;

(2)虽然整个市场交易比较冷淡,盘口上只有一些挂单等待成交,但在某个时间点突然有一个主动大单到达盘口,与多个对手方的挂单快速撮合,使得该主动大单被拆分成多个小单快速成交,那么这些小单互相之间必然也是非孤立的关系。

因此,通常情况下,非孤立成交单对应的时刻,要么整个市场的交易较为火热,要么存在一些较为激进的交易行为,无论何种原因,都意味着此时的交易数据中应当有更多的信息含量。

在利用孤立、非孤立成交的概念改进因子之前,我们先统计它们在一天中的分布情况。每个交易日,以5分钟为时间区间,计算每只股票在每个时间区间中的非孤立成交单占比(邻域参数暂取10毫秒),再对所有交易日的所有样本点求均值,得到图表8。可以发现,一天中随着时间的推移,非孤立成交单占比呈现略微的下降趋势、但整体变化不大,大部分时间,非孤立成交单占比都在70%左右,分布较为均匀。

3.2 孤立与非孤立成交不平衡因子的构建

基于前文分析,我们利于“孤立成交”与“非孤立成交”的概念,对每日的逐笔数据进行筛选,将原来的成交不平衡因子拆分为两个子因子:

(1)每个交易日,将当日所有成交单分为孤立成交、非孤立成交,判断某笔成交是否孤立的参数

(2)对当日所有的孤立成交单,计算其中(主买成交单数-主卖成交单数)/ (主买成交单数+主卖成交单数),得到孤立成交不平衡指标;类似地,得到非孤立成交不平衡指标;

(3)月底回看过去20个交易日,分别计算20日孤立、非孤立成交不平衡指标的平均值,做横截面市值中性化处理,得到两个因子:孤立成交不平衡因子、非孤立成交不平衡因子

图表9、图表10分别展示了孤立、非孤立成交不平衡因子的10分组及多空对冲净值走势,图表11则汇总比较了成交不平衡、孤立成交不平衡、非孤立成交不平衡这3个因子的各项绩效指标。

与前文的理论判断一致,孤立成交时刻的信息含量较少,因此对应的孤立成交不平衡因子几乎没有选股效果,IC接近于0;而非孤立成交不平衡因子的表现明显更好,IC略高于整体的成交不平衡因子,稳定性与整体成交不平衡因子相差不大

3.3 剔除同期涨跌幅的影响:反转残差非孤立成交不平衡因子

测算条件成交不平衡因子与同期涨跌幅的相关系数,可以发现它们仍然存在一定的相关性:孤立成交不平衡因子与20日累计涨跌幅的相关系数为-21.47%,秩相关系数为-20.59%;非孤立成交不平衡因子与20日累计涨跌幅的相关系数为33.44%,秩相关系数为45.99%,两者高度正相关,表明非孤立成交不平衡因子的表现严重受到当期涨跌幅的拖累。

因此,我们同样将条件成交不平衡因子,对过去20个交易日的累计涨跌幅进行正交化处理,得到反转残差孤立成交不平衡因子、反转残差非孤立成交不平衡因子

图表12、图表13分别展示了上述两个因子的10分组及多空对冲净值走势,图表14汇总比较了反转残差成交不平衡、反转残差孤立成交不平衡、反转残差非孤立成交不平衡这3个因子的各项绩效指标。可以发现,孤立成交单对应的因子效果仍然较弱,月度IC均值仅为-0.015;非孤立成交单对应的因子则表现较强,且相比于原来的整体因子,绩效指标有显著提升。

整体来看,回测时间段2017/01/01-2024/08/31内,以全体A股为研究样本,反转残差非孤立成交不平衡因子的月度IC均值为0.048,年化ICIR为2.71,月度RankIC均值为0.053,年化RankICIR为2.48;10分组多空对冲的年化收益为21.54%,年化波动为7.94%,信息比率为2.71,月度胜率为81.11%,最大回撤为6.88%。图表15汇报了其各年度的表现情况。


4. 其他重要讨论

4.1 纯净反转残差非孤立成交不平衡因子

得到了选股效果不错的新因子后,我们考察其与市场常用风格因子的相关性。图表16展示了反转残差非孤立成交不平衡因子与10个Barra风格因子的相关系数,可以看到,新因子与Barra风格因子的相关性较低,相关系数的绝对值均小于0.10。

为了剔除市场常用风格和行业的干扰,我们每月月底将反转残差非孤立成交不平衡因子对Barra风格因子和中信一级行业虚拟变量进行回归,取残差作为纯净因子,检验其选股效果。图表17展示了纯净因子在全体A股中的10分组及多空对冲净值走势,图表18则汇报了其分年度的表现情况。

剔除常用风格与行业的影响后,因子的稳定性有所提升。纯净反转残差非孤立成交不平衡因子的年化ICIR可达到3.26,全市场10分组多空对冲的年化收益为15.26%,年化波动为5.00%,信息比率为3.05,月度胜率为77.78%,最大回撤为2.60%

4.2 参数敏感性测试

本文涉及的参数主要有以下两项:

(1)在定义孤立、非孤立成交时,邻域参数的取值(前文测算均取为10ms);

(2)在构造最终的月度选股因子时,回看过去N个交易日求均值(前文测算均回看过去20日)。

图表19展示了在每月月底回看过去20个交易日的情况下,参数取不同数值时,反转残差非孤立成交不平衡因子的各项绩效指标。可以看到,随着的逐渐增大,因子的效果逐渐衰减。这一现象符合预期,因为若的取值较大,则几乎所有的成交单都会被划分为非孤立成交,那么我们提出孤立与非孤立的概念对信息进行筛选,将会变得没有意义,最终因子的效果也会与最初不进行订单划分的整体成交不平衡因子较为接近。

图表20展示了邻域参数取10ms的时候,在每月月底不同回看天数下,反转残差非孤立成交不平衡因子的各项绩效指标。根据以往经验,量价因子的最优回看天数往往与换仓周期相匹配,由于我们的测试频率为月度换仓,因此回看天数为20日左右时,因子的表现相对较强,随着回看天数的逐渐增加,因子效果略有下降。但整体来看,回看天数对因子的影响较小,不同回看天数下,因子的表现都较为稳健。

4.3 其他样本空间的表现

本小节内容检验反转残差非孤立成交不平衡因子在不同样本空间的表现。以回看20日、邻域参数取10ms为例,图表21、图表22分别展示了原始因子、纯净因子(做风格与行业中性化处理)在沪深300、中证500、中证1000、国证2000成分股中的回测效果。

反转残差非孤立成交不平衡因子在不同样本空间均有一定的选股效果,且在中性化之后仍然有效。根据以往经验,大部分量价因子在大市值股票池中的表现较差,但反转残差非孤立成交不平衡因子在沪深300成分股中也有不错的选股能力,月度IC均值可达到4%-5%左右

5. 总结

本文为国盛金工《“量价淘金”选股因子系列研究》的第八篇报告,基于逐笔成交数据的主买、主卖信息,分析其中的投资者交易行为,构建有效的选股因子。

首先我们猜测,若股票过去一段时间的(主买单数量-主卖单数量)较多,则说明整体来看买方占据主动成交的优势,将导致股票未来收益也较高。因此,我们计算每日的(主买成交单数-主卖成交单数)/ (主买成交单数+主卖成交单数),衡量当日的净买单强弱程度,构建初步的成交不平衡因子

回测发现,成交不平衡因子的表现不佳,我们分析其中一项重要原因在于:若当月的净买单数量较多,大概率会推动当期股价上涨,造成股票的当月涨跌幅较高;而当月涨跌幅与未来涨跌幅呈现显著的负相关性,因此会削弱成交不平衡因子对股票未来收益的正向预测能力。基于上述分析,我们将成交不平衡因子对同期涨跌幅进行正交化处理,得到反转残差成交不平衡因子,稳定性显著提升。

更进一步,本文提出一种对逐笔成交数据进行划分的方式,对于每一笔成交单,根据其成交时间点附近是否还存在其他的成交单,将其定义为孤立或者非孤立的成交。通常情况下,非孤立成交单对应的市场交易信息更为丰富,因此我们对逐笔成交数据进行筛选,只提取其中的非孤立成交单、计算净买单强弱指标,同样对同期涨跌幅做正交化处理,构建反转残差非孤立成交不平衡因子

回测期2017/01/01-2024/08/31内,在全体A股中,反转残差非孤立成交不平衡因子的月度IC均值为0.048,年化ICIR为2.71,月度RankIC均值为0.053,年化RankICIR为2.48;10分组多空对冲的年化收益为21.54%,年化波动为7.94%,信息比率为2.71,月度胜率为81.11%,最大回撤为6.88%。在剔除了市场常用风格和行业的影响后,纯净因子的效果可进一步提升,年化ICIR达到3.26,全市场10分组多空对冲的信息比率提升至3.05

风险提示

以上结论均基于历史数据和统计模型的测算,如果未来市场环境发生明显改变,不排除模型失效的可能性。


具体分析详见国盛证券研究所2024年10月9日发布的报告《“量价淘金”选股因子系列研究(八):逐笔买卖差异中的选股信息——条件成交不平衡因子》。

沈芷琦  S0680521120005  shenzhiqi@gszq.com

刘富兵  S0680518030007  liufubing@gszq.com

阮俊烨  S0680124070019  ruanjunye@gszq.com


特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。


重要声明:本订阅号是国盛证券金融工程团队设立的。本订阅号不是国盛金融工程团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。


本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。


版权所有,未经许可禁止转载或传播。












留富兵法
从量化的视角去看市场,用金融工程的思维去解决问题
 最新文章