本文不仅利用Level 2逐笔订单数据对市价订单进行统计,而且构建出了8个市价订单相关因子。因子定义如下表4所示。
由于上交所Level 2逐笔订单数据中并未对订单的市价/限价类别进行标记,因此本文针对深证A股范围构建了上述8个市价单相关因子,并对其在2019年3月~2024年9月期间的深证A股范围内的选股性能进行了统计,结果如下表5所示。整体而言,5日平滑因子以20日进行换仓的选股性能最优,其中6个因子的RankIC均值大于6.0%,胜率大于70%。
下表6统计了市价单因子和前序报告《多维度解耦的94个大小单因子》中部分高相关性大小单因子之间的相关性,两类因子之间的相关系数在-13%~10%之间,相关性较低。整体而言,虽然同样作为Level 2逐笔订单数据构建的因子,市价单因子是一组相较于大小单因子高度独立的因子。
下表7统计了市价单因子和前序报告《订单维度解耦的22个大小单因子》中部分高相关性长短单因子之间的相关性,两类因子之间的相关系数在-19%~20%之间,相关性较低。整体而言,虽然同样作为Level 2逐笔订单数据构建的因子,市价单因子是一组相较于长短单因子较为独立的因子。
下表8统计了市价单因子和前序报告《集合竞价相关因子》中部分高相关性集合竞价因子之间的相关性,两类因子之间的相关系数在1%~27%之间,相关性较低。整体而言,虽然同样作为Level 2逐笔订单数据构建的因子,市价单因子是一组相较于集合竞价因子较为独立的因子。
下表9统计了市价单因子和Barra风格因子之间的相关性,两类因子之间的相关系数在-7%~23%之间,相关性较低。其中,相关性最高的三个Barra风格因子分别为流动性因子、波动率因子、市值因子。
本小节对上述8个市价单因子在深证A股范围内构建股票组合,测试其选股性能。结合因子的多头表现情况,这里采用因子的5日滚动均值,每20个交易日进行换仓。实证分析结果表明,市价单因子取得了较为出色的表现。股票预处理:剔除摘牌、ST/*ST、涨跌停、上市未满一年股票组合构建:采用因子值排序后的前K个股票构建Top-K组合调仓策略:每20个交易日,根据t日因子值以t+1日均价买入,t+21日均价卖出(一)MarketOrder_ratio因子表现
MarketOrder_ratio因子在深证A股的20档分档收益如图5所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图6和表10所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了5.91%、5.89%、5.78%、6.00%、6.19%的超额年化收益率。
(二)MarketOrder_LimitOrder_ratio因子表现
MarketOrder_LimitOrder_ratio因子在深证A股的20档分档收益如图7所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图8和表11所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了5.91%、5.89%、5.78%、6.00%、6.20%的超额年化收益率。(三)MarketBuyOrder_MarketOrder_ratio因子表现
MarketBuyOrder_MarketOrder_ratio因子在深证A股的20档分档收益如图9所示,分档组合收益呈现出两头高、中间低的独特走势。这说明在市价订单中,当买卖订单委托量出现失衡时,则该个股在未来有更大的可能性上涨。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图10和表12所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了3.92%、3.33%、2.74%、2.27%、1.71%的超额年化收益率。(四)MarketBuyOrder_LimitBuyOrder_ratio因子表现
MarketBuyOrder_LimitBuyOrder_ratio因子在深证A股的20档分档收益如图11所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图12和表13所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了6.51%、6.65%、6.51%、6.22%、5.69%的超额年化收益率。(五)MarketBuyOrder_LimitSellOrder_ratio因子表现
MarketBuyOrder_LimitSellOrder_ratio因子在深证A股的20档分档收益如图13所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图14和表14所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了6.09%、6.67%、6.52%、6.02%、5.70%的超额年化收益率。(六)MarketSellOrder_LimitBuyOrder_ratio因子表现
MarketSellOrder_LimitBuyOrder_ratio因子在深证A股的20档分档收益如图15所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图16和表15所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了7.50%、7.46%、7.15%、6.79%、6.53%的超额年化收益率。(七)MarketSellOrder_LimitSellOrder_ratio因子表现
MarketSellOrder_LimitSellOrder_ratio因子在深证A股的20档分档收益如图17所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图18和表16所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了7.57%、7.26%、7.16%、6.84%、6.65%的超额年化收益率。(八)LimitBuyOrder_LimitOrder_ratio因子表现
LimitBuyOrder_LimitOrder_ratio因子在深证A股的20档分档收益如图19所示,从分档结果来看该因子几乎没有选股能力。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图20和表17所示。在2019年3月~2024年9月期间,各组合相对深证A指指数均取得了负的超额年化收益率,表明该因子无效。如何能在股票市场的博弈中胜出?对于量化投资者来说,关键在于对数据的全面收集,并结合数学模型和算法进行深入分析,从海量数据中挖掘出隐藏的市场规律。Level 1行情数据为3秒一笔的快照(Snapshot)数据,包含了简单的开高低收交易量交易金额等常规数据,所含信息有限。而相比数据频率较低、数据丰富度有限的Level 1数据,Level 2数据中则不仅提供了更为丰富的快照(Snapshot)数据,如10档申买申卖价、10档申买申卖量、最优买卖价前50笔委托、买卖委托价位数、买卖撤单信息等,而且提供了Level 1数据中所不包含的逐笔订单(Tick)数据。按照交易机制,证券市场主要可分为订单驱动市场和报价驱动市场两种。中国沪深交易所采用的是订单驱动交易机制,即交易是基于买卖双方提交的订单来撮合完成的。订单驱动市场通过限价单和市价单等订单类型来实现交易的执行。限价订单是指投资者设定一个指定价格,只有当市场价格达到或超过这一价格时,订单才会被执行。在中国A股市场中,绝大部分的订单类型为限价订单。市价订单则是指提交订单时以当时订单簿中最优价格完成交易,其撮合顺序将优于限价订单,所以市价单的执行可能性大于限价订单,也不像限价单那样具有较高的逆向选择成本。当市场参与者的成交意愿十分强烈时,提交市价订单是成交机会最高的订单方式。在2024/09/18~2024/09/30期间,市价单占比快速上升,在2024/09/30达到市价单占比的峰值,是历史均值的2倍以上。进一步对市价单中的买卖力量进行统计,在2024/09/30,深证A股的市价单中买单占比达到峰值66%,而在沪深300、中证500、中证800、中证1000板块内的占比更是分别高达77%、85%、82%和90%,表明了市场参与者对于买入的决心。本文不仅利用Level 2逐笔订单数据对市价订单进行统计,而且构建出了8个市价订单相关因子。市价订单因子与大小单因子、长短单因子、集合竞价因子、Barra风格因子的相关性均较低,是一组较为独立的因子。在深证A股内,2019年3月至2024年9月期间,采用5日平滑因子以20日换仓进行选股,其中6个因子的RankIC均值大于6.0%,胜率大于70%。其中,MarketSellOrder_LimitSellOrder_ratio因子的选股性能最优,分档组合收益的单调性显著,其RankIC均值为-6.6%、胜率为25%,根据该因子构建的Top-30组合在双边千三计费后的年化收益率为13.66%、最大回撤率为36.72%、夏普比率为0.56,相比同期的深证A指指数取得了7.57%的超额年化收益率。展望未来,“海量Level 2数据因子挖掘”系列研究报告将继续深入Level 2数据,从海量数据中挖掘出隐藏的市场规律,构建出更多的有效因子。本文所述模型用量化方法通过历史数据统计、建模和测算完成,所得结论与规律在市场政策、环境变化时存在失效风险;本文策略在市场结构及交易行为改变时有可能存在失效风险;因量化模型不同,本文提出的观点可能与其他量化模型结论存在差异。