【广发金工】牛市中的市价订单与相关因子

财富   2025-01-13 10:49   广东  
广发证券首席金工分析师 安宁宁

SAC: S0260512020003

anningning@gf.com.cn

联系人:广发证券金工研究员 林涛

gflintao@gf.com.cn

广发金工安宁宁陈原文团队

摘要


数据制胜:

如何能在股票市场的博弈中胜出?对于量化投资者来说,关键在于对数据的全面收集,并结合数学模型和算法进行深入分析,从海量数据中挖掘出隐藏的市场规律。

交易机制与订单类型:

按照交易机制,证券市场主要可分为订单驱动市场和报价驱动市场两种。中国沪深交易所采用的是订单驱动交易机制,即交易是基于买卖双方提交的订单来撮合完成的。订单驱动市场通过限价单和市价单等订单类型来实现交易的执行。
限价订单是指投资者设定一个指定价格,只有当市场价格达到或超过这一价格时,订单才会被执行。在中国A股市场中,绝大部分的订单类型为限价订单。
市价订单则是指提交订单时以当时订单簿中最优价格完成交易,其撮合顺序将优于限价订单,所以市价单的执行可能性大于限价订单,也不像限价单那样具有较高的逆向选择成本。当市场参与者的成交意愿十分强烈时,提交市价订单是成交机会最高的订单方式。

市价订单占比:

在2024/09/18~2024/09/30期间,市价单占比快速上升,在2024/09/30达到市价单占比的峰值,是历史均值的2倍以上。进一步对市价单中的买卖力量进行统计,在2024/09/30深证A股的市价单中,买单占比达到峰值66%;在沪深300、中证500、中证800、中证1000板块内的占比更是分别高达77%、85%、82%和90%,表明了市场参与者对于买入的决心。

市价订单相关因子:

本文不仅利用Level 2逐笔订单数据对市价订单进行统计,而且构建出了8个市价订单相关因子。市价订单因子与大小单因子、长短单因子、集合竞价因子、Barra风格因子的相关性均较低,是一组较为独立的因子。
在深证A股内,2019年3月至2024年9月期间,采用5日平滑因子以20日换仓进行选股,其中6个因子的RankIC均值大于6.0%,胜率大于70%。其中,MarketSellOrder_LimitSellOrder_ratio因子的选股性能最优,分档组合收益的单调性显著,其RankIC均值为-6.6%、胜率为25%,根据该因子构建的Top-30组合在双边千三计费后的年化收益率为13.66%、最大回撤率为36.72%、夏普比率为0.56,相比同期的深证A指指数取得了7.57%的超额年化收益率。

风险提示:

(1)本文所述模型用量化方法通过历史数据统计、建模和测算完成,所得结论与规律在市场政策、环境变化时存在失效风险;(2)本文策略在市场结构及交易行为改变时有可能存在失效风险;(3)因量化模型不同,本文提出的观点可能与其他量化模型结论存在差异。

一、Level 1与Level 2行情数据介绍


如何能在股票市场的博弈中胜出?关键在于对市场信息的掌握和对市场规律的理解。对于量化投资者来说,更在于对数据的全面收集和深度分析,并结合数学模型和算法,从海量数据中挖掘出隐藏的市场规律。这些规律可能是某些股票价格的趋势,市场的周期性波动,抑或是短期的交易信号。一旦这些规律被发现并加以利用,量化投资者便能在股票市场的博弈中获得优势。
股票行情数据源于上交所和深交所,根据数据的频率和丰富度通常分为Level 1数据和Level 2数据。如表1所示,Level 1数据为3秒一笔的快照(Snapshot)数据,包含了常用行情软件上可以看到的最高价、最低价、开盘价、收盘价、成交量、成交额、成交笔数、委买委卖量、5档申买申卖价、5档申买申卖量等数据。而相比数据频率较低、数据丰富度有限的Level 1数据,Level 2数据中则不仅提供了更为丰富的快照(Snapshot)数据,如10档申买申卖价、10档申买申卖量、最优买卖价前50笔委托、买卖委托价位数、买卖撤单信息等,而且提供了Level 1数据中所不包含的逐笔订单(Tick)数据。逐笔订单数据包含了当日交易时段中集合竞价阶段和连续竞价阶段的每一笔订单数据,其中的关键信息包括精确到毫秒的订单时间、逐笔序号、频道代码、价格、数量、金额、买入卖出订单号和订单类别等详细数据。Level 2数据中的逐笔订单数据是一切行情数据的根源,不同频率的快照数据均由逐笔订单数据聚合而成。在“海量Level 2数据因子挖掘”系列研究报告中,将尝试对Level 2数据中详细的快照数据和逐笔订单数据进行深入分析并加以利用,有望能够从中获得更为丰富的价格趋势、周期波动、交易信号等规律和信息,从而挖掘出更为有效的因子,构建出具有超额收益的股票投资组合。

二、相关研究工作


三、市场机制与订单类型


(一)订单驱动市场与报价驱动市场

证券市场的交易机制主要分为订单驱动市场(Order-driven Market)和报价驱动市场(Quote-driven Market)两种。订单驱动市场是基于买卖双方的订单撮合来完成交易的市场。这种市场的特征是买家和卖家直接提交买入或卖出订单,并且按照预定的规则(通常是价格优先和时间优先)撮合成交。报价驱动市场则是依靠做市商(Market Makers)来提供持续的买卖报价,并通过这些报价进行交易的市场。在这种市场中,做市商是重要的中介,他们通过提供买入价和卖出价来维持市场的流动性。订单驱动市场和报价驱动市场的特点对比如下表所示:

(二)限价订单与市价订单

中国沪深交易所采用的是订单驱动交易机制,即交易是基于买卖双方提交的订单来撮合完成的。市场没有专门的做市商提供持续报价,价格是根据投资者提交的订单自动形成的。沪深交易所作为订单驱动市场,允许投资者通过限价单和市价单进行交易。限价单提供了价格控制,但未必能够立即成交;市价单保证了快速成交,但价格可能不确定。这两种订单类型反映了订单驱动市场中供需双方的自发交易机制,也为投资者提供了灵活的交易策略选择。
限价单是指投资者设定一个指定价格,只有当市场价格达到或超过这一价格时,订单才会被执行。买入限价单会在指定价格或更低的价格成交,卖出限价单会在指定价格或更高的价格成交。限价单的优势是允许投资者指定期望的成交价格,从而在交易中更好地控制风险。但如果市场价格未达到限价单的设定价格,订单可能无法成交。举一个例子,假如投资者希望买入某股票,当前市场价格为10元,但交易者不愿以超过9.5元的价格买入,则可以提交一个9.5元的买入限价单。当市场价格跌至9.5元或更低时,订单才会成交。对于卖出订单而言亦然。在中国A股市场中,绝大部分的订单类型为限价订单。
市价单是指投资者希望立即以当前市场价格完成交易,因此不指定具体的成交价格。市价单的目的是确保订单立即执行,而不是追求某个特定的价格。在对手单充足的情况下,市价单通常会立即按当前市场最优价格成交。市价单通常可以确保成交,但实际成交价格可能会与预期有所不同,尤其是在市场波动较大的时候。如果某股票当前的买入价为10元,卖出价为10.2元,投资者提交市价买入单,则该单将以10.2元的价格立即成交,而不是等待价格回落到特定的水平。

四、中国A股市场的市价订单统计概况

按照大家的共识,在中国A股市场中,绝大部分的订单类型是限价订单,通常只有一小部分订单是市价订单。但市价订单的具体占比是多少?在不同年份的占比有何变化?在不同板块的占比区别如何?在本小节中,将通过Level 2逐笔订单数据中的订单类型信息,对市价订单进行完整的统计,解答以上问题。(值得注意的是,在沪深交易所披露的Level 2逐笔订单数据中,只有深交所对每笔委托订单的限价单/市价单类型进行了标注,而上交所并未提供该信息,因此本文聚焦于深交所范围内的个股展开研究)
下图1统计了深证A股中2019年3月~2024年9月的市价单占比情况。整体而言,市价单的占比较小,各板块各年份的市价单占比均在0.5%以下。在不包含上证A股的分板块统计中,沪深300、中证500作为A股市场中市值最大、流动性最好的成分股,其市价单占比略高于其他板块。
下图2统计了深证A股中2024年9月18日~2024年9月30日期间的每日市价单占比情况。在这几天中,市价单占比快速上升,在2024年9月30日达到市价单占比的峰值,是历史均值的2倍以上。但沪深300、中证500、中证800的市价单占比峰值并非出现在2024年9月30日,而是出现在2024年9月24日及26日。
下图3统计了在2019年3月~2024年9月期间,深证A股市价单中的买单占比情况。可以看出,在2019~2023年间,深证A股市价单中的买单占比均小于50%,表明深证A股市价单中的卖单多于买单。而在2024年期间,深证A股市价单中的买单占比有所上升,在沪深300、中证500、中证800、中证1000内大于50%,大于卖单占比。
下图4统计了深证A股中2024年9月18日~2024年9月30日期间,每日市价单中的买单占比情况。在这几天中,市价单中的买单占比快速上升。在沪深300、中证500、中证800、中证1000板块内的深证A股中,市价单中的买单占比一度超过80%,远远高于历史平均值,表明了市场参与者对于买入的决心。

五、市价订单相关因子定义


本文不仅利用Level 2逐笔订单数据对市价订单进行统计,而且构建出了8个市价订单相关因子。因子定义如下表4所示。

由于上交所Level 2逐笔订单数据中并未对订单的市价/限价类别进行标记,因此本文针对深证A股范围构建了上述8个市价单相关因子,并对其在2019年3月~2024年9月期间的深证A股范围内的选股性能进行了统计,结果如下表5所示。整体而言,5日平滑因子以20日进行换仓的选股性能最优,其中6个因子的RankIC均值大于6.0%,胜率大于70%。

下表6统计了市价单因子和前序报告《多维度解耦的94个大小单因子》中部分高相关性大小单因子之间的相关性,两类因子之间的相关系数在-13%~10%之间,相关性较低。整体而言,虽然同样作为Level 2逐笔订单数据构建的因子,市价单因子是一组相较于大小单因子高度独立的因子。

下表7统计了市价单因子和前序报告《订单维度解耦的22个大小单因子》中部分高相关性长短单因子之间的相关性,两类因子之间的相关系数在-19%~20%之间,相关性较低。整体而言,虽然同样作为Level 2逐笔订单数据构建的因子,市价单因子是一组相较于长短单因子较为独立的因子。

下表8统计了市价单因子和前序报告《集合竞价相关因子》中部分高相关性集合竞价因子之间的相关性,两类因子之间的相关系数在1%~27%之间,相关性较低。整体而言,虽然同样作为Level 2逐笔订单数据构建的因子,市价单因子是一组相较于集合竞价因子较为独立的因子。

下表9统计了市价单因子和Barra风格因子之间的相关性,两类因子之间的相关系数在-7%~23%之间,相关性较低。其中,相关性最高的三个Barra风格因子分别为流动性因子、波动率因子、市值因子。

六、市价单因子选股表现


本小节对上述8个市价单因子在深证A股范围内构建股票组合,测试其选股性能。结合因子的多头表现情况,这里采用因子的5日滚动均值,每20个交易日进行换仓。实证分析结果表明,市价单因子取得了较为出色的表现。
选股范围:深证A股
股票预处理:剔除摘牌、ST/*ST、涨跌停、上市未满一年股票
回测区间:2019年3月~2024年9月
回测路径:以多路径回测均值作为统计数据
组合构建:采用因子值排序后的前K个股票构建Top-K组合
调仓策略:每20个交易日,根据t日因子值以t+1日均价买入,t+21日均价卖出
交易费率:双边千分之三(卖出时收取)

(一)MarketOrder_ratio因子表现

MarketOrder_ratio因子在深证A股的20档分档收益如图5所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图6和表10所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了5.91%、5.89%、5.78%、6.00%、6.19%的超额年化收益率。



(二)MarketOrder_LimitOrder_ratio因子表现

MarketOrder_LimitOrder_ratio因子在深证A股的20档分档收益如图7所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图8和表11所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了5.91%、5.89%、5.78%、6.00%、6.20%的超额年化收益率。



(三)MarketBuyOrder_MarketOrder_ratio因子表现

MarketBuyOrder_MarketOrder_ratio因子在深证A股的20档分档收益如图9所示,分档组合收益呈现出两头高、中间低的独特走势。这说明在市价订单中,当买卖订单委托量出现失衡时,则该个股在未来有更大的可能性上涨。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图10和表12所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了3.92%、3.33%、2.74%、2.27%、1.71%的超额年化收益率。



(四)MarketBuyOrder_LimitBuyOrder_ratio因子表现

MarketBuyOrder_LimitBuyOrder_ratio因子在深证A股的20档分档收益如图11所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图12和表13所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了6.51%、6.65%、6.51%、6.22%、5.69%的超额年化收益率。



(五)MarketBuyOrder_LimitSellOrder_ratio因子表现

MarketBuyOrder_LimitSellOrder_ratio因子在深证A股的20档分档收益如图13所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图14和表14所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了6.09%、6.67%、6.52%、6.02%、5.70%的超额年化收益率。



(六)MarketSellOrder_LimitBuyOrder_ratio因子表现

MarketSellOrder_LimitBuyOrder_ratio因子在深证A股的20档分档收益如图15所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图16和表15所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了7.50%、7.46%、7.15%、6.79%、6.53%的超额年化收益率。



(七)MarketSellOrder_LimitSellOrder_ratio因子表现

MarketSellOrder_LimitSellOrder_ratio因子在深证A股的20档分档收益如图17所示,分档组合收益呈现出较好的单调性。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图18和表16所示。在2019年3月~2024年9月期间,各组合相对深证A指指数分别取得了7.57%、7.26%、7.16%、6.84%、6.65%的超额年化收益率。



(八)LimitBuyOrder_LimitOrder_ratio因子表现

LimitBuyOrder_LimitOrder_ratio因子在深证A股的20档分档收益如图19所示,从分档结果来看该因子几乎没有选股能力。以因子值对深证A指成分股进行排序,分别取Top-30、50、100、150、200个股票构建组合进行测算,结果如图20和表17所示。在2019年3月~2024年9月期间,各组合相对深证A指指数均取得了负的超额年化收益率,表明该因子无效。



七、总结与展望


如何能在股票市场的博弈中胜出?对于量化投资者来说,关键在于对数据的全面收集,并结合数学模型和算法进行深入分析,从海量数据中挖掘出隐藏的市场规律。Level 1行情数据为3秒一笔的快照(Snapshot)数据,包含了简单的开高低收交易量交易金额等常规数据,所含信息有限。而相比数据频率较低、数据丰富度有限的Level 1数据,Level 2数据中则不仅提供了更为丰富的快照(Snapshot)数据,如10档申买申卖价、10档申买申卖量、最优买卖价前50笔委托、买卖委托价位数、买卖撤单信息等,而且提供了Level 1数据中所不包含的逐笔订单(Tick)数据。
按照交易机制,证券市场主要可分为订单驱动市场和报价驱动市场两种。中国沪深交易所采用的是订单驱动交易机制,即交易是基于买卖双方提交的订单来撮合完成的。订单驱动市场通过限价单和市价单等订单类型来实现交易的执行。
限价订单是指投资者设定一个指定价格,只有当市场价格达到或超过这一价格时,订单才会被执行。在中国A股市场中,绝大部分的订单类型为限价订单。
市价订单则是指提交订单时以当时订单簿中最优价格完成交易,其撮合顺序将优于限价订单,所以市价单的执行可能性大于限价订单,也不像限价单那样具有较高的逆向选择成本。当市场参与者的成交意愿十分强烈时,提交市价订单是成交机会最高的订单方式。
在2024/09/18~2024/09/30期间,市价单占比快速上升,在2024/09/30达到市价单占比的峰值,是历史均值的2倍以上。进一步对市价单中的买卖力量进行统计,在2024/09/30,深证A股的市价单中买单占比达到峰值66%,而在沪深300、中证500、中证800、中证1000板块内的占比更是分别高达77%、85%、82%和90%,表明了市场参与者对于买入的决心。
本文不仅利用Level 2逐笔订单数据对市价订单进行统计,而且构建出了8个市价订单相关因子。市价订单因子与大小单因子、长短单因子、集合竞价因子、Barra风格因子的相关性均较低,是一组较为独立的因子。
在深证A股内,2019年3月至2024年9月期间,采用5日平滑因子以20日换仓进行选股,其中6个因子的RankIC均值大于6.0%,胜率大于70%。其中,MarketSellOrder_LimitSellOrder_ratio因子的选股性能最优,分档组合收益的单调性显著,其RankIC均值为-6.6%、胜率为25%,根据该因子构建的Top-30组合在双边千三计费后的年化收益率为13.66%、最大回撤率为36.72%、夏普比率为0.56,相比同期的深证A指指数取得了7.57%的超额年化收益率。
展望未来,“海量Level 2数据因子挖掘”系列研究报告将继续深入Level 2数据,从海量数据中挖掘出隐藏的市场规律,构建出更多的有效因子。

八、风险提示


本文所述模型用量化方法通过历史数据统计、建模和测算完成,所得结论与规律在市场政策、环境变化时存在失效风险;
本文策略在市场结构及交易行为改变时有可能存在失效风险;
因量化模型不同,本文提出的观点可能与其他量化模型结论存在差异。
相关研究报告
【广发金工】海量Level 2数据因子挖掘系列(一):多维度解耦的94个大小单因子
【广发金工】海量Level 2数据因子挖掘系列(二):订单维度解耦的22个长短单因子
【广发金工】海量Level 2数据因子挖掘系列(三):大小单与长短单的241个碰撞火花
【广发金工】海量Level 2数据因子挖掘系列(四):集合竞价相关因子


法律声明:
本微信号推送内容仅供广发证券股份有限公司(下称“广发证券”)客户参考,其他的任何读者在订阅本微信号前,请自行评估接收相关推送内容的适当性,广发证券不会因订阅本微信号的行为或者收到、阅读本微信号推送内容而视相关人员为客户。
完整的投资观点应以广发证券研究所发布的完整报告为准。完整报告所载资料的来源及观点的出处皆被广发证券认为可靠,但广发证券不对其准确性或完整性做出任何保证,报告内容亦仅供参考。
在任何情况下,本微信号所推送信息或所表述的意见并不构成对任何人的投资建议。除非法律法规有明确规定,在任何情况下广发证券不对因使用本微信号的内容而引致的任何损失承担任何责任。读者不应以本微信号推送内容取代其独立判断或仅根据本微信号推送内容做出决策。
本微信号推送内容仅反映广发证券研究人员于发出完整报告当日的判断,可随时更改且不予通告。
本微信号及其推送内容的版权归广发证券所有,广发证券对本微信号及其推送内容保留一切法律权利。未经广发证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。



广发金融工程研究
定期发布团队最新研究成果及观点,欢迎交流!
 最新文章