【广发金工】2024精选深度报告系列之九:资本利得突出量的多频率测算

财富   财经   2024-09-13 07:37   广东  


摘 要

处置效应与前景理论。

投资者在投资股票时,倾向卖出盈利的股票、继续持有亏损的股票,这就是行为金融学上的处置效应。处置效应导致了当投资者处于盈利状态时是风险回避者,而处于亏损状态时则是风险追求者。Kahneman和Tversky提出了前景理论解释了这种现象,创造性地提出了左凸右凹的价值函数,挑战了传统金融学设定的投资者全局风险厌恶的假设。


资本利得突出量(CGO)因子。

基于过去N日成交均价按照换手率加权平均,定义了个股的参考价格(RP)和资本利得突出量。报告尝试引入分钟线数据,探讨对比低频和高频数据维度的CGO因子在选股中的应用效果。


低频因子实证分析。

周频全市场选股方式下,CGO因子的IC均值为-4.2%,多空年化收益为28%,其中多头年化收益为18.8%,十分组下多头组收益相对突出。调整因子计算的回溯周期,回溯周期20、50和100天的IC、因子收益等特征相对一致,但较短周期下的因子单调性相对不足。


高频因子实证分析。

周频全市场选股方式下,回溯5天的因子有相对较好的市场表现,CGO因子的IC均值为-4.4%,IC胜率为61.6%,多空年化收益为37%,夏普比率为2.27。行业市值中性化后,因子表现进一步增厚,多空年化收益为40%,夏普比率为3.56。


进一步检验。

相关性方面,因子和风格因子的相关性总体较小,因子内部而言,在因子计算中的时间回溯周期等内容的影响相对更大。分域选股维度,低频因子方面,相对而言,因子在相对小盘的股票池中的有效性相对更好;高频因子方面,因子在沪深300股票池中的回测IC相对更高,多头组的区分度更加突出。


风险提示。

本专题报告所述模型用量化方法通过历史数据统计、建模和测算完成,所得结论与规律在市场政策、环境变化时可能存在失效风险;策略在市场结构及交易行为的改变时有可能存在策略失效风险;因量化模型不同,本报告提出的观点可能与其他量化模型结论存在差异。




正 文

一、研究背景

(一)行为金融学研究

传统金融市场理论通常假设市场上的每个投资者都是完全理性的,都能高效地获取并分析市场信息,并做出最优决策。然而,现实中的金融市场往往是非理性的,在A股市场上,个人投资者占比较高,卖空存在限制,股价异象繁生。在这种情况下,行为金融理论异军突起,从投资者的实际决策心理出发,较为系统地对现代主流金融理论提出挑战并有效地解释了众多市场异常行为。
行为金融学,从微观个体行为以及产生这种行为的心理等动因来解释、研究和预测市场的发展。自20世纪80年代起,行为金融学逐步发展,越来越多的结论在市场上得到了定量化的论证。这些学术成果其实都可以尝试转化为有效的Alpha来源。
有效市场假说认为,当投资者的信息处理能力得以自由施展时,新信息能够被迅速且有效地吸纳,并纳入资产价格之中。然而,由于人类智力存在固有的有限性,注意力在认知活动中扮演着一项受限制的资源角色(Kahneman,1979)。随后的研究揭示,在实际情境中,投资者,特别是个人投资者,受限于有限的注意力,因而未能充分参与信息的处理与评估。
我们认识到,市场风格可能随时失效,但个体的非理性行为永远存在。从行为金融角度挖掘Alpha因子,规避市场风格波动,可以获取稳定的绝对收益。
我们团队曾于2017年初发布报告《资本利得突出量CGO与风险偏好--行为金融研究系列一》,从处置效应贺前景理论出发,投资者在投资股票时,倾向卖出盈利的股票、继续持有亏损的股票,并引入资本利得突出量(CGO)因子以准确刻画有限注意投资者的认知思维,挖掘其中蕴含的投资机会。

(二)高频信息

近年来,A股市场机构化趋势明显,量化私募机构的管理规模也迅速扩大,产生了一批管理规模超过百亿的量化私募机构。与此同时,传统的风格因子波动增大,从市场获取超额收益的难度在增加。
因子拥挤是因子收益下降的原因之一。因子代表着市场某方面的非有效性、或者是一段时期内的定价失效。当某类因子收益高的时候,会吸引更多的资金进入,从而出现因子拥挤,降低因子的预期收益。一旦新的因子被公开,套利资金的介入会使得错误定价收窄,因子收益也会跟着下降。因此,在多因子选股模型中,因子的开发和更新迭代变得越来越重要。
与低频因子相比,高频数据在用于量化投资中存在一定优势。
首先,高频价量数据的体量明显大于低频数据。以分钟行情为例,用压缩效果较好的mat格式存储2020年全市场股票的分钟行情数据(包括分钟频的开高低收价格数据、买卖盘挂单数据等),约为12GB。如果是快照行情(目前上交所和深交所都是3秒一笔)或者level 2行情,数据量要大很多。因此,高频数据因子挖掘对信息处理能力和处理效率的要求较高。而且,日内数据,尤其是level 2数据,一般要额外付费,甚至需要自行下载存储实时行情,在此基础上构建的因子拥挤度较低。
其次,高频价量数据一般是多维的时间序列数据,数据中噪声比例较高,而且与ROE、PE这类低频指标本身就具有选股能力不同的是,原始的高频行情数据一般不能直接用作选股因子,而要通过信号变换、时间序列分析、机器学习等方法从高频数据中构建特征,才能作为选股因子。此类因子与低频信号的相关性较低,而且由于因子开发流程相对复杂,不同投资者构建的因子更具有多样性。
此外,高频数据开发的因子一般调仓周期较短,意味着在检验因子有效性的时候,同一段测试期具有更多的独立样本。例如,在一年的测试期内,只有12个独立的样本段用于检验月频调仓的因子,与之相比,有约50个独立的时段用于检验周频调仓因子,有超过240个独立的时段用于检验日频调仓的因子。独立样本的增多有助于检验高频因子的有效性。
高频数据挖掘因子的难点在于数据维度大、噪声高。凭借专业投资者的经验或者是参阅已发表的文献,可以从高频数据中提炼出一部分有选股能力的特征。此外,机器学习方法擅长从数据中寻找规律和特征,是高频数据因子挖掘的有力工具。

      因此,一方面,本报告尝试对CGO因子进行调整优化,另一方面尝试基于分钟线高频数据构建因子,并在A股市场进行实证检验。


二、前景理论与处置效应
2.1
处置效应

投资者在交易股票时,倾向卖出盈利的股票、继续持有亏损的股票,也就是所谓的“出赢保亏”效应。也就是说,当投资者处于盈利状态时是风险回避者,而处于亏损状态时则是风险偏好者。处置效应使得投资者产生坚持持有处于深度亏损状态的股票,当许多投资者产生这种惜售心理时,这样的股票往往可以走出反转行情。有很多理论可以解释处置效应,如行为经济学的“心理账户理论”认为投资者进行经济决策活动并不不是按照效用函数最大化而是自有一套个性化的、无法用数学描述的记账系统。行为金融中的“过度自信理论”则解释为投资者认为自己永远正确,因而在亏损时不肯认输止损。比较有影响力的理论是Kahneman和Tversky提出的前景理论,这个理论后来被称为KT理论,Kahneman因此获得了2002年诺贝尔经济学奖



2.2
前景理论

投资者不仅看重财富的绝对量,还看重财富的变化量。当投资者面临条件相当的盈利前景时更加倾向于兑现盈利(风险规避);而面临条件相当的损失前景时更加倾向于风险偏好。此外投资者对损失和获得的敏感程度是不同的,投资者对损失比对获得更敏感。即财富减少产生的痛苦与等量财富增加给人带来的快乐不相等。前者要大于后者。
前景理论创造性地提出了S形的价值函数来描述描述投资者在不同盈亏程度下的不同心理。传统预期效用理论认为效用函数是全局凹函数,即风险厌恶。但前景理论认为投资者的风险偏好存在突变:投资者在处于亏损状态时,是风险偏好的,而处于盈利状态时则是风险厌恶的。价值函数是左凸右凹的。
投资者在处于高度盈利状态A时效用增加缓慢,风险规避,从而倾向于抛售获利股票在处于深度亏损状态B时,由于效用函数平缓下降,有惜售心理,甚至“越跌越补”,期待反弹,股价则有较大的反转可能。
前景理论可以较好地、定量地解释投资者在盈利与亏损这两种不同状态下的呈现不同的风险偏好。


三、参考价格(RP)与资本利得突出量(CGO)
3.1
参考价格(Reference Price)

既然投资者的投资决策行为与风险偏好与其盈亏水平息息相关,对于单个投资者,盈亏水平较为容易计算。但是对于一类资产,投资者的平均盈亏水平可以通过资产的历史价量信息进行估算得到。
客观地说,因为每个人每只股票的投资成本无法获知,投资者的盈亏状态是很难精确刻画的。我们可以认为每个投资者都有一个心理价位,跌破这个心理价位或者突破这个心理价位都可能对投资者之后的行为产生影响。同一只股票出现大量的群体行为势必会影响这只股票今后的走势,所以对每一只股票定义一个统一的参考价格十分有必要,而且定义这个心理价位或者说参考价格一定要反映足够的市场变化的信息。许多个人投资者喜欢依照均线设定自己的止损位或者止盈位,他们的交易行为依照均线变动而发生决策。从某种意义上来说,均线就是一种参考价格。但是均线只包含了价格变动的信息,没有成交量、换手率等信息;而且均线数据有很大的噪音,基于收盘价计算的日均线容易被少数人在尾盘操纵股价造成数据失真。
Grinblatt(2005)针对美国股市,以260周为周期,提出以周换手率加权平均的周成交均价作为个股的参考价格。
参考价格的计算是过去N日的成交均价按照换手率衰减加权形成的平均价格,连乘部分使得权重是随时间衰减的。如果当天换手率较大,之后换手率越小,则携带的信息对未来越有效,这一天的成交均价在求和式子中的权重越大。反之,如果以后的换手率越大,则当天携带的信息对投资者未来的参考意义越小,这一天在整个求和式中的权重也越小。

3.2
资本利得突出量(Capital Gain Overhang)

为了表示当前表示当前股价运行相对于参考价格的位置,我们参考Grinblatt(2005)定义了资本利得突出量(CGO)。CGO表示股票投资者相对于参考价格的平均浮盈浮亏情况。
下图是假设的某只股票的收盘价、100日均价、参考价格序列和CGO序列。虽然参考价格和均线都是价格的平滑化处理,但是由于参考价格捕捉了换手率的信息,所以它在股价上涨和下跌的趋势转变过程中,要比同周期的均线要相对更为领先。


股价序列处于上涨时,不同换手率变化会导致CGO不同的变化。如果前期上涨时换手率很低(如一字涨停板),则将导致CGO序列迅速上升。如果人们对股价的未来上涨预期产生了分歧,股价上涨但是换手率也增加地很快,这将导致CGO序列下降。因为近期的换手率权重大,导致了参考价格上升得比收盘价上升的快。由于获利盘处置效应的存在,CGO序列如果在快速上涨后突然下降则可能预示着股价顶部的来临。
股价在下跌通道中,CGO也会伴随着股价下跌。对于急剧下跌探底的过程中,由于惜售效应存在,投资者换手急剧下降,CGO指标更多反应的是高位持有者浮亏,因此指标弹性更大,会下降地更剧烈。当缩量震荡一段时间后,随着换手率逐渐变大,市场情绪的修复,CGO公式中前期交易数据的权重在衰减,近期交易信息的权重变大,弹性缩小,股价容易走出反弹行情。

四、A股低频实证回测
4.1
数据说明

选股范围:全市场;
股票预处理:剔除摘牌、涨跌停板、ST/*ST、上市未满1年的股票;
因子预处理:中位数去极值、Z-Score标准化;
回测区间:2012.01 – 2024.06;
分档方式:根据当期股票的因子值,从小到大分为十档 ;
调仓周期:周度;
加权方式:等权。

4.2
低频因子实证结果

本小节中,主要将对CGO低频因子在IC、多空策略、胜率以及换手率方面的回测表现进行整体展示,并对比行业市值中性化前后是否有不同。
周频全市场选股方式下,CGO因子的IC均值为-4.2%,多空年化收益为28%,其中多头年化收益为18.8%,十分组下多头组收益相对突出。


1.CGO因子



本部分的Barra风格因子参考Barra CNE5因子算法,基于天软科技数据计算整理,计算逻辑详见附录。
相关性结果来看,因子和常见风格因子的相关性总体相对较小。


2.CGO因子(行业市值中性)





4.3
回溯周期调整影响

周频全市场选股方式下,调整因子计算的回溯周期,以观察参数的潜在影响。测算结果显示,回溯周期20、50和100天的IC、因子收益等特征相对一致。
因子分组收益方面,较短周期下的因子单调性相对不足。


1. CGO_100因子




2.CGO_20因子




五、A股高频实证回测
5.1
高频因子实证结果

本小节中,主要将基于5分钟数据构建CGO因子,并对CGO系列因子在IC、多空策略、胜率以及换手率方面的回测表现进行整体展示。
具体回溯周期方面,分别回溯1天、5天和20天的5分钟线数据。
周频全市场选股方式下,回溯5天的因子有相对较好的市场表现,CGO因子的IC均值为-4.4%,IC胜率为61.6%,多空年化收益为37%,夏普比率为2.27。行业市值中性化后,因子表现进一步增厚,多空年化收益为40%,夏普比率为3.56。


1.CGO_5min_5day因子





2. CGO_5min_5day因子(行业市值中性)





5.2
筛选部分时间区间

交易日内不同时间段的交易活跃度存在小幅差异,如开盘和接近收盘等区间内的成交相对更加活跃。本部分进一步筛选并保留如开盘前半小时的时间数据构建因子,对比测算结果是否存在不同。
总体尝试3种方案。一是某一个交易日内,只保留开盘前半小时的5分钟线数据,即只保留6个数据点;二是在方案一的基础之上,将结果进行汇总,即汇总前半小时的数据,颗粒度汇总至日频数据;三是回溯5个交易日,5分钟线合计设计240个数据点,筛选并保留换手率最大的50个数据点。
测算结果显示,方案一和方案二的优化结果不够明显。


1.CGO_5MIN_5DAY_5min_5day_half_hour因子





2. CGO_5MIN_5DAY_5min_5day_half_hour_sum因子





六、进一步检验
6.1
因子相关性分析

CGO系列因子内部,相对而言,在因子计算中的时间回溯周期等内容的影响相对更大。数据频率方面,实质影响较小。


6.2
换仓频率敏感性检验

调整换仓频率为周度和月度,测算换仓频率对因子回测结果的影响。测算结果显示,随着换仓频率的延长,因子收益有较明显的下降,说明CGO系列高频因子捕捉的是相对短期内的市场信息,有较快的信息衰退速度。


6.3
费用敏感性检验

本节将分析手续费的设定对于策略收益的影响。具体而言,本节分析因子在周频换仓周期下对于手续费的敏感性。具体而言,测试了全市场选股范围内的CGO因子,在千一、千二、千三手续费费率设置下的多头基准净值走势。
结果表明,因子策略扣除手续费后,能够在长期获得一定超额收益,但随着手续费水平上升,策略净值表现整体下降。因此,应当对手续费费率予以重点关注。



6.4
分域检验

本节将分析股票池的调整对于策略收益的影响。具体而言,本节分析因子在周频换仓周期下对于在沪深300、中证500和中证1000池子的敏感性。
具体而言,低频因子方面,相对而言,因子在相对小盘的股票池中的有效性相对更好。
高频因子方面,因子在沪深300股票池中的回测IC相对更高,多头组的区分度更加突出。



七、总结

处置效应与前景理论:投资者在投资股票时,倾向卖出盈利的股票、继续持有亏损的股票,这就是行为金融学上的处置效应。处置效应导致了当投资者处于盈利状态时是风险回避者,而处于亏损状态时则是风险追求者。Kahneman和Tversky提出了前景理论解释了这种现象,创造性地提出了左凸右凹的价值函数,挑战了传统金融学设定的投资者全局风险厌恶的假设。

资本利得突出量(CGO)因子:基于过去N日成交均价按照换手率加权平均,定义了个股的参考价格(RP)和资本利得突出量。报告尝试引入分钟线数据,探讨对比低频和高频数据维度的CGO因子在选股中的应用效果。

低频因子实证分析:周频全市场选股方式下,CGO因子的IC均值为-4.2%,多空年化收益为28%,其中多头年化收益为18.8%,十分组下多头组收益相对突出。调整因子计算的回溯周期,回溯周期20、50和100天的IC、因子收益等特征相对一致,但较短周期下的因子单调性相对不足。

高频因子实证分析:周频全市场选股方式下,回溯5天的因子有相对较好的市场表现,CGO因子的IC均值为-4.4%,IC胜率为61.6%,多空年化收益为37%,夏普比率为2.27。行业市值中性化后,因子表现进一步增厚,多空年化收益为40%,夏普比率为3.56。

进一步检验:相关性方面,因子和风格因子的相关性总体较小,因子内部而言,在因子计算中的时间回溯周期等内容的影响相对更大。分域选股维度,低频因子方面,相对而言,因子在相对小盘的股票池中的有效性相对更好;高频因子方面,因子在沪深300股票池中的回测IC相对更高,多头组的区分度更加突出。


八、风险提示
本专题报告所述模型用量化方法通过历史数据统计、建模和测算完成,所得结论与规律在市场政策、环境变化时可能存在失效风险。
本专题策略模型在市场结构及交易行为的改变时有可能存在策略失效风险。
因量化模型不同,本报告提出的观点可能与其他量化模型结论存在差异。

九、附录
参考Barra CNE5因子算法,基于天软科技数据计算整理。


详细研究内容请参见广发金工专题报告


《资本利得突出量的多频率测算


法律声明:
本微信号推送内容仅供广发证券股份有限公司(下称“广发证券”)客户参考,其他的任何读者在订阅本微信号前,请自行评估接收相关推送内容的适当性,广发证券不会因订阅本微信号的行为或者收到、阅读本微信号推送内容而视相关人员为客户。
完整的投资观点应以广发证券研究所发布的完整报告为准。完整报告所载资料的来源及观点的出处皆被广发证券认为可靠,但广发证券不对其准确性或完整性做出任何保证,报告内容亦仅供参考。
在任何情况下,本微信号所推送信息或所表述的意见并不构成对任何人的投资建议。除非法律法规有明确规定,在任何情况下广发证券不对因使用本微信号的内容而引致的任何损失承担任何责任。读者不应以本微信号推送内容取代其独立判断或仅根据本微信号推送内容做出决策。
本微信号推送内容仅反映广发证券研究人员于发出完整报告当日的判断,可随时更改且不予通告。
本微信号及其推送内容的版权归广发证券所有,广发证券对本微信号及其推送内容保留一切法律权利。未经广发证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。


广发金融工程研究
定期发布团队最新研究成果及观点,欢迎交流!
 最新文章