会议:开源一席谈
主办:开源证券金融工程魏建榕团队
主题:沪深300增强ETF的投资实践
特邀嘉宾:张序,华安基金量化投资部基金经理
苏良:请简单分享一下您的投资理念和研究框架。
苏良:您的策略中传统多因子模型、行业轮动以及机器学习这三块的比例?
张序:我们这个产品没有用一些行业轮动和多因子模型,主要还是以多因子来叠加机器学习。主要原因是我们从历史的投资,主要是我们之前一直在华安事件驱动量化中进行的实践中,发现行业轮动的跟踪误差还是相对比较大的。但我们之前在构建300增强ETF这个产品的框架时,我们目标是对跟踪误差会有比较严格要求,所以我们就没有用到行业轮动,主要就是一个多因子叠加机器学习来实现的。因为刚刚苏良也提到我们传统多因子模型主要是四个模块,很多投资者也比较熟悉。比如说四个模块中第一个模块是如何去识别有效的因子,第二模块是如何把你识别出来的因子合成,第三个模块是基于控制组合波动的方法来剔除一些beta类或者一些行业的影响,第四个模块是基于你的换手,基于你的目标,基于你的一些偏好之类等等去做优化。这是传统的多因子框架。
而我们在应用机器学习模型的时候。在主要是在第二个模块跟第三个模块做,就是因子合成端和组合波动的管理端使用机器学习的模型来做了。这也是我们在之前不断做了一些尝试最终确定的一种形式,主要只在这两个模块去做。因为像很多私募,包括有些公募,可能在第一个模块就已经也使用机器学习来做的,像通过机器学习、深度学习或者是之前比较老的神经网络来去生产因子、挖掘因子。但是我们测出来在300这个池子里用这种海量的数据来做,在周频维度的选股策略的稳定性会相对不是很强。这里背后逻辑我们也思考了一下,主要还是300这个池子里的机构参与者相对来说会更多元一点。怎么理解呢?就是像很多小票,可能主体的参与者就是散户,但300里面的参与者不仅包含了国内的机构,还包括国外的机构、散户资金、ETF资金等等。我们发现在不同的时点300成分股的定价权、股价驱动的逻辑都是不太一样的,而且这种变化我们如果纯用一些逻辑性很弱的数据来去做,它的风险会比较大,稳定性会差一点。所以在300里面,我们在第一个模块是没有用这种机器学习的方法来做。但不用机器学习方法来做,我们也发现了一些问题。在用机器学习模型的时候,大家都希望因子的输入端,或者是数据输入端的维度的数量级肯定要足够大的,所以在这里我们也找了一些方法来解决。一方面,我们自己的团队话也会挖掘一些因子,另一方面话我们也跟比较多卖方金工团队,像开源金工这边我们也有深度的合作,这种卖方金工挖的因子也是作为我们数据输入端,因为很多金工团队他们定期也会挖出很多稳定性很强的因子。所以我们从两个维度,我们自己挖的和金工团队通过数据支持得到的数据库,就把它扩充为1000多个因子。通过这种云端输入,我们觉得解决了模型第一个模块数据量不够的一个问题,这样也替代了在300里面用机器学习生成因子效果不太好的一些问题。然后像机器学习的应用也跟各位投资者简单介绍一下我们在300增强ETF的具体情况。我们之前也开发了比较多策略,有偏分类的机器学习模型,也有一些深度模型,这些模型和策略跟踪下来效果都还是比较不错的。目前,我们300增强ETF用到更多还是一些分类模型。
张序:公募这块在指数增强的布局应该是特别早的,主要是一些场外的产品。然后从21年公募开始布局比较多的是一些增强ETF,像沪深300增强ETF。指数增强ETF名字包含ETF,所以他是具有ETF特征的,就是可以让投资者的在场内的话做一些实时的交易。做实时交易的好处就是让投资者资金的运行效率更高,你就不用每次以收盘价买一个产品,而是可以更灵活的选择一些盘中的价格,它的灵活度相对说比较高。然后在费率上,因为ETF费率相比来说是比较低的,所以它跟指数增强有这样的一个区别。但我们这个产品与300ETF有个不一样的地方是我们的目标不是紧密的跟踪沪深300指数,而是带有增强目标来做的,这跟300增强它的目标是一样的。由于我们这种ETF形式,我们跟300指数增强还有个不太一样的地方是我们的跟踪误差也会控制会更严格一点,来方便投资者得到一些中短期持有的收益。所以我们这个产品是要去做一个比300ETF更好,比300指数增强更稳的总目标来做的。然后在管理费率上有一个不一样在于300增强ETF的管理费大部分基本上都是0.5%,而绝大部分场外300指数增强管理费是1%左右,所以相比来说,300增强ETF就会有50bp的费率上的超额收益。买300增强ETF本身就能比300指增多50bp的超额收益率,这对投资者来说也是比较不错的超额收益来源。此外,这种模式不仅对投资者,对我们管理人的话也是有好处。因为投资者申赎这些基金都是实时买卖,在仓位上也不会对我们造成比较大影响。举个例子,比如说我们这个产品今天有位客户买了比较大的额度,我们当时就已实时地经转换为股票持仓,仓位基本跟我们开盘的时候一样。但是300指增的场外产品是以收盘价来买入,这会导致我们在第二天的仓位被动降低。300增强ETF降低了这种大额申赎对产品超额的冲击和影响,这是我们这个300增强ETF和场外300指增的区别。
张序:这个问题我感觉是基本上大部分做量化的同行都会遇到的令人头痛的难题,尤其是在做这种机器学习模型的时候。模型在样本内、样本外的表现都比较稳定,但在实盘的时候也会有延续性不太强,或者甚完全不太一样的情况。我们是这样解决的,首先我们在评估和选择这种量化模型的时候,尤其是在做这种偏量价的模型,我们更加注重了因子的稳定性而非是它的超额收益率,也就是我们对胜率或者对最大回测的指标看的权重会更大一些。因为我们发现在做这种机器学习端到端模型的时候,核心还是需要输入数据的稳定性比较强,这样放入到黑盒模型中相对来说更有保障。这是我们在过去选择量化模型或选择多因子模型时会更看重的点,此外也会对高波动或高收益的因子会给比较强的惩罚系数,主要也是防止它进入到我们这种300增强ETF的产品策略中。这些是我们在做量价模型上因子和模型的评估和选择方法,在因子的生成端,也就是挖掘因子跟生成因子上面,我们没有采取一些很暴力的方法来做,主要也是从我们更希望因子有更好的稳定性的出发点来考虑的。
张序:首先跟各位投资人就是介绍一下我们对收益和回撤的一些理解。我们这边也做一些基本面量化的产品,以及就是这种偏量价的指增产品。这两个方向上我们思考的方法方式还是不太一样的。举个例子,比如说偏基本面量化使用行业轮动的华安事件驱动量化产品,我们对标的是偏股混合指数。因为主动基金和基金的中位数的偏离是蛮大的,所以在这块我们对风险控制的就不会像一些像沪深300增强ETF这么严格的控制。我们发现一些基本面量化策略在风险控制不这么严的环境下,它的收益率是相对来说比较不错的,比如说行业轮动模型、风格轮动模型。但我们也做了相应的方法去平衡它的收益和回撤,平衡的基准主要也是基于我们池子里面的波动来调整相应的行业暴露度。
我们这边管理的300增强ETF就会相当说很严格了,因为我们之前要做的目标就是跟踪误差要比场外的300指增更低,并且还需要能够提供很稳定的超额收益,所以我们在这里就会有比较严格约束。我们在第三模块中我们会剔除行业大类风格。这个剔除我们有两个切入角度,第一个角度是动态的剔除。基于我们alpha因子近期和风格类因子的相关性来剔除它在风格上的暴露。另一个角度是缩短回看窗口。我们今年跟去年都运用了并且觉得比较不错的,是在某些时候alpha因子跟风格因子的相关性会比较大,这也是为什么今年大家看到在微盘股的大幅波动下私募量化的超额收益率出现明显的波动。举个例子,比如说我们做出来一个alpha因子,发现它和小市值因子的相关性是0.2,我们将alpha因子减去0.2倍小市值因子暴露,然后得到基于统计关系不含小市值风格的alpha因子。但有些时候当市场出现比较大的波动,比如说小市值因子大幅回撤的时候,你可能测出来你alpha因子和小市值的相关系数变成了0.8,但你之前是按0.2来去剔除的,那它还要0.6的小市值风格暴露你没有剔除,这就是最后表现出来为什么很多量化指增在微盘大幅回调时也出现明显的回调。所以基于这种方案,我们也做第二个管理,就是会缩短alpha因子和风格因子相关系数的回看窗口,这会帮助我们更快的剔除掉beta因子对alpha因子的干扰和影响。我们在超额收益率alpha因子端的风格上的剔除主要是通过这两步来做的。在构建策略之后我们这样做的原因是更加注重这个产品超额收益率的月度胜率和稳定性,我们的产品运作下来月度胜率是在85%。
在市场的仓位调整上我们这边的研究半径相对来说比较有限,所以更多还是在行业中观和微观上,宏观上来看,我们基本上都是高仓位来运作的。
苏良:请介绍一下华安量化团队目前的人员分工情况和产品布局情况。
张序:我们这边是有好几个研究方向,有两个组在支持我们这边的一些产品。其中一个组就是基本面量化,这个就是之前也跟很多领导汇报过我们的华安事件驱动量化产品,就是通过一些宏观、中观的量化投资策略来去做一个稳定战胜885001的一个主动量化产品。这个产品我们在过去五年在主动量化基金里面累计下来的排名差不多是前1%,在公募的偏股混基金里面排名前5%。所以我们这个组的在这方面也是做了比较多的研究,并且我们有一些行业轮动的投顾或专户也是这个组来支持的,所以人数会相对比较多一点,有七名同事在做基本面量化。但另一个组是偏硬核的、做人工智能的,主要就是我和那个相对IT能力比较强同事在支持我这边的300增强ETF产品以及我们有指数增强专户的一些产品,来去做一些高胜率、超额稳定性比较强的策略。我们这个量价机器学习团队人数可能相对比较少,所以我们也是和同行的卖方金工团队,像开源金工,也是做了一些因子数据库上的合作来做一些降本增效的处理。但我们这两个组在研究平台上和底层数据上都是共享的,并且我们也是在模型端都是在想如何相互共赢、相互合作的形式来做的。
(全文结束)
(纪要整理:傅绎达)
风险提示:上述内容和意见仅作为客户服务信息,并非为投资者提供对市场走势、个股和基金进行投资决策的参考。本公司对这些信息的完整性和准确性不作任何保证,也不保证有关观点或分析判断不发生变化或更新,不代表本公司或者其他关联机构的正式观点。历史业绩不代表未来收益,基金投资需谨慎。
做「开源」的量化研究
to be a quant,to be open-minded.
更多交流,欢迎联系:
开源证券金融工程团队 | 魏建榕 张翔 傅开波 高鹏 苏俊豪 胡亮勇 王志豪 盛少成 苏良 何申昊 陈威 蒋韬
end
团队介绍
开源证券金融工程团队,致力于提供「原创、深度、讲逻辑、可验证」的量化研究。团队负责人:魏建榕,开源证券研究所副所长、金融工程首席分析师、金融产品研究中心负责人,复旦大学理论物理学博士,浙江大学金融硕士校外导师、复旦大学金融专硕校外导师、上海财经大学数学专硕业界导师。专注量化投资研究10余年,在实证行为金融学、市场微观结构等研究领域取得了多项原创性成果,在国际学术期刊发表论文7篇。系列代表研报《开源量化评论》、《市场微观结构》、《开源基金研究》,在业内有强烈反响。2023年获评金麒麟菁英分析师第1名、Wind金牌分析师第3名、水晶球分析师公募榜单第4名;2022年获评金牛分析师第5名、Wind最佳路演分析师。团队成员:魏建榕/张翔/傅开波/高鹏/苏俊豪/胡亮勇/王志豪/盛少成/苏良/何申昊/陈威/蒋韬。