殷乐:量化因子体系与基本面研究的深度结合

文摘   财经   2024-11-19 16:37   上海  

会议:开源证券2025年度策略会
议程:量化投资与资产配置论坛
日期:2024年11月13日
地点:上海浦东香格里拉酒店
主办:开源证券金融工程魏建榕团队
主题演讲:量化因子体系与基本面研究的深度结合
特邀嘉宾:殷乐,中庚基金量化投资部总监

发言实录

大家好,感谢开源证券金融工程团队魏建榕博士的邀请!今天能够有机会与大家交流,感到非常荣幸。我今天汇报的主题是“量化因子体系与基本面研究的深度结合”。

首先,我们来探讨一下量化因子体系与基本面研究在方法论上的差异。实际上,这两种方法论各自的优势与劣势都非常明显,并且与其自身的特性有着天然的关系。量化因子体系是一种从定价出发的分析方法,从最初的CAPM模型到后来的Fama French模型,再到当前的多因子框架,量化因子体系始终聚焦于股票定价的研究。而基本面研究在定价方面通常比较依赖估值指标,如通过市盈率(P/E)、市净率(P/B)、市值和折现现金流(DCF)来对股票进行定价,相对而言在定价方面,量化因子体系天然更具有优势。其次,量化因子体系的覆盖度更高。尽管量化因子体系的信噪比可能并不高,但至少每天都能覆盖全市场5000只股票并进行定价,这是基本面研究所无法比拟的。基本面研究通常受限于研究资源,无法覆盖整个市场。然后,量化因子体系在中小市值股票中的优势也比较明显。许多中小市值股票的业务波动较大,且股价与基本面之间的关系不如大盘股明确,导致基本面研究往往无法给出较为明确的结论。而量化因子体系能够更有效地捕捉这些股票的价格波动。此外,量化因子体系在交易层面也更有优势。我们利用大量的Level 2数据计算量价因子,这使得量化因子体系在把握短期交易和市场微结构分析方面优于基本面研究。

当然对于基本面研究而言,也具有许多非常明显的优势,比如对公司深度研究的能力、对行业趋势、商业模式、公司治理结构和永续增长潜力的判断等,这些都是难以有效量化的领域。因此,基本面研究在这些方面的表现更为出色。此外,基本面研究的另一个优势在于其较长的持有时间和较低的换手率,这对于减少组合的频繁交易和降低交易成本也非常有帮助。

对于这些挑战,量化团队的一种做法是与基本面研究人员合作,探讨行业的逻辑,并试图将这些逻辑通过量化的语言定量的刻画出来。然而我们认为这种方法可能会事倍功半,对于这些领域,我们可能并没有足够的数据和专业能力去将其量化。

总结来说,量化因子体系和基本面研究各有其独特的优势。我们需要充分了解并利用自身的优势,尽量避免用自己的短板去挑战对手的长处。对于那些难以量化但又至关重要的领域,我们战略上需要高度重视,但战术上可以选择放弃直接量化建模的方式,而是通过一种结构化的方式将基本面研究的成果纳入到量化的因子体系中,从而实现1+1大于2的效果。

既然要实现量化因子体系与基本面研究的深度结合,首先需要构建一套相对完备的量化因子体系。目前我们的因子库包含约300多个底层因子,这些因子按照逻辑关系被分为八个大类。整个因子库在持续迭代更新中,每年大约会有5%至10%的因子被替换或更新。底层因子通过加权的IC(信息系数)和IR(信息比率)方法进行合成,形成大类因子,大类因子经过正交化处理后,再等权合成为最终的预测信号。最终,我们的线性因子框架在实盘运行中,月均IC大约为0.15,表现为一个比较高的IC。

从大类因子来看,偏向基本面的大类因子的IC值通常在0.05到0.1之间,而偏向量价的大类因子的IC值通常都能超过0.1。在这个框架中,我想特别提到的是公司治理因子。这个因子属于低频因子,但其月均IC能达到0.08,并且与其他因子的相关性非常低。该因子是基于公司的财务附注数据构建的,由于数据来源不同,它与其他因子的相关性天然较低,并且数据更新频率为每年3至4次,因此它的换手率也非常低。总体来说,这个因子在我们因子体系中的边际增量作用非常显著。

接下来,我们进入第二部分,讨论如何将基本面研究的成果融入到我们已有的量化因子体系中。我们在公司内部搭建了一个数据库,该数据库记录了所有行业研究员反馈研究成果的动作,包括模拟组合的调整、晨会的点评、内部工作群的点评、周报、月报、季报、调研报告、深度报告等所有我们能够收集到的研究员反馈研究成果的渠道。例如,当研究员调整模拟组合时,我们会在数据库中留下一条记录;当研究员在晨会点评某支股票时,我们同样也会记录下来。对于这些动作,我们会根据其类型和重要性赋予不同的分值,例如模拟组合的调整幅度、研究员晨会的推荐强度等。对同一只股票在过去一个月内,涉及不同维度的得分汇总,并进行时间加权处理,赋予较近的观点更高的权重,我们能够得到一个结构化后的内部研究员因子。我们公司大约有20多位行业研究员,每位研究员同时跟踪30只左右的股票,因此整个因子化的范围大约能同时覆盖600只股票。

我们将结构化后的内部研究员因子与量化因子进行合成。在合成过程中,我们并没有采用简单的等权合成,而是采用了非线性的合成方式。这主要是因为,内部研究因子的覆盖度相对较低,直接等权合成容易丢失有效信息。如果感兴趣的话,大家可以尝试用一些简单的非线性激活函数,来测试合成后的效果。需要注意的是,量化因子和内部研究因子的值每天都会更新,量化因子每天随着行情数据、财务数据和一致预期数据的变化而变化,内部研究员因子也会实时的根据研究员的组合调整、推荐股票或观点更新而变化。因此,最终我们会在每日更新这两套因子的基础上,形成当天最终的收益预测。通过实际验证,合成后的效果也相当不错。以下展示了在5%跟踪误差下,我们用这两套因子分别构建的相对于沪深300指数的超额收益。 

蓝色曲线代表我们使用纯量化线性模型时的超额收益,大约年化超额8%。红色曲线则是在该线性模型基础上,结合了内部研究因子的非线性叠加后所得到的超额收益,年化超额提升约3%至11%。更为重要的是,经过这种合成,不仅超额收益得到提升,同时超额收益的波动率和回撤也有所降低,减少了大约1%的超额波动和回撤。这表明我们在量化线性模型中成功引入了一个高质量差异化的阿尔法来源。虽然我们的线性模型一直在持续更新和迭代,但当框架已经趋于完善时,再进行改进会变得非常困难,而内部研究员因子为我们提供了一个高质量的差异化的阿尔法来源。尤其在一些量化模型集体遭遇回撤时,这样的差异化的阿尔法尤为珍贵,例如在2021年9月的那一轮回撤中,我们的量化模型也未能幸免,超额收益回撤幅度约为5%,然而当加入内部研究因子后,这一回撤幅度显著降低。此外,在今年年初的市场剧烈波动中,叠加了内部研究员因子后,回撤控制也更加平稳,这一次和质量因子在这段时间的抗跌有关,内部研究员因子天然偏向更高质量的股票,正好帮助我们在量化因子回撤较大时,平滑了整个组合的表现。

为了能在事前保证内部研究员因子的有效性和竞争优势,我们认为,核心在于公司层面自上而下的推动。没有公司层面自上而下的支持,量化投研团队和基本面投研团队之间的壁垒难以打破,研究部的研究成果难以准确高效地转化成量化可使用的因子。此外,公司自身的研究风格和特点也是成功的关键,中庚采用的是高周转、高覆盖的研究模式,研究员能同时覆盖约600只股票,这与一些专注于少数核心股票池的研究方法有所不同。尽管中庚的研究员数量不算最多,但我们通过更加广泛的覆盖和更加快速的周转,能确保因子的全面性和及时性,这与量化因子的特点高度契合。因此,我们相信,在这种制度和流程的保障下,我们可以在事前保障内部研究员因子的质量,并将其准确、高效地转化为量化信号,持续优化我们的策略表现。

接下来,介绍一下我们运用这套框架在实盘运行的几个产品的表现。首先来看一下我们历史上实盘时间最长的一个产品,这个产品自2019年2月底始运行,至今已实现约60%的绝对收益,年化收益率大约9%,同时将最大回撤和波动率控制在6%的水平上。产品的结构非常清晰:30%的资金投资于500指增,其余50%的资金用于构建纯中性对冲策略,构建指增+对冲的组合。通过这种设计,产品有效的实现了“进可攻退可守”的效果。具体来说,在牛市阶段,权益敞口为产品提供了良好的收益弹性,而在熊市阶段,由于对冲策略的保护,产品帮助客户避免了亏损。因此,尽管市场经历了多次波动,产品始终保持了年度正收益的目标。在2019年至2021年的牛市和结构性牛市中,产品实现了超过10%的收益,在2022年的熊市中,也获得了2%的收益,在2023年和2024年的震荡行情中,每年也能获得5%的收益,并且净值在持续创出新高,创新高的最长时间不超过9个月。这意味着,通过这样的策略,客户不仅能获得类似权益资产的收益,而且其波动和回撤也能有效控制在权益资产的四分之一左右,类似二级债基的水平,是非常好的绝对收益类产品。

第二个产品是一款更加纯粹的中性对冲产品,产品成立于2022年2月,成立以来实现了接近6%的年化收益,不仅在债券牛市中跑赢了全债指数,同时最大回撤也控制在了4%以内,成功的实现了绝对收益的目标。这款产品主要是针对高净值客户的,在今年这样一个中性对冲策略比较难做的年份,该产品也是经历了两次比较大的压力测试。第一次是在今年初市值因子大幅波动时,产品因为严格控制了在市值因子上的暴露,将最大回撤控制在了2%以内,并在3月份很快就完全修复了年初的回撤;第二次是在9月底基差的快速上升中,产品将最大回撤控制在了3.7%以内,并很快在10月份再次完全修复了这轮回撤。第二次压力测试主要是因为我们在9月底观察到基差快速上升,因此提前将对冲仓位降至50%左右,同时在10月8号基差升水达到最高时,迅速将对冲仓位加回至80%,在基差的快速回落的过程中充分获利。在今年这样一个比较复杂的环境下,年初至今依然实现了5%的绝对收益。

最后,我们还有一款灵活配置型的产品,该产品成立于2023年6月,至今净值已超过1.3。这款产品类似于灵活配置型基金,具有较高的自由度,能够根据市场情况灵活调整敞口,在同期灵活配置型产品中的排名也非常靠前。在这款产品中,我们大量运用了深度学习的策略,不刻意控制波动和回撤,追求最大的弹性。以上就是我今天的汇报,欢迎大家和我们团队的同事做进一步的深入交流,谢谢。


(全文结束)
(纪要整理:张广年
风险提示上述内容和意见仅作为客户服务信息,并非为投资者提供对市场走势、个股和基金进行投资决策的参考。本公司对这些信息的完整性和准确性不作任何保证,也不保证有关观点或分析判断不发生变化或更新,不代表本公司或者其他关联机构的正式观点。历史业绩不代表未来收益,基金投资需谨慎。

做「开源」的量化研究

to be a quant,to be open-minded.

更多交流,欢迎联系:

开源证券金融工程团队 | 魏建榕 张翔 傅开波 高鹏 苏俊豪 胡亮勇 王志豪  盛少成 苏良 何申昊 陈威 蒋韬

end



团队介绍



开源证券金融工程团队,致力于提供「原创、深度、讲逻辑、可验证」的量化研究。团队负责人:魏建榕,开源证券研究所副所长、金融工程首席分析师、金融产品研究中心负责人,复旦大学理论物理学博士,浙江大学金融硕士校外导师、复旦大学金融专硕校外导师、上海财经大学数学专硕业界导师。专注量化投资研究10余年,在实证行为金融学、市场微观结构等研究领域取得了多项原创性成果,在国际学术期刊发表论文7篇。系列代表研报《开源量化评论》、《市场微观结构》、《开源基金研究》,在业内有强烈反响。2023年获评金麒麟菁英分析师第1名、Wind金牌分析师第3名、水晶球分析师公募榜单第4名;2022年获评金牛分析师第5名、Wind最佳路演分析师。团队成员:魏建榕/张翔/傅开波/高鹏/苏俊豪/胡亮勇/王志豪/盛少成/苏良/何申昊/陈威/蒋韬。




法 律 声 明
Legal Notices

开源证券股份有限公司是经中国证监会批准设立的证券经营机构,具备证券投资咨询业务资格。

本报告仅供开源证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为客户。本报告是发送给开源证券客户的,属于商业秘密材料,只有开源证券客户才能参考或使用,如接收人并非开源证券客户,请及时退回并删除。

本报告是基于本公司认为可靠的已公开信息,但本公司不保证该等信息的准确性或完整性。本报告所载的资料、工具、意见及推测只提供给客户作参考之用,并非作为或被视为出售或购买证券或其他金融工具的邀请或向人做出邀请。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。客户应当考虑到本公司可能存在可能影响本报告客观性的利益冲突,不应视本报告为做出投资决策的唯一因素。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。本公司未确保本报告充分考虑到个别客户特殊的投资目标、财务状况或需要。本公司建议客户应考虑本报告的任何意见或建议是否符合其特定状况,以及(若有必要)咨询独立投资顾问。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。若本报告的接收人非本公司的客户,应在基于本报告做出任何投资决定或就本报告要求任何解释前咨询独立投资顾问。

本报告可能附带其它网站的地址或超级链接,对于可能涉及的开源证券网站以外的地址或超级链接,开源证券不对其内容负责。本报告提供这些地址或超级链接的目的纯粹是为了客户使用方便,链接网站的内容不构成本报告的任何部分,客户需自行承担浏览这些网站的费用或风险。

开源证券在法律允许的情况下可参与、投资或持有本报告涉及的证券或进行证券交易,或向本报告涉及的公司提供或争取提供包括投资银行业务在内的服务或业务支持。开源证券可能与本报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。

本报告的版权归本公司所有。本公司对本报告保留一切权利。除非另有书面显示,否则本报告中的所有材料的版权均属本公司。未经本公司事先书面授权,本报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。

开源证券股份有限公司

地址:西安市高新区锦业路1号都市之门B座5层

邮编:710065

电话:029-88365835

传真:029-88365835


建榕量化研究
我们恪守「原创、深度、讲逻辑、可验证」的量化研究准则,感谢关注开源金工。
 最新文章