华泰金工 | 中国PPI的Nowcasting与通胀敏感型行业轮动

文摘   财经   2024-12-10 08:00   北京  

本研究的目的是构建高频生产端通胀因子,实现对月频PPI同比的有效升频,并为高频因子找到适用场景。首先,本研究使用结合华泰三周期滤波和Simple-Nowcasting的Howcast模型,以真实PPI同比为核心指标,滚动进行代理指标筛选、残缺指标Nowcasting和高频因子合成。合意的高频因子体系理应能较准确的预测出核心低频指标已存在但尚未发布的“现在时”状态。本文的模型可以较准确地在月末就给出当月中国PPI同比的预测值,预测值与真实值各自一阶差分后的R方为81.2%,说明本研究构建的高频指标体系较完备。合成的高频宏观因子相比低频指标有更丰富的月内信息,并且能够提供更及时的拐点信号。然后,本研究为高频生产端通胀因子寻找合意的使用场景。先使用有放回抽样回归的方法筛选生产端通胀敏感型行业,再构建轮动组合,并使用高频宏观因子指导周频行业轮动策略。在回测区间内,轮动策略能够显著跑赢等权基准,年化超额收益为11.53%,并且2023年以来使用高频因子相较PPI同比对策略表现有显著提升。敏感性分析结果也支持上述结论。


核心观点

对PPI同比进行Nowcasting升频,应用于通胀敏感型行业轮动

本研究的目的是构建高频生产端通胀因子,实现对月频PPI同比的有效升频,并为高频因子找到适用场景。首先,本研究使用结合华泰三周期滤波和Simple-Nowcasting的Howcast模型,以真实PPI同比为核心指标,滚动进行代理指标筛选、残缺指标Nowcasting和高频因子合成。合成的高频宏观因子相比低频指标有更丰富的月内信息,并且能够提供更及时的拐点信号。然后使用有放回抽样回归的方法筛选生产端通胀敏感型行业,使用高频宏观因子指导行业轮动策略。在回测区间内,轮动策略能够显著跑赢等权基准,并且2023年以来使用高频因子相较PPI同比对策略表现有显著提升。


Nowcasting模型可以为高频因子构建的两个难题提供解决方案

难题之一为指标缺失问题。指标发布延迟/不发布等情况造成的数据缺失会直接导致合成因子出现尾部缺失情况,简单的填充方法均是基于历史的线性外推,会引入噪音从而影响对宏观现实的追踪效果。Howcast模型可以充分利用系统的内生周期驱动力和当期已发布的高频信息对缺失值进行填充。难题之二为指标体系完备性评价问题。现有方法大都基于主观判断,定性地认为体系已完备。Nowcasting体系下,我们可以通过核心指标PPI同比Nowcasting的准确率进行评价,因为高频指标和低频指标本质是对同一系统不同频率的刻画,二者可以相互印证。


PPI同比Nowcasting的R方高达81.2%,说明指标体系较完备

首先,我们从宏观逻辑出发构建备选指标库。然后,考虑到中国工业经济结构是动态发展的,我们借助量化手段对代理指标进行滚动筛选。2013年1月至2024年11月的区间内,中国PPI同比预测值与真实值各自一阶差分后的R方为81.2%,说明高频指标体系较完备。合成的周频宏观因子相比低频指标有更丰富的月内信息,且能够提供更及时的拐点信号。


高频因子应用于通胀敏感型行业轮动,年化超额11.53%

为宏观因子找到合适的应用场景值得探究。我们先基于PPI同比对行业收益影响的显著性,选取煤炭、钢铁、有色金属和石油石化作为通胀相对利好行业代表,选取传媒、通信、计算机和消费者服务作为通胀相对利空行业代表。然后设计双均线指标作为高频因子的趋势信号,趋势上行时满仓通胀相对利好组合,趋势下行时满仓通胀相对利空组合,其余情况等权配置。回测结果表明,在2014-01-29至2024-11-29的回测区间内,使用高频因子构建的轮动策略能够显著跑赢等权基准,扣费后年化超额收益为11.53%,且各绩效指标均有显著提升。


2023年以来,高频因子策略显著优于使用PPI同比的三组对照策略

为了进一步论证对生产端通胀维度进行有效升频的必要性,我们使用PPI同比代替高频宏观因子,假设在每月末就能拿到当月的实际值,设计了三组对照策略。回测结果表明,在三组对照策略中,对PPI同比简单使用前值填充的方式升频至周频的策略就相比于月频策略有所提升,高频因子策略可以进一步起到提升效果,尤其自2023年以来,高频通胀因子轮动策略扣费后累计收益高达45.38%,而三组对照策略中最高组的累计收益仅为20.19%。敏感性分析结果也支持这一结论。这表明,我们对生产端通胀维度的升频是必要且有效的。


正    文

01 本文研究导读


前期报告《全球大类资产配置的三层次逻辑及对宏观基本面量化的思考》(2024-11-29)指出,当下宏观量化面临着高阶逻辑的新难题,延迟发布的宏观指标、低频的宏观因子已经难以满足实际投资需求,对宏观因子的有效升频从可选题变为必答题。本研究是高频宏观现实因子构建与应用研究系列的开篇,聚焦生产端通胀维度,重点实现对核心指标——PPI同比的Nowcasting、对宏观现实的高频刻画和对高频宏观因子适用场景的挖掘


高频宏观因子合成的两个难题与Nowcasting提供的解决方案

高频宏观因子合成的惯用思路是,先找到指定宏观维度下的代表性高频指标,然后使用扩散指数法、OECD指数合成法、主成分分析法等方式进行合成。合成时常会面临一个棘手的问题——指标发布延迟或不发布导致的数据缺失。如果直接使用残缺的数据集合成高频宏观因子,会导致高频宏观因子也存在尾部缺失值,缺失的期数取决于尾部缺失最严重的代理指标。对于这个问题,惯用的处理方式为:(1) 删除有缺失值的指标;(2) 简单使用前值填充/线性插值填充/季节性均值填充的方法对缺失值进行处理。前者的做法对信息量的损耗较大,后者对缺失值的处理过于粗糙,都是历史数据的线性外推,误差的引入会直接影响高频宏观因子对宏观现实的刻画效果。Nowcasting提供了一种更精准的缺失值填充方法。


Nowcasting的含义是对尚未发布的“现在时”状态进行预测。例如,每月末,当月的中国PPI已成定数,但数据会延迟至下月上旬才公布。为了对这一缺失值进行填充,我们可以借用生产端通胀体系内的其他高频指标,如周频公布的生产资料价格指数的信息,以及生产端通胀周期的运行规律,在当月末就给出PPI的预测值。这就是前期报告《美国CPI的三周期Nowcasting模型》(20231031)中结合华泰三周期和Simple-Nowcasting的Howcast模型的处理思路。该模型将宏观指标体系看作一个经济系统,充分利用系统的内生周期驱动力和当期已发布的高频信息,对缺失值进行Nowcasting。使用被精准填充后的完整数据集重新合成高频因子,可以更好地刻画实际宏观状态。



除数据缺失问题外,高频指标体系的完备性也是影响高频宏观现实因子构建效果的重要因素。在筛选指标时,通常的做法是,先为宏观维度选取一个核心低频代理指标,例如选取中国PPI作为生产端通胀的核心指标。然后依据高频指标和核心指标在宏观逻辑上的相关性和序列形态上的相似性进行筛选。但是对指标体系是否完备的讨论较少。大多数因子编制者仅依据主观逻辑进行指标筛选,定性地认为指标体系已经完备。Nowcasting提供了一种可以定量评价指标体系完备性的方法。完备的高频指标体系理应相对准确预测出延迟发布的核心低频指标,因为高频指标和核心低频指标本质是对同一宏观维度的不同频率的刻画,二者可以相互印证,所以可以使用低频指标的Nowcasting准确率作为指标体系完备性的评价标准


高频宏观因子的适用场景值得探究

假设宏观因子为M,资产组合P的收益率为r,当我们可以找到稳定的r=f(H(M))时,用宏观因子指导投资是有意义的。其中,H(·)是宏观因子给出信号观点的方式,f(·)刻画的是宏观观点和资产组合收益表现的映射规律。大部分的研究重点放在固定P,扩充M的类别和丰富H(·)的形式上,而忽视了P和M的适配性研究。如果M是P的弱变量,上述过程很容易产生“Garbage in, Garbage out”的负面效果。设想r=a+b*M的简单场景,当M是P的弱变量时,估计系数b*的置信区间可能包含0,简单理解就是M对r的影响方向是不明确的,这个时候,用M指导P的效果里“运气”成分的占比可能更大。如果简单因为效果不好,就给宏观因子贴上一个“无用”的标签,可能有些过于武断。


为更好地发挥宏观因子的效果,我们认为固定宏观因子,为宏观因子找到更适配的资产组合,是一个值得探究的方向。一方面,宏观因子可以更好地指导该资产组合的投资。另一方面,当宏观因子是资产组合的强解释变量时,对宏观因子的改进效果更能通过组合的表现得以体现,这为高频宏观因子的改进提供了定量的评价标准。前期报告《行业配置策略:高频宏观因子》(2023-06-10)中,我们采用自上而下的Factor mimicking的思路,成功找到了几组资产组合,组合的同比收益率走势和对应维度的宏观代理指标的走势高度一致,进而可以使用资产组合模拟高频宏观因子。对于用于模拟宏观因子的资产组合而言,被模拟的宏观指标是一个强变量,这就为我们寻找资产组合提供了一套方法论。


本文选取真实的PPI同比作为生产端通胀维度的核心指标,下文如无特殊说明,PPI同比均指真实值而非Nowcasting预测值。文章的第一部分将简单回顾结合华泰三周期和Simple-Nowcasting的Howcast模型的基本原理,并给出该模型适用于中国PPI同比Nowcasting预测和高频生产端通胀因子合成的论据;第二部分将阐述中国生产端通胀维度代理指标的滚动筛选流程、中国PPI同比的Nowcasting过程和高频因子的合成效果;第三部分将介绍生产端通胀敏感型行业的筛选方法,并将高频生产端通胀因子应用于通胀敏感型行业轮动。


02 高频因子合成利器:Nowcasting模型


基于华泰三周期的Simple-Nowcasting模型理论回顾

Nowcasting模型的核心是动态因子模型(Dynamic Factor Model, DFM),该模型假设:(1) 可观测的经济数据是高维系统的低维映射,可以被若干不可观测的隐含变量(系统的内生驱动力)解释;(2) 这种解释性是动态且有规律的。DFM的结构分为两部分,隐含状态方程和状态转移方程,后者又包括隐含因子状态转移方程和特质因子状态转移方程。具体可以用如下方程表示:

其中,第一个方程是隐含状态方程,该方程的目的是对众多可观测变量进行降维,提取主要成分。yti是第i个宏观代理指标的历史序列,ft是降维提取的主成分,由于无法观测,故被称作隐含因子,隐含因子就是我们最终需要的生产端通胀因子。eti是第i个宏观代理指标无法被隐含因子解释的部分,被称作特质因子。第二和第三个方程分别为隐含因子和特质因子的状态转移方程,用于预测隐含因子和特质因子的尾部缺失值。模型假设隐含因子和特质因子也有各自的状态路径,可以用AR(p)、VAR(p)等计量模型进行建模刻画。


Nowcasting模型的特点是:(1)适用于高相关数据:模型收敛的前提是隐含因子对系统的解释力度足够强,所以经济含义高度重叠的多个指标是加分项而非减分项;(2) 可扩展性强:三个关键方程均可以结合实际情况进行改造。前期报告《美国CPI的三周期Nowcasting模型》(2023-10-31)中,出于宏观经济变量建模的需求,我们对原版Simple-Nowcasting模型作了三点改进,提出了结合华泰三周期滤波和Simple-Nowcasting的Howcast模型

1)改进1:建模变量如果是非平稳序列,直接预测可能会面临伪回归的问题。Howcast模型对涉及的不平稳变量进行差分,从根源上解决了平稳性的问题;

2)改进2:前期报告《周期轮动规律的融会贯通》(2023-09-01)验证了全球宏观指标均受到基钦周期、朱格拉周期、库茨涅兹周期的共同驱动;Howcast模型用三周期模型代替AR(p)模型刻画隐含因子的状态转移过程,提高了隐含因子的预测效果;

3)改进3:相比原版简单使用VAR(p)过程预测特质因子尾部缺失值,Howcast模型进一步引入已发布指标的高频信息,大大提高了预测的精度。



简而言之,Howcast模型适用于建模变量非平稳、隐含因子具有周期波动特性和指标体系有高质量的高频指标的预测情景。其他原理方面的细节详见前期报告。本研究的建模对象主要为同比口径的宏观指标,原始序列在滚动窗口下大概率是非平稳的,可以进行一阶差分,转换为平稳序列后再进行建模。图表3至图表6以PPI同比和隐含因子为例进行展示。



前期报告《工业社会的秩序》(2021-05-17)用傅里叶变换和MUSIC算法证明了全球经济和金融系统普遍存在42、100、200个月的周期,分别对应古典经济学中的基钦周期、朱格拉周期、库兹涅茨周期,并用高斯滤波对周期信号提纯,提出了华泰三周期模型。前文已经提及,隐含因子可被视作通胀因子。为了验证三周期模型在本研究中的适用性,我们以隐含因子为因变量,以隐含因子的三周期滤波信号为自变量,进行多元线性回归。图表7和图表8展示了以2024年11月为截面,三周期滤波信号对隐含因子的拟合结果:



为了验证引入三周期模型的必要性,我们将p阶自回归(Autoregression, AR)模型作为对照组,比较两者对隐含因子的拟合优度。同样因为平稳性的问题,对照组需要先对隐含因子作一阶差分。为了提升结论的可靠性,我们使用自助法(Bootstrap)从两者的拟合结果中随机抽取1000组长度不小于42个月的连续序列,比较三周期模型和AR(p)模型的R2均值,并统计三周期模型R2大于AR(p)模型R2的比例。结果显示,无论p=1,2,3,三周期模型的R2均值都显著高于AR(p)模型的R2均值,且三周期模型的拟合优度在>95%的时间段中都比AR(p)模型的高。这表明三周期模型可以更好地刻画隐含因子,有助于预测



模型求解过程:小循环迭代预测,大循环控制收敛

Howcast模型并不存在解析解——模型中只有中国PPI及其他代理指标是已知的,待估计参数{ft,A,B,a,b}都是未知的。我们用EM算法来估计这些参数:

1) Expectation步:固定{A,B,a,b},用代理指标的预测值填充尾部缺失值后,再用主成分分析估计ft;

2) Maximization步:固定ft,使用最小二乘法依次估计{A,B,a,b}。


以EM算法为内核,我们首先设计了“小循环”,其目的是为了填充尾部缺失值、得到完整的隐含因子序列估计。为了提升模型收敛性,我们在“小循环”外套了“大循环”。下文列举了含有4个建模变量的例子来阐述求解过程。这4个建模变量分别存在3期(y1)、2期(y2)、1期(y3)、0期(y4)尾部缺失值。


第一步:我们用全体建模变量yti的第一主成分初始化隐含因子ft。注意,主成分分析的样本不包括含有缺失值的截面。所以在本示例中,初始化后的ft只在第1期到t-3期有数值,这是由已发布信息最少的y1所决定的。



第二步:我们带着初始化后的隐含因子ft进入“大循环”,在“大循环”中将会反复调用“小循环”。“小循环”使用EM算法,在填充缺失值的同时,不断修正拟合结果:


需要注意的是,只有“小循环”可能导致模型不收敛。“小循环”每迭代一次,除了隐含因子ft的1个尾部缺失值被Nowcasting值填上了之外,ft的早期有效值也会发生变化。这是因为“小循环”每迭代一次,参与主成分分析的截面数多了1期,导致建模变量在第一主成分中的权重发生了变化。


第三步:我们回到“大循环”,将隐含因子ft在t-2至t期的Nowcasting值还原为尾部缺失值,重新执行“小循环”。与上一轮“小循环”不同的是,由于前述原因,再次进入“小循环”时,ft的有效值和前一轮“小循环”的初始状态已然不同。不断执行“大循环”,当进入“小循环”前ft的有效值和离开“小循环”后ft的有效值完全相等时,模型收敛。


最后,还需要强调一点:模型收敛的一个必要条件是全体建模变量两两之间显著相关。我们考虑一种比较极端的情况。假设有两个指标y1和y2,两者不相关。那么,y1和y2的相关系数矩阵就是单位阵,两个特征值都为1。根据主成分的定义,第一主成分和第二主成分的贡献率均为50%。这就让模型“困惑”了——第一主成分究竟应该刻画y1,还是刻画y2?在这种情况下,“大循环”的结果可能会在y1和y2之间反复跳跃,无法收敛。所以,对于后文代理指标筛选过程选出高相关性的代理指标,读者无需过度忧虑。



03 中国PPI同比的Nowcasting与高频因子合成


本部分以中国PPI同比为核心指标,构建生产端通胀维度的高频指标体系。使用Howcast模型,滚动进行指标筛选、“残缺”指标Nowcasting和高频因子合成。高频指标体系的完备性可通过PPI同比的Nowcasting准确率进行评价。


底层指标库构建与清洗:自上而下和自下而上视角结合

备选指标库构建采用自下而上视角和自上而下视角相结合的方式,在确保宏观逻辑成立的前提下,尽可能地找全指标。搜集指标时,我们只纳入频率高于月频的指标,且不纳入金融市场资产价格指标,以保证因子体系严格反映高频宏观现实

1)自下而上视角:从中国PPI的细分子类出发搜集价格同步指标。“行业法”下,PPI细分为六大产业,包括采矿业、中游原材料、中游制造、下游制造(可选消费)、下游制造(必选消费)和公共事业类。“二分法”下,PPI细分为生产资料和生活资料两类;

2)自上而下视角:从宏观逻辑出发搜集PPI的基本面领先指标。PPI作为价格指标,受到国内外工业品供需两侧因素影响,可细分为国内外生产、投资、消费、进出口等维度。



考虑到不同指标发布频率、统计口径等不一致,在筛选代理指标之前需要对全体备选指标进行预处理。一般包括以下3个步骤:

1) 下载数据:除非只能够下载到同比口径数据,否则推荐下载总量/价格口径或者可以转成总量/价格口径的指标,后者包括环比口径、扩散指数等,以便后续更灵活地处理;

2) 统一频率:通过取均值或者期末值,统一数据频率,将所有可以转成总量/价格口径的指标转换为总量/价格口径,再将所有累计值指标转换为当期值指标;

3) 统一口径:将所有指标取同比转换为同比增速口径,或取环比转换为环比增速口径。


本研究在预处理数据时,将所有高频指标均转换为同比口径。因为核心指标PPI是同比序列,且同比口径有明显的周期波动特性,更适用于刻画经济运行规律。如何将指标转换为同比口径,取决于实际建模需求。在进行PPI同比的Nowcasting时,我们对高频指标取月均值进行降频,然后计算月度同比,取月均值是因为PPI是月内均价的概念。在合成周频因子时,对指标直接取周度同比容易遇到“错位问题”,因为各个年份、各个月份的周数不完全相同,可能出现3月第1周和去年2月最后1周计算同比的情况,这不符合同月对比原则。我们采用月内截至同天的累计同比。例如,在2024-10-20这一周,用2024-10-01至2024-10-20的均值除以2023-10-01至2023-10-20的均值,计算得到月内累计同比。


需说明的是,本研究不对高频代理指标进行额外的季调处理,因为生产端通胀不存在明显的季节性,取同比已足够;也不对指标作平滑处理,因为待预测变量均为实际公布值,且平滑处理会损失指标的信息量。


高频代理指标筛选流程:滚动筛选,捕捉动态逻辑

考虑到中国的工业结构是动态发展的,生产端通胀的代理指标也应该动态调整,所以我们采取滚动截面筛选指标的方式。这种方式也比较适用于我国部分高质量指标可用起点过晚的情况。筛选指标时,我们遵循两个标准:1) 数据质量达标。入选指标的可用序列长度不应过短;2) 相关性和领先性达标。入选指标与PPI同比高相关且不滞后。相关性和领先性评价方法包括时差相关性分析和DTW算法。


时差相关性分析

我们在做普通的相关性分析时,通常会将基准指标的t期和待评估指标的t期对齐,这种对齐方式被称作“领先0期”。时差相关性分析就是让两条指标序列错位——如果用基准指标的t期和待评估指标的t-k期对齐,就称待评估指标领先基准指标k期;如果用基准指标的t期和待评估指标的t+k期对齐,就称待评估指标滞后基准指标k期。我们可以预先指定一个错位范围,例如[0,1,2,3]表示将待评估指标依次延后0,1,2,3期,计算各延后序列与基准指标之间的相关系数,共4组。相关系数绝对值的大小刻画了两者相关性,绝对值最大的那组,对应的领先期数就是评价窗口内待评估指标相对基准指标的领先期数。不过,时差相关性分析严格要求序列一一对应,易受极端样本干扰,且假设领先滞后关系恒定。



DTW算法

DTW算法通过两条序列的相似度来评价相关性,对样本分布没有太高的要求,也允许两个指标的领先滞后关系动态变化。算法原理详见前期报告《行业配置策略:中观景气视角(2)》(2022-07-18)。图表14是算法输出结果的一个示例。图中的虚线表示两条序列样本点的匹配结果。两条序列样本点并非一一对应,而是根据形状相似度得到了一对多或者多对一的匹配关系。图中椭圆虚线框出了两组相同形状的匹配结果。每一条虚线的距离等于所连接的两个样本点的欧氏距离,所有虚线距离求和再除以序列长度即为月均DTW距离,该距离是对两者相关性的刻画——数值越小说明两条序列形状越相似。通过观察虚线倾斜的方向,还可以判断待评估指标相对于基准指标的领先滞后关系。例如,左图虚线整体往左倾斜,对应待评估指标滞后于基准指标;右图虚线整体往右倾斜,对应待评估指标领先于基准指标。



指标筛选结果

我们在每月末使用截至上月末的数据进行筛选,步骤如下:

1) 剔除距离筛选截面有效序列长度不足4年(≈1个基钦周期)的指标;

2) 剔除最近4期全为缺失值的指标。据我们观察,当一个指标连续4期全为缺失值时,该指标大概率已经停止更新;

3) 根据相关性和领先性分析结果确定初始指标池M。我们在计算时差相关系数和DTW距离时,只考虑各指标领先情况下的最优结果。对于价格同步指标,允许领先期在3个月以内,因为行业价格是PPI的构成部分,领先期不应过长;对于基本面领先指标,允许领先期在9个月以内。最优结果下,时差相关系数≥0.5且月均DTW距离≤0.5的指标入选,得到初始指标池M;

4) 根据代理指标一阶差分的相关性情况进行二次筛选。代理指标差分值(∆𝒚’)间的高相关性会带来两个问题。一方面,高频指标的差分值会同时作为特质因子拟合方程和隐含状态方程的残差拟合方程中的自变量,差分值高相关将导致多重共线性问题,影响预测效果。另一方面,差分值高相关的指标大概率是同一维度的重复刻画,并不带来增量信息,反而会加重指标体系的冗余性;

5) 二次筛选时,先按照代理指标和基准指标的相关性得分将代理指标从高到低排序,取得分最高的指标,记作P;相关性得分=时差相关系数+(1-DTW)。接着,计算指标P的差分值和其余指标差分值的同期相关系数,剔除相关系数≥0.5的其余指标,记作Q,将P放入最终指标池N。然后,在剔除了P和Q的指标池内重复上述操作,直至遍历完指标池M内的所有指标,得到最终指标池N。


由于PPI同比自1996年10月开始才有有效值,为了使隐含因子状态转移方程能够充分捕捉三周期规律,我们在模型经历过约一个库兹涅茨周期后再开始建模,所以滚动筛选的时间区间为2013年1月至2024年11月。从筛选结果来看,每期筛选出的高频代理指标个数为4-10个,年内指标重合度高,跨年指标重合度低。本月和上月指标的重合度均值为89.7%,本年和上年指标的重合度均值为64.1%,前三年和后三年指标的重合度均值为47.1%。这表明,随着中国工业结构的动态发展,不同时期生产端通胀的逻辑的确会发生变化,滚动筛选是有必要的。2024年1月至2024年11月期间,模型共筛选出9个代理指标,范围涵盖采矿业、中下游制造业、其他价格类和进出口等,指标细节详见图表16。




中国PPI同比的Nowcasting效果:“真实”R方高达81.2%

在t月末对t月的PPI同比进行Nowcasting时,我们将各指标的月频同比序列作为模型的输入变量。滚动预测时还需注意避免未来信息。虽然指标体系中除PPI同比外均为高频指标,但部分周频公布的指标也会出现在月末拿不到最后一周实际值的情况。例如,中国生产资料价格指数是一个周频指标,数据会延迟5天左右公布,我们需要将最后一周的数据视为缺失值,用前三周的均值计算月度同比。此外,筛选出的代理指标相较基准指标的领先期数均在3期以内,可以被AR(p)过程捕捉,所以不对指标进行滞后处理。


本文展示了2013年1月至2024年11月的预测效果。在评价预测效果时同样需要注意“伪相关”的问题——需要先对PPI同比的预测值和真实值开展一阶差分,再评价两者之间的拟合优度。结果显示,R2为81.2%;中国PPI同比增速变化方向(增速变高/变低)的预测准确率为77.6%;80%以上的样本预测误差在±0.6%以内,48.5%的样本预测误差在±0.3%以内。预测效果总体上良好,说明高频指标体系较完备,能够较充分地刻画生产端通胀的实时状态




高频生产端通胀因子合成:与PPI同比走势趋同,拐点领先

Nowcasting模型补全的隐含因子序列,就是我们需要的宏观因子,它刻画了生产端通胀的实时状态。只不过在高频视角下,我们需要以周为频率进行滚动合成。具体来说,在每周最后一天,我们将筛选得到的高频指标作为建模变量,先将延迟至下周发布的当周指标设置为缺失值,因为这部分数据我们站在对应的时点,是拿不到的。然后使用结合华泰三周期的Howcast模型对缺失值进行Nowcasting,得到补全的隐含因子序列,再将隐含因子最新一期记录下来,不断滚动拼接,得到最终的高频生产端通胀因子。从隐含因子的滚动方差贡献率结果看,高频生产端通胀因子可以解释整个指标体系约82%左右的信息量,可以作为整个高频体系的代理变量。


我们以实际公布日作为月度PPI同比的索引,例如2024年10月31日的PPI数据的实际公布日是2024年11月9日,我们就假设11月9日才能拿到10月份的PPI数据,并用前值填充的方法升频至周频,以便和高频宏观因子进行比较。从走势上看,高频生产端通胀因子和中国PPI同比的走势趋同,且包含更丰富的月内信息,尤其在一些拐点处,可以早于实际PPI公布日提供实际通胀状态的指引




04 应用:生产端通胀敏感型行业轮动策略


本部分在行业轮动的场景下,用高频生产端通胀因子指导投资。先筛选生产端通胀敏感型行业,确保PPI同比是行业组合的强解释变量。然后构建通胀轮动策略,并探究高频因子相比于PPI同比对策略的提升效果。最后进行参数敏感性分析。


生产端通胀敏感型行业筛选

在前期报告《行业配置策略:高频宏观因子》(2023-06-10)中,我们采用自上而下的Factor mimicking的思路,成功找到了几组资产组合,组合的同比收益率走势和对应维度的宏观代理指标的走势高度一致,进而可以使用资产组合模拟高频宏观因子。对于用于模拟宏观因子的资产组合而言,被模拟的宏观指标是一个强变量,所以我们可以借鉴前期报告的筛选逻辑,进行通胀敏感型行业的筛选。


具体地,我们选取中信一级行业指数作为各行业的代理变量,共计29个行业。为刻画PPI同比对各个行业收益率的解释力度,我们以行业指数的月频同比收益率序列为因变量,以对齐后的PPI同比为自变量,在样本内(2009年至2024年)开展有放回抽样(Bootstrap)的一元线性回归,具体步骤如下:

1) 随机挑选一段连续的超过30个月的样本序列,对每个行业指数进行Huber线性回归以减轻异常值干扰,记录回归系数的t值和R2;

3) 重复上述步骤1000次,统计回归系数t值和R2的中位数,用以表征PPI同比对行业收益影响的显著性。


自助法抽样的回归结果表明,PPI同比对煤炭、钢铁和有色金属等上游周期性行业有显著的正向影响,表现为回归系数t值显著为正,拟合R2普遍高于20%。这符合宏观逻辑,上游周期性行业的产成品收入会直接受益于商品价格的上涨,而成本端的人工、固定资产折旧等又相对刚性,即收入对通胀的敏感度高于成本对通胀的敏感度,所以通胀上行利好企业盈利。PPI同比对传媒、通信和消费者服务等下游行业有显著的负向影响,表现为回归系数t值显著为负,拟合R2普遍高于20%。从宏观逻辑上理解,当企业成本端议价能力和转移能力较弱时,上游成本的抬升会压制下游企业的盈利空间,形成利空。此外,对于一些成长性行业,通胀高企会带来政策收紧预期,压制估值,间接形成利空。



结合回归结果和宏观逻辑,最终选取煤炭、钢铁、有色金属和石油石化行业作为生产端通胀相对利好行业的代表,“相对”表示和其他行业相比,前述四个行业更容易在通胀上行中受益,下文如无特殊说明,利好利空均为相对概念。选取传媒、通信、计算机和消费者服务行业作为生产端通胀相对利空行业的代表。仿照前期报告的做法,我们做多通胀利好组合,做空通胀利空组合,以各行业滚动3年同比收益率的波动率的倒数为各行业的权重,这样构建得到的FMP组合的同比收益率和PPI同比高度相关,可以认为生产端通胀是FMP组合的一个强解释变量,可以用于指导通胀敏感型行业的轮动。



生产端通胀轮动策略构建

宏观因子趋势交易信号:双均线指标

宏观指标用于轮动策略的一种思路是——宏观趋势交易,即当高频宏观因子趋势上行时,我们认为通胀利好行业的表现会优于通胀利空行业,对通胀利好行业进行超配;反之,当高频宏观因子趋势下行时,我们超配通胀利空行业。这种方式下,我们需要找到一个可以刻画宏观因子上下行趋势的指标。双均线是一个简单有效的选择。它基于两条不同周期的移动平均线的相对位置变化来研判序列的趋势。当短期均线从下方向上穿过长期均线时,视为上升趋势开启,又称金叉信号。在每个调仓日,双均线指标的计算方法如下:

1) 计算宏观因子1/4/8/12/16/20/24/28/32/36/40/44/48/52周均线,即观察期为1年;

2) 划分长短均线窗口。短均线窗口为1/4/8/12/16周;长均线窗口为4/8/12/16/20/24/28/32/ 36/40/44/48/52周;

3) 遍历长短均线组合(共计55组),当短均线从下方上穿长均线时,+1分,其余情况+0分,计算总得分M;

4) 双均线金叉得分=M/55,得分越高(低)表示高频宏观因子上行(下行)趋势更强。


相比于指定单一的长短线窗口,综合考虑多组长短均线可以提升信号的鲁棒性,减轻参数敏感问题对策略效果的干扰。



轮动策略回测结果分析

回测的具体设置如下:

1)回测区间:2014-01-05至2024-11-29

2)回测标的:中信一级行业指数

3)调仓频率:周频

4)等权基准组合:煤炭、钢铁、有色金属、石油石化、传媒、通信、计算机、消费者服务共8个行业等权配置

5)通胀轮动策略:双均线金叉得分≥M时,满仓生产端通胀利好组合(煤炭、钢铁、有色金属、石油石化);双均线金叉得分≤N时,满仓生产端通胀利空组合(传媒、通信、计算机、消费者服务);其余情况等权配置。{M,N}为轮动阈值参数,暂取{0.8,0.2}

6)交易费用:双边2‰


回测结果表明,通胀轮动组合可以显著跑赢等权基准组合,各绩效表现均显著提升。通胀轮动组合扣费后年化超额收益为11.53%,以年为单位统计的超额胜率为81.82%;夏普比率提升了0.37;最大回撤降低了约7 pct。




对照组:PPI同比代替高频生产端通胀因子

为了进一步论证对生产端通胀维度进行有效升频的必要性,我们使用PPI同比代替高频宏观因子,构建对照策略。假设每月末就能拿到当月的实际值,我们考虑三种构建方式:

1)方式1:PPI同比使用月频值,短均线窗口为1/2/3/4/5月,长均线窗口为3/4/5/6/7/8/9/10/11/12月,观察期为1年,月频调仓;

2)方式2:PPI同比使用月频值,短均线窗口为1/3/6/9/12月,长均线窗口为3/6/9/12/15/18/21/24/27/30/33/36/39月,观察期为3年,月频调仓;

3)方式3:PPI同比用前值填充的方式升频至周频,短均线窗口为1/4/8/12/16周,长均线窗口为4/8/12/16/20/24/28/32/36/40/44/48/52周,观察期为1年,周频调仓。


轮动阈值沿用{0.8,0.2},其他回测参数和原始通胀轮动策略保持一致,策略均考虑双边千二的交易费用。回测结果显示,三组对照策略的表现并无显著差别,使用方式3构建的策略的表现相对更优。这表明通过对PPI同比进行简单的升频,就可以对策略起到一定的提升效果。使用高频生产端通胀因子构建的轮动策略在各绩效指标上的表现都绝对优于三组对照策略。2023年以来,高频通胀因子轮动策略的表现更加突出,扣费后累计收益高达45.38%,而三组对照组策略的扣费后累计收益仅分别为13.37%、7.53%和20.19%。这可能是因为最近两年的宏观交易逐渐“高频化”,月频的宏观指标已经无法满足投资需求。对宏观因子的有效升频,为投资提供及时且相对准确的指引,是十分有必要的。




参数敏感性分析

策略有两组参数:(1) 双均线信号计算时使用的长短均线窗口;(2) 通胀轮动策略的轮动阈值{M,N}。对于前者,我们已综合考虑多组均线信号以减轻策略对该参数的敏感性,故不再作分析,本部分仅对轮动阈值进行敏感性分析。M是策略满仓通胀利好行业的双均线金叉得分阈值,取值范围为[0.5,0.9],步长为0.05;N是策略满仓通胀利空行业的双均线金叉得分阈值,取值范围为[0.1,0.5],步长为0.05;{M,N}共计9x9=81组不同的参数组合。记录不同参数下,高频通胀因子轮动策略和三组对照策略相比于等权基准的年化超额收益,并统计高频通胀因子轮动策略在各个参数组合下的超额战胜三组对照策略的比例。


从敏感性分析结果看,高频通胀因子轮动策略对轮动阈值并不敏感,各参数组合下均能够获得超额,年化超额收益中位数10.45%;并且超额收益稳定地优于三组对照策略,2023年以来更为突出。高频通胀因子轮动策略在{M,N}={0.8,0.3}时年化超额收益最高,全回测区间为13.00%,2023年以来为15.80%。




风险提示:

通胀敏感型行业基于历史规律进行筛选,历史规律可能失效。通胀轮动策略的表现可能受到其他因素影响,当其他因素占主导地位时,策略可能失效。报告中涉及到的具体资产不代表任何投资意见,请投资者谨慎、理性地看待。

相关研报

研报:《中国PPI的Nowcasting与通胀敏感型行业轮动》2024年12月6日

分析师:林晓明 S0570516010001 | BPY421

分析师:徐特    S0570523050005

分析师:何康    S0570520080004

联系人:李薇    S0570124070087


关注我们


华泰证券研究所国内站(研究Portal)

https://inst.htsc.com/research

访问权限:国内机构客户


华泰证券研究所海外站

https://intl.inst.htsc.com/research

访问权限:美国及香港金控机构客户
添加权限请联系您的华泰对口客户经理

免责声明

▲向上滑动阅览

本公众号不是华泰证券股份有限公司(以下简称“华泰证券”)研究报告的发布平台,本公众号仅供华泰证券中国内地研究服务客户参考使用。其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,且若使用本公众号所载内容,务必寻求专业投资顾问的指导及解读。华泰证券不因任何订阅本公众号的行为而将订阅者视为华泰证券的客户。

本公众号转发、摘编华泰证券向其客户已发布研究报告的部分内容及观点,完整的投资意见分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本公众号内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华泰证券所发布的完整报告。

本公众号内容基于华泰证券认为可靠的信息编制,但华泰证券对该等信息的准确性、完整性及时效性不作任何保证,也不对证券价格的涨跌或市场走势作确定性判断。本公众号所载的意见、评估及预测仅反映发布当日的观点和判断。在不同时期,华泰证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。

在任何情况下,本公众号中的信息或所表述的意见均不构成对任何人的投资建议。订阅者不应单独依靠本订阅号中的内容而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。订阅者若使用本资料,有可能会因缺乏解读服务而对内容产生理解上的歧义,进而造成投资损失。对依据或者使用本公众号内容所造成的一切后果,华泰证券及作者均不承担任何法律责任。

本公众号版权仅为华泰证券所有,未经华泰证券书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。如因侵权行为给华泰证券造成任何直接或间接的损失,华泰证券保留追究一切法律责任的权利。华泰证券具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。


华泰证券金融工程
主要进行量化投资相关的研究和讨论工作。
 最新文章