PTA作为聚酯产业链的中间产品,主要满足下游原料聚酯的需求,并进一步用于服装纺织和包装材料中。随着国内聚酯产业的需求增强和生产装置的技术更新,我国PTA产能、产量和需求均大幅上升,在全球PTA产业中具有较大的定价权。
从PTA上下游情况来看,其产能和消费集中度都比较高。原油存储和炼化战略布局集中在东部沿海地区,而服装产业集群也多集中东部、南部沿海地区。相比于上游原料,PTA受宏观政策和国际局势影响较小,上下游产业链价格的相关性较高。因此,PTA价格走势具有较高的研究价值。
从交易角度看,PTA作为2006年就挂牌上市的期货品种,是我国首个化工期货品种,交易量大、流动性好、市场透明度高。PTA品种数据充足,将其量化模型分析具有可行性。另一方面,市场参与结构较为完善,意味着基本面对于价格的驱动传导机制较为通畅,市场有效性大部分情况下相对稳定。
在构建策略模型前,我们根据PTA产业特征充分考虑季节性因素的影响。PTA生产装置每年需要进行检修,生产企业往往会选择淡季进行装置检修从而减少供给侧的影响。秋冬季节是纺织行业的传统旺季,服装和家纺行业的需求会显著增加,进而带动聚酯纤维需求的上升,可能推动PTA价格上涨。
在之前的量化研究中,我们运用多种机器学习模型来进行拟合和预测,在基本面因子探索方面取得了一定的进展。我们仍然会以尊重主观基本逻辑为前提,以合理的分析方法,建立多维度模型加以比较和论证。本文中我们梳理了影响PTA价格的产业链逻辑,深度挖掘影响价格的基本面数据。
基于供给-需求-成本-价差四因子模型构建的周频策样本外年化收益18.05%,夏普比值2.83。样本内价差因子表现最佳,年化收益49.97%;样本外需求因子较好,夏普比1.81。
1. 基本面相关因子
PTA既是原油产业链的末端产品,同时又是化纤的前端产品,起到承前启后的作用,影响其价格变化的因素较多。本文将PTA的基本面因子分为四个大类,分别为供给因子、需求因子、价差因子和成本因子。
供给因子:PTA装置运行负荷的变化是导致供应变化的重要因素,生产企业的集中检修通常集中在每年的春季或者秋季。多数情况下,装置的开工负荷受制于行业利润水平的高低,当预期下游需求较大或者利润空间变大时,企业生产积极性会提高。因生产周期的滞后性,行情在上涨过程中,产品出厂时利润空间会放大,工厂生产负荷往往会加大,但随着产品价格的进一步提升,下游承受能力逐渐减弱,同时供应量的加大会对价格的继续上涨形成压制。相反,在行情下跌过程中,生产利润下降,工厂或停车检修,市场供应量减少,将会减缓行情的下跌速度,若出现供不应求的情况,价格也有可能出现反弹。
需求因子:PTA主要用于生产聚酯产品,生产1吨聚酯产品需要0.85吨左右的PTA,聚酯的生产运行负荷变化是最能反映下游对于PTA需求变化的指标。同时,纺织增长决定终端需求,聚酯产品中涤纶对PTA的需求量占比较大。化纤产量占我国纺织工业纤维加工总量的近85%,而化纤中涤纶占80%左右,可见涤纶是纺织行业的主要原料。也就是说,纺织行业的景气程度、发展情况直接影响涤纶市场消费,进而对PTA需求产生影响,可以通过重点关注纺织企业以及印染厂开机率等指标来进行评估。
成本因子:PTA的上游原料来源单一,基本都是由PX生产而来。PTA的价格与上游原料(如PX、原油)有较强的关联性,成本传导机制较为清晰。近年来,PTA行业产能过剩形势加剧,行业利润受到大幅挤压,成本端驱动效应更加显著。市场上90%以上的PX是用来生产PTA的,因此PX的价格以及供需情况会对PTA的市场价格产生直接的影响。PX的原料是石油,石油经过馏分获得石脑油,从石脑油中提炼出MX,再由MX生产PX,最终获得PTA。原油作为石化行业的源头,其价格的变化会影响PTA的市场价格,尤其在期货市场上的影响会被放大。此外,原油价格的涨跌会影响下游市场的心态,指导原料的采购,进而主导整条产业链产品的行情。
价差因子:主要由华东地区期现价差以及聚酯产品加工差构成。随着交割制度的不断完善,产业参与PTA期货意愿增加,期现联动性增强,其中华东基差的变化会影响套期保值和套利活动的积极性。聚酯产品加工差包括瓶片、DTY、POY、FDY以及短纤加工差,可以说是PTA下游行业开工负荷的领先指标。如果加工差扩大,意味着下游企业盈利情况改善,企业开工积极性提升,市场对未来需求持乐观态度,预期推动PTA价格上涨;若加工差缩小或转负,表明下游企业面临成本压力,则PTA价格可能承压。
2. 数据清洗
2.1 数据频率和季节性处理
数据频率方面,我们选择日频和周频数据,更低频次的数据由于样本数量过少不利于拟合,且发布时间往往滞后不足以支持样本外实际跟踪。考虑到PTA日内价格波动较大,第一种方法是将周频数据映射为日频数据,但是这里并没有采用插值法来直接估算实际数据未发布前的数据,而是统一采用原数据,因为这样可以匹配更为真实客观的对应关系。第二种方法是统一将所有数据低频化处理,这主要是考虑到PTA所获取的基本面数中供应以及需求大类因子均为周频,对应的信号变化频率也偏向周度层面的变化,因此考虑将周频模型的表现与日频模型进行比较,同时考虑周期同比、环比和均线平滑来处理这些数据。
2.2 数据滞后性处理
日频数据基本都会在交易日当天收盘后更新,而周频数据基本在周五发布。因此我们在做特征有效性检测和建模过程中统一将这些数据延后一阶处理,即当天获得的数据生成信号在下一个交易日进行交易。
2.3 去极值和标准化处理
数据中的极值往往会影响在线性模型假设下的拟合,同时对于映射关系也存在错误推断的可能,因此我们将高于时序数据3 倍标准差的数值调整为平均值偏离3 倍标准差。此外,所有的基本面因子采用W检验的方式处理其数据的正态关系,通过P-value值观测,检验中只有少量因子存在相对正态分布关系,因此集中处理其影响模型预测精度的异常值并按照各个大类因子数据特征进行标准化处理,使得大类数据和PTA价格数据处于同一假设关系。
整体数据选取2019年1 月至2024年12月的基本面数据,进行差值处理和数据填充整合,分别采用相关性及平稳性检验、回归测试单因子有效性,进而设计基本面因子指导的交易策略。
供给因子中,PTA产能利用率及厂内库存可用天数的胜率较高。高产能利用率意味着市场供应较为充足,可能导致PTA价格承压。PTA库存可用天数的变化可以反映市场对后期供应的预期,如果市场货源充裕,下游需求一般,库存可用天数可能延长,一般长假前后该指标的变化较为显著。成本因子中,布伦特原油期货活跃合约收盘价的胜率较高。该因子代表国际市场对未来油价的预期,会直接影响PX的成本,进而传导至PTA的价格。并且原油作为商品之王,价格的波动还受到宏观经济、地缘政治等多重因素影响,这些因素通过油价的变化传递到整个化工产业链,对PTA价格的变化产生较大影响。
需求因子中,聚酯纤维长丝厂内库存可用天数及印染厂开机率的胜率较高,主要因为它们直接反映了产业链中下游的需求情况,具有较强的参考性。价差因子中,聚酯纤维加工差的胜率较高。该因子代表下游聚酯工厂在生产过程中的利润空间,能够提前反映市场的变化趋势,不仅包含了PTA和EG的价格信息,还考虑了下游产品的市场价格和其他加工成本,综合体现了多个因素的影响,可以看作下游需求的领先指标。
通过计算信息系数IC,我们可以了解因子值对于下期PTA收益率的预测能力以及因子间的内在相关性。从整个单因子线性回归结果看,成本因子以及价差因子对于价格的影响较大,相关性也更为显著。需求端印染厂以及纺织企业开机率等存在一定同步性,导致多重共线性的可能提升,我们通过特征筛选模型进行识别,并在合成因子时引入相关性罚值。
整体来看,因子构建逻辑主要根据估值+驱动的方法,首先从基本面上找到估值过低或过高的行情,然后再结合技术面以及产业装置变化等情况来寻找行情驱动因子。
3. 基本面多空策略周期信号的嵌套和比较
3.1 时序多空模型
我们将筛选得到的供给、需求、价差和成本四大类中的每个因子,从时间序列维度出发,根据IC 正负关系,遍历参数得到单因子开仓阈值,随后我们将这些单因子开仓阈值在每个大类中进行加权合成,产生大类因子的开仓信号。
3.1.1 日频信号
PTA在化工品种中日内价格波动较大,因此从信号生成和调仓频率出发,我们优先考虑将周度数据高频化处理,与日度数据合成日频信号。在进行分类后选取IC 值存在有效性的因子做阈值筛选,并按照IC 的正负相关性方向作为信号的变化方向,当与标的处于正相关关系的时候时同方向变化,反之信号反方向变动。我们使用Odds Ratio作为筛选指标对每个大类下的因子进行遍历,通过排序选取OR,从而增加合成开仓信号的胜率大小。对于不同的因子的最高OR 筛选的阈值进行合成后折算成不同因子相应的胜率,并按照胜率以及相关性罚值对不同大类下的合成因子进行加权。通过单因子净值的统计指标分析,价差、成本、供给以及需求大类单因子的平均胜率分别为0.47、0.70、0.55以及0.57左右,同时各个大类的平均年化收益集中在45.46%、67.55%、40.40%以及32.82%左右。从大类单因子入手观察对于收益变化影响,成本因子中,布伦特原油期货活跃合约收盘价的胜率较高。该因子不仅与PTA的生产成本密切相关,还能作为市场情绪和预期的领先指标,不论是样本内还是样本外的收益表现都相对较好。
3.1.2 周频信号
商品基本面逻辑通常较少在短时间内发生较大改变,将周频因子进行高频化处理也可能会造成信息缺失。因此如果在牺牲一定交易机会的条件下将日度数据低频化处理,能够更好地发挥与周度数据的协同性,更长的时间区间也有利于反映基本面的变化。同时,在周度层面上也更便于检验分析数据在同比、环比等时间周期方面的有效性。
PTA周度数据整体预测表现从收益以及稳定性来说没有日频策略效果好,我们尝试对数据集进行切片化处理,优化在极端行情下出现的过拟合问题。从整体数据角度出发,PTA基本面的周度数据量占比超过日度数据,尤其体现在需求大类。从年化收益的角度出发,周度数据的价差、成本、供给以及需求大类单因子的平均年化收益集中在50.00%、48.3%、35.3%、31.5%左右。相较而言,周度数据占比更高的大类因子在周频策略中表现更佳。需求因子在周频策略中样本外的年化收益、最大回撤以及夏普比率均优于日频策略。价差因子在周频策略中若只保留下游聚酯产品加工差因子的整体收益表现更好,因为该因子能够提前反映市场的变化趋势,不仅包含了原料的价格信息,还考虑了下游产品的市场价格和其他加工成本,综合体现了多个因素的影响,可以看作下游需求变动的领先指标。
4. 实证分析
从周频策略的表现来看,年化开仓次数大多在17-25之间,夏普比均达到1以上水平,其中价差因子表现最佳,年化收益49%以上。日频策略的整体收益和风险控制能力均优于周频策略,成本因子的收益能力显著突出,风险控制能力也最佳,样本内外最大回撤不超6%,夏普比达到3以上水平。表现相对较差的是需求因子,2022至2023年俄乌冲突后原油和汽油调油需求成为影响市场的重要边际变量,过剩周期下产业链利润低位,终端需求较差,单因子有显著回撤,样本外收益表现一般。
近年来由于PTA行业过剩格局加剧,价格成本驱动较强,装置运行负荷以及下游开工的变化对行情的影响相对弱化,体现在模型中供给以及需求因子在样本外的有效性不如价差以及成本因子表现好,因子的解释力度相对较为有限。后续我们可以就供给和需求因子季节项以及趋势项的拆解进行进一步探索,优化模型的大类因子表现。
国投期货
高级分析师 王锴 期货投资咨询证号:Z0016943
分析师 王雪忆 期货从业资格证号:F03125010