【论文荐读】基于Pathways架构的自适应多尺度时间序列预测

文摘科技 2024-11-01 07:01 江苏

标题：Pathformer: Multi-scale Transformers with Adaptive Pathways for Time Series Forecasting

期刊：ICLR 2024

作者：Peng Chen, Yingying Zhang, Yunyao Cheng, Yang Shu1, Yihang Wang1, Qingsong Wen, Bin Yang, Chenjuan Guo

单位：East China Normal University, Alibaba Group, Aalborg University

1、研究背景：

现实场景中的时间序列在不同的时间尺度展现出不同的变化，如云计算场景中的CPU，GPU，内存等资源需求呈现出日、月、季节等独特尺度的时间模式。多尺度建模主要从不同的尺度中提取时序特征和依赖关系，建模多尺度需要考虑两个方面：时间分辨率和时间距离。时间分辨率指用于建模的每个时间片段的大小。如图1中，相同的时序别划分为小的片段（蓝色）或大的片段（橙色），提出细粒度和粗粒度的时序特征。时间距离对应于显示建模时间依赖性，决定用于时序建模时时间步之间的距离。如图1中，黑色箭头模拟了相邻时间步之间的关系，提取时序的局部细节，而彩色箭头模拟了跨长距离的时间步之间的关系，提取时序的全局关联。

图1 左边：时间序列被划分成不同大小的Patches作为时间分辨率。右边：局部细节（黑色箭头）和全局关联性（彩色箭头）通过不同的时间距离被建模。

2、论文创新点：

1）提出多尺度划分，将时间序列划分为不同大小的patch，形成不同时间分辨率的视图;

2）进一步提出了自适应路径来激活多尺度建模能力并赋予其自适应建模特性；

3）具有时间分解的多尺度路由器与聚合器协同工作，根据输入数据的时间动态自适应地提取和聚合多尺度特征，实现时间序列的自适应多尺度建模。

3、研究方法：

基于Transformer模型的多尺度建模，主要有两个挑战。一、不完备的多尺度建模。只是针对时间分辨率不能有效地捕捉不同范围的时间依赖关系，相反，考虑时间距离虽然能提取不同范围的时间依赖，但全局和局部间隔受到数据划分的影响，单一的时间分辨率并不完备。二、固定的多尺度建模过程。对比图1中的两个时序，上面的时序展现快速的波动，可能需要更关注细粒度和短期特征。相反，下面的时序需要关注粗粒度和长期特征。因此对所有时序采用固定的多尺度建模阻碍了每个时序的重要特征捕捉，然而为每个数据集或每个时序手动调整最佳尺度非常耗时且难以处理。

针对以上挑战，文章提出了一个基于Pathways架构的自适应多尺度Transformer模型（Pathformer），如图2所示。整个预测网络由：实例正则化（Instance Norm）、自适应多尺度块（Adaptive Multi-Scale block, AMS Blocks）的堆叠，以及预测器（Predictor）组成，Predictor是一种全连接神经网络，核心是中间的自适应多尺度AMS block模块。它整合了时间分辨率和时间距离提出了一个多尺度Transfomer模块，使模型具备完备的多尺度建模能力。文章进一步提出自适应pathways，激活Transformer的多尺度间建模能力。它基于输入时序的时间动态自适应提取和聚合多尺度特征，实现了自适应多尺度建模。

图2 Pathformer的架构

（1）多尺度Transformer模块：

在多尺度Transformer块中，我们对输入的时序特征进行不同patch大小的时序划分，不同的patch大小代表不同时序的时间分辨率。基于每个尺度的Patch划分，使用双重注意力机制来建模不同范围的时间依赖性，如图3所示，通过patch内注意力(intra-patch attention)建模每个patch内部不同时间点之间的关联来捕捉时序的局部细节，通过patch间注意力（inter-patch attention) 建模不同patch之间的关系来捕获全局信息。

图3 多尺度Transformer模块

1）多尺度分割：定义每个patch大小为S，原序列长度为H，则序列被分割为P（其中P = H/S）个patch，即(X1, X2, ..., XP)。patch的大小就是分割的尺度差异，为输入序列提供不同分辨率的时间视图。

2）双注意力机制：基于每个尺度的patch划分，作者构建了双重注意力机制来建模patch的依赖关系。如图3中所示，包括使用patch内注意机制建立每个patch内时间步骤之间的关系以及使用patch间注意力机制建立块间关系来捕捉全局相关性。

总体而言，多尺度分割提供了不同patch大小的时间序列的不同视图，而patch大小的变化进一步影响了双注意机制，双注意在patch分割的指导下从不同距离建模时间依赖性。这两个组件一起工作以支持Transformer中的多个时间建模尺度。

（2）自适应Pathways：

由于不同的时序偏好不同的尺度，这取决于它们不同的时间特征和动态性。为了实现自适应多尺度建模，文章提出了基于多尺度Transformer的自适应Pathways。如图2所示，它包含了两个关键部分：多尺度路由器和聚合器。多尺度路由器根据输入数据选择特定大小的patch进行划分（选择的patch大小在图2中用蓝色表示），这激活了Transformer中特定部分，并控制多尺度特征的提取。路由器和聚合器一起协同工作，通过加权聚合将这些特征组合起来得到Transformer块的输出。

1）多尺度路由器：通过傅里叶变换选择最佳的patch划分尺寸，从而控制了多尺度建模的过程。由于每个时间序列的最优尺度或临界尺度可能受到其复杂的固有特征和动态模式(如周期性和趋势)的影响，因此文章在路由器中引入了一个时间分解模块，该模块包含季节性（利用离散傅里叶变化和逆变换将时间序列从时域转换到频域，以提取周期模式）和趋势分解（采用移动平均线平均池化的不同核，在季节性分解后的剩余部分基础上提取趋势模式），如图4所示。选择top K个权重送至多尺度Transformer模块以执行多尺度建模。

图4 多尺度路由器

2）多尺度聚合器：由于不同的patch大小产生的时间维度不同，聚合器首先执行一个变换函数来对齐不同尺度的时间维度。然后，聚合器根据路径权重对多尺度输出进行加权聚合，得到该AMS块的最终输出。

（3）实验：

文章在九个真实世界的数据集上进行实验，以评估Pathformer的性能，包括电力运输、天气预报和云计算等一系列领域。这些数据集包括ETT (ETTh1、ETTh2、ETTm1、ETTm2)、天气、电力、交通、ILI和云集群(Cluster- a、Cluster- b、Cluster- c)。

文章选择了一些最先进的模型作为基线，包括：PatchTST (Nie et al., 2023), NLinear (Zeng et al., 2023), Scaleformer (Shabani et al., 2023), TIDE(Das et al., 2023), FEDformer (Zhou et al., 2022), Pyraformer (Liu et al., 2022b), 和 Autoformer(Wu et al., 2021)。为了确保公平比较，所有模型都遵循相同的输入长度(ILI数据集H = 36，其他数据集H = 96)和预测长度(云集群数据集F∈{24,49,96,192}，ILI数据集F∈{24,36,48,60}，其他数据集F∈{96,192,336,720})。选择了时间序列预测中常用的两个指标:平均绝对误差(MAE)和均方误差(MSE)。

表1显示了多变量时间序列预测的预测结果，在88个案例中，Pathformer在81个案例中表现最好，在5个案例中表现第二。与第二好的基线PatchTST相比，Pathformer显示出显著的改善，MSE降低了8.1%，MAE降低了6.4%。与强线性模型NLinear相比，Pathformer也有全面的表现，特别是在电力和交通等大型数据集上。这证明了Transformer架构在时间序列预测方面的潜力。与多尺度模型Pyraformer和Scaleformer相比，Pathformer表现出了良好的性能提升，MSE降低了36.4%，MAE降低了19.1%。结果表明，基于时间分辨率和时间距离的自适应路径综合建模对于多尺度建模更为有效。

表1 多变量时间序列预测结果

为了评估Pathformer的可转移性，文章对比三个基线模型设计两个不同的迁移实验，表2给出了文章迁移学习评估的结果。在直接预测和全调优方法中，Pathformer都超越了基线模型，突出了其增强的泛化和可转移性。文章还进行了消融实验说明了每个模块的独特影响，并进行参数敏感性研究，结果表明预测精度随K（自适应选择的patch大小的数量）的变化而变化。

表2 迁移学习结果

4、结论：

本文提出了一种用于时间序列预测的多尺度Transformer与自适应路径（Pathformer）。它通过引入具有多尺寸的patch划分和对划分的patch进行双重注意力建模，将多尺度序列分辨率和距离整合在一起，从而实现了对多尺度特征的全面建模。此外，自适应路径根据不同的时间动态路由选择和聚合尺度特定特征。这些创新机制共同使Pathformer能够在多个预测任务中取得出色的预测性能，并展现出强大的泛化能力。

http://mp.weixin.qq.com/s?__biz=MzU1ODg5NzQ0NA==&mid=2247485466&idx=1&sn=49f2f8ff30a0f9463e25f5d70e4f40d2

智能自主无人系统课题组

智能自主无人系统（IAUS）课题组坚持“面向国家重大科技需求，引领行业技术进步”的思路，专注于人工智能技术在自主无人系统、机器人、智能工程装备领域的基础和应用研究，分享和发布最新科研动态及研究成果。

最新文章

【论文荐读】基于Pathways架构的自适应多尺度时间序列预测

【论文荐读】一种用于表面缺陷实时检测的高效靶向设计方法

【论文荐读】基于深度强化学习的VUCA环境下机器人无地图导航

课题组硕士研究生成果发表在工业人工智能领域一区TOP期刊Computers in Industry

【论文荐读】具备预判避碰决策的无人艇集成智能引导和运动控制研究

【论文荐读】面向表面缺陷检测的多分支结构多层特征融合网络

【论文荐读】一种用于粒度分析的煤粉图像分割方法

【论文荐读】水声目标识别的联合学习模型

【论文荐读】未知环境下多机器人协同探索的混合多策略快速探索随机树算法

【论文荐读】速度与输入受限的多机器人系统鲁棒避障编队导航方法

【论文荐读】基于机器视觉的目标检测技术二十年发展综述

【论文荐读】基于自适应类内和类间卷积神经网络的变速箱变工况智能故障诊断

【论文荐读】ESDMR-Net：一种具有扩展压缩和双多尺度残差连接的轻型网络

【论文荐读】基于多智能体强化学习的无人艇协同多目标围捕

【论文荐读】时间序列预测：一种具有概率分解表示的分层Transformer

【论文荐读】基于深度强化学习和分布式优化的未知环境下多机器人导航与编队控制

21级专硕王家卿《面向空地协同的无人机对地目标跟踪与自主降落研究》

21级学硕鲁宇琦《水面无人艇集群协同的侦察-驱逐-布防控制方法研究》

21级专硕夏煜《基于红外热成像的铝箔封口缺陷检测研究》

21级学硕吴建彬《退化环境下激光雷达与IMU融合的移动机器人自主探索研究》

21级学硕王浩《数据驱动的绞吸船横移挖掘过程建模及自学习控制研究》

【论文荐读】基于近端策略优化的有限感知无人艇集群避障

21级专硕杨颖《基于机器视觉的柱状产品贴标及喷码缺陷检测研究》

22级学硕李亚军《基于激光和视觉融合的移动机器人自主导航研究》

【论文荐读】基于CNN和Transformer的无人机实时目标检测网络

【论文荐读】一种能够学习多尺度上下文感知特征的通用伪装目标检测框架

【论文荐读】一种具有多级注意力机制的U-Net医疗图像分割方法

【论文荐读】一种用于表面缺陷检测的具有全局和局部特征增强的实时无锚缺陷检测器

【论文荐读】MLDFR：一种用于异常检测和定位的受损图像多级特征恢复方法

【论文荐读】基于几何线索提取和圆分解的多机器人复杂场景探索

【论文荐读】不同环境下从避障到可推动障碍物导航的课程强化学习

【论文荐读】基于机器视觉的径向圆跳动测量方法

【论文荐读】关于迁移学习驱动的智能故障诊断设计的调查、见解和展望

【论文荐读】UIU-Net: 用于红外小目标检测嵌套U-Net模型

【论文荐读】3U:面向协同目标搜索的UAV-USV-UUV网络联合设计

【论文荐读】基于深度强化学习的无人船避障方法

【论文荐读】基于优化权重谱指数的机械故障诊断自适应故障分量提取

【论文荐读】基于异步多智能体强化学习的高效实时多机器人协同探索

【论文荐读】MR-TopoMap: 通信受限条件下基于拓扑图的多机器人探索

【论文荐读】面向多智能体强化学习的共享学习方法

【论文荐读】多模态融合的自主导航方法：采用稀疏奖励和事后经验回放策略的深度强化学习

【论文荐读】基于图像增强和改进Faster R-CNN的故障卫星部件检测方法

【论文荐读】空间变形鲁棒场景中构建超分辨率文本图像的文本注意网络

【论文荐读】基于深度学习的二维激光雷达车辆检测

【论文荐读】Informer：超越Transformer的长序列时间序列预测方法

【文献综述】深度学习和深度强化学习的特征提取网络

【论文荐读】基于卷积神经网络的航拍图像电线绝缘子缺陷检测

【论文荐读】基于机器视觉和机器学习的大口径光学器件表面缺陷高效精确检测

【论文荐读】基于LIO且紧耦合车辆动力学估计的定位和建图方法

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉