轻量化时间序列预测模块SparseTSF，即插即用，即用即涨点

文摘 2025-01-20 17:20 中国香港

论文介绍

题目：SparseTSF: Modeling Long-term Time Series Forecasting with 1k Parameters

论文地址：https://arxiv.org/pdf/2405.00946

QQ深度学习交流群：994264161

扫描下方二维码，加入深度学习论文指南星球！

加入即可获得，模块缝合、制作、写作技巧，学会“结构”创新、“创新点”创新，从三区到顶会，小论文大论文，毕业一站式服务

创新点

提出Cross-Period Sparse Forecasting技术：

通过将时间序列数据的周期性与趋势分离，创新性地提出了跨周期稀疏预测技术。
原始序列被下采样为跨周期子序列，再对这些子序列进行趋势预测，从而有效提取周期性特征并简化预测任务。

极度轻量化模型SparseTSF：

基于上述技术，构建了SparseTSF模型，其参数数量少于1k。
相较于现有方法，该模型在保持预测性能的同时显著减少了参数规模和计算资源需求。

强大的泛化能力：

SparseTSF在计算资源有限、小样本或低质量数据场景中表现出色，显示了其优越的泛化能力。
能够以极少的参数在多个数据集上实现接近甚至超越最先进模型的性能。

性能和参数效率的平衡：

SparseTSF通过有效的下采样、聚合和稀疏预测技术，将预测任务从直接建模原始序列转化为更简单的子任务，大幅减少了计算复杂度。

应对长时间序列预测的挑战：

针对长时间序列预测中复杂的时间依赖性问题，SparseTSF利用数据的内在周期性简化了建模难度。

方法

整体架构

SparseTSF 模型通过跨周期稀疏预测技术，将长时间序列分解为周期性和趋势性两部分，整体架构包括滑动聚合预处理、基于周期的下采样和共享参数线性层进行稀疏预测，并通过上采样恢复完整预测序列。该模型以少于 1k 的参数捕捉关键周期特征，同时通过实例归一化和简单的均方误差损失函数实现高效、鲁棒的长时间序列预测。

1. 输入数据的预处理

实例归一化 (Instance Normalization)：

输入时间序列xt−L+1:tx_{t-L+1:t} 首先通过归一化处理，减去其均值ete_t，以减轻分布偏移的影响。
归一化公式：xt−L+1:t=xt−L+1:t−et

滑动聚合 (Sliding Aggregation)：

使用 1D 卷积对序列进行滑动聚合，捕捉每个周期内的局部特征。
聚合后的序列xt−L+1:t′x'_{t-L+1:t} 包含了周围时间点的上下文信息。

2. 跨周期稀疏预测 (Cross-Period Sparse Forecasting)

下采样 (Downsampling)：

输入序列xt−L+1:t′x'_{t-L+1:t} 根据已知周期性ww 被分割成ww 个子序列，每个子序列的长度为n=⌊L/w⌋n = \lfloor L / w \rfloor。
子序列表示为矩阵X∈Rw×nX \in \mathbb{R}^{w \times n}。

稀疏滑动预测 (Sparse Sliding Prediction)：

通过共享参数的线性层Linear\text{Linear} 对每个子序列的趋势进行预测，得到预测矩阵Y∈Rw×mY \in \mathbb{R}^{w \times m}，其中m=⌊H/w⌋m = \lfloor H / w \rfloor。

上采样 (Upsampling)：

对预测矩阵YY 进行转置和重塑，恢复到完整的预测序列x^t+1:t+H\hat{x}_{t+1:t+H}

3. 输出数据的后处理

恢复预测序列的均值ete_t，得到最终的预测值：x^t+1:t+H=x^t+1:t+H+et

4. 模型的损失函数

使用经典的均方误差 (MSE) 作为损失函数：L=1C∑i=1C∥yt+1:t+H(i)−x^t+1:t+H(i)∥22

即插即用模块作用

SparseTSF 作为一个即插即用模块：

（1）周期性时间序列数据

典型场景：能源消耗（如电力和水资源使用）、交通流量、零售销售量、天气预测等具有固定周期性的数据。
作用：

有效分离数据中的周期性和趋势性特征，简化预测任务，提升模型的效率和准确性。

（2）长时间序列预测（LTSF）

典型场景：超长时间的流量预测、物流需求分析、生产计划、金融市场中的中长期趋势分析。
作用：

在长时间窗口中提取关键的周期性特征，同时通过稀疏预测降低模型复杂度，显著减少计算开销。

（3）资源受限的环境

典型场景：嵌入式设备、IoT（物联网）设备、边缘计算环境等低计算能力场景。
作用：

利用稀疏化结构和极小的参数规模（<1k），在低功耗设备中实现高效时间序列预测。

（4）数据样本少或质量低的场景

典型场景：缺失数据较多、不规则采样或噪声较大的时间序列数据。
作用：

SparseTSF 模块的轻量化设计和周期性提取能力有助于在小样本和低质量数据中实现稳健的预测性能。

消融实验结果

内容：对比了不同基础模型（Linear、Transformer 和 GRU）在是否使用 Sparse 技术时的性能差异。
说明：

Sparse 技术显著提升了所有模型的预测性能，尤其是对复杂模型（如 Transformer 和 GRU），其平均性能提升分别为 21.4% 和 12.4%。
结果表明，Sparse 技术能有效提取数据的周期性特征，从而提升模型性能。

内容：探讨了主周期超参数ww 的选择对模型性能的影响。
说明：

当w=24w = 24（与数据的主周期一致）时，模型性能最佳。
如果ww 偏离主周期，模型性能略有下降，表明主周期的合理选择对模型效果至关重要。

即插即用模块

import torch
import torch.nn as nn
from thop import profile

class Configs:
    def __init__(self, seq_len=100, pred_len=50, enc_in=1, period_len=10):
        self.seq_len = seq_len
        self.pred_len = pred_len
        self.enc_in = enc_in
        self.period_len = period_len

class SparseTSF(nn.Module):
    def __init__(self, configs):
        super(SparseTSF, self).__init__()
        self.seq_len = configs.seq_len
        self.pred_len = configs.pred_len
        self.enc_in = configs.enc_in
        self.period_len = configs.period_len

        self.seg_num_x = self.seq_len // self.period_len
        self.seg_num_y = self.pred_len // self.period_len

        self.conv1d = nn.Conv1d(in_channels=1, out_channels=1, kernel_size=1 + 2 * self.period_len // 2,
                                stride=1, padding=self.period_len // 2, padding_mode="zeros", bias=False)

        self.linear = nn.Linear(self.seg_num_x, self.seg_num_y, bias=False)

    def forward(self, x):
        batch_size = x.shape[0]
        seq_mean = torch.mean(x, dim=1).unsqueeze(1)
        x = (x - seq_mean).permute(0, 2, 1)

        x = self.conv1d(x.reshape(-1, 1, self.seq_len)).reshape(-1, self.enc_in, self.seq_len) + x
        x = x.reshape(-1, self.seg_num_x, self.period_len).permute(0, 2, 1)

        y = self.linear(x)
        y = y.permute(0, 2, 1).reshape(batch_size, self.enc_in, self.pred_len)
        y = y.permute(0, 2, 1) + seq_mean

        return y

if __name__ == '__main__':

    configs = Configs(seq_len=100, pred_len=100, enc_in=3, period_len=10)
    block = SparseTSF(configs)
    input_tensor = torch.rand(1, configs.seq_len, configs.enc_in)
    x = torch.randn(1, 100, 3)
    flops, params = profile(block, (x,))
    print('Params = ' + str(params / 1000 ** 2) + 'M')
    output = block(input_tensor)
    print(input_tensor.size())    print(output.size())

便捷下载方式

浏览打开网址:https://github.com/ai-dawang/PlugNPlay-Modules

更多分析可见原文

ai缝合大王

聚焦AI前沿，分享相关技术、论文，研究生自救指南

最新文章

即插即用实时语义分割模块PIDNet，涨点起飞起飞了

即插即用时序建模模块PoseBERT，涨点起飞起飞了

即插即用多分辨率特征融合模块SAM，涨点起飞起飞了

即插即用xLSTM，适用于NLP和时序，涨点起飞起飞了

轻量化时间序列预测模块SparseTSF，即插即用，即用即涨点

即插即用多模态条件注意力模块TabAttention，即用即涨点

轻量级、高效、动态化的时序卷积模块TAdaConv，即插即用即涨点

即插即用时空特征融合模块TFF和SFF，涨点起飞起飞了

即插即用稀疏注意力机制TKSA，涨点起飞起飞了

即插即用动态剪枝模块TPC，涨点起飞起飞了

ICLR 时间序列多尺度特征提取模块OS_block，即插即用，即用即涨点

ICCV 改进损失模块PaCoLoss ，即插即用，即用即涨点

CVPR 3D 点云补全模块PF-Net，即插即用，即用即涨点

2024轻量化即插即用时间序列分析模块FITS，即用即涨点

水论文必备神器，深度学习论文速通！

（IEEE 2024）双池化时序注意力模块DPTAM，即插即用，即用即涨点

CVPR DCNv2：即插即用的几何变形建模神器，提升目标检测与分割精度

CVPR | DAT：高效灵活的可变形注意力Transformer，为视觉任务带来新突破

即插即用CSRA残差注意力机制，涨点起飞起飞了！

即插即用Crossformer，涨点起飞起飞了！

ICLR 即插即用MobileViTAttention，结合卷积的局部特征提取能力和Transformer的全局特征建模能力

即插即用多分辨率重叠注意力模块MOA，涨点起飞起飞了！

NeurIPS CoAtNet：结合卷积与注意力的高效视觉网络，全面提升图像处理性能

突破计算瓶颈：GFNet在图像分类、目标检测与语义分割中的高效创新应用

2024即插即用多头注意力模块MOH，涨点起飞起飞了！

即插即用Vision Permutator，涨点起飞起飞了！

即插即用简化自注意力机制SSAN，涨点起飞起飞了！

无注意力Transformer模块AFT，涨点起飞起飞了！

即插即用极化自注意力模块PSAN，涨点起飞起飞了！

高效金字塔压缩注意力模块EPSA，涨点起飞起飞了！

分割注意力模块S2Attention，涨点起飞起飞了！

即插即用外部注意力机制EA，涨点起飞起飞了！

即插即用高效通道注意力机制ECA，涨点起飞起飞了！

（ACCV 2024）局部重要性驱动注意力机制LIA，涨点起飞起飞了！

30+文件覆盖，深度学习论文速通

《Neural Networks 2024》自适应细粒度通道注意力机制FCA，涨点起飞起飞了！

（ESWA 2024）高低频注意力机制FCHilo，即插即用涨点启动！

混合自适应注意力模块HAAM，涨点起飞起飞了！

2024 Mamba空间状态增强模块RSSG，涨点起飞起飞了！

即插即用超轻量级子空间注意力模块ULSAM，涨点起飞起飞了！

（CVPR 2024）频域自适应空洞卷积FADC，即插即用涨点启动！

2024即插即用Efficient Non-Local Transformer Block，涨点起飞起飞了！

NeurIPS 条件卷积模块CondConv，涨点起飞起飞了！

即插即用DO-Conv模块，涨点起飞起飞了

ACM 即插即用TSConformerBlock 模块，涨点启动！

（ECCV 2022）即插即用门控通道注意力机制NAF，涨点起飞起飞了！

多尺度特征融合模块TIF，涨点涨爆了！

创新思维发一区，论文速通指南创新更新中

2024即插即用时空交互注意力机制TIAM，涨点涨爆了！

2024即插即用移位窗口注意力机制SWA，涨点起飞！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉