KDD 2024 | 数据驱动的分布偏移检测与自适应

科技 2024-10-09 08:31 中国

点击名片

关注并星标

#TSer#

扫下方二维码，加入时序人学术星球

参与算法讨论，获取前沿资料

（260+篇专栏笔记，已有240+同学加入学习）

从数据生成的角度来看，上下文驱动的分布偏移（CDS）在特定上下文中引入了预测偏差，并对传统的训练范式提出了挑战。本文介绍一篇来 KDD 2024 的研究工作，该工作提出了一种用于检测和适应训练有素的模型中 CDS 的通用校准方法，称为基于残差的 CDS 检测器（Reconditionor），通过评估预测残差与其对应上下文之间的互信息来量化模型对 CDS 的脆弱性。Reconditionor 得分高表明易感性严重，因此需要模型适应。

在这种情况下，研究者提出了一个简单而强大的模型校准适配器框架，称为样本级上下文化适配器（SOLID）。该框架涉及策划一个与提供的测试样本上下文相似的数据集，然后对模型的预测层进行有限步骤的微调。研究者的理论分析表明，这种适应策略可以实现最佳的偏差-方差权衡，并且可以轻松适应广泛的模型。

【论文标题】

Calibration of Time-Series Forecasting: Detecting and Adapting Context-Driven Distribution Shift

【论文地址】

https://arxiv.org/abs/2310.14838

【论文源码】

https://github.com/HALF111/calibration_CDS

论文背景

近年来，Transformers 在处理时间序列数据方面取得了显著进展。通过提取和堆叠多级特征，Transformers 能够更好地捕捉时间依赖性。

尽管 Transformers 的架构设计卓越，但分布偏移（distribution shift）成为了一个不可避免且极具挑战性的问题。分布偏移指的是数据生成过程的变化，这通常由一些时间上的观察到的或未观察到的外部因素（即上下文）所驱动。

图1：上下文对电力数据 ETTh1 训练数据集分布的影响

现有的时间序列预测模型通常没有考虑这些上下文因素，导致在特定上下文中的预测存在偏差，并在训练和测试数据集之间存在分布偏差时，无法做出最优预测。因此需要一种能够检测和适应 CDS 的新方法。

图2：传统框架（上方）与所提框架（下方）的示意图。通过在每次预测之前通过上下文适应对模型进行校准，可以缓解上下文驱动的分布偏移（CDS）。

基于此，研究者提出了一种通用的校准方法，用于检测和适应训练好的 Transformer 模型中的 CDS。为此，提出了一个用于测量模型对CDS敏感性的度量标准，称为残差基础的上下文驱动分布偏移检测器（Reconditionor），通过评估预测残差和它们对应上下文之间的互信息来量化模型对 CDS 的敏感性。此外，研究者还提出了一个用于进一步校准的简单但有效的适配器框架（SOLID），用于在发现显著 CDS 时对模型进行微调，以提高预测准确性。Reconditionor 和 SOLID 与模型无关，可以适应多种模型架构。

模型方法

在这篇论文中，上下文驱动的分布偏移（Context-Driven Distribution Shift，简称 CDS）是指时间序列数据的统计特性和数据分布随时间变化而持续变化的现象。这种变化通常是由一些随时间变化的观察到或未观察到的因素（即上下文）引起的。因此 CDS 的设计主要基于以下几个关键点：

基于残差的CDS检测器

研究者提出了一种新的检测器，称为 Reconditionor，用于评估训练好的模型对 CDS 的敏感性。这个检测器通过计算预测残差和它们对应上下文之间的互信息（Mutual Information，MI）来量化模型对 CDS 的脆弱性。如果 Reconditionor 得分较高，表明模型对 CDS 的敏感性较强，因此需要模型适应。

样本级上下文化适配器

在检测到模型对 CDS 有显著敏感性的情况下，作者提出了一个简单但有效的适配器框架 SOLID，用于模型校准。这个框架包括以下步骤：

数据增强：为每个测试样本创建一个包含具有相似上下文的先前样本的数据集。
选择操作：选择与给定样本具有相似上下文的先前样本。
微调预测层：在有限的步骤中对模型的预测层进行微调，以适应新的上下文。

理论分析表明，这种适应策略能够在偏差和方差之间达到最优的平衡。

图3：本文所提出的校准框架流程

上下文化数据集选择

由于无法获得控制数据生成过程的真实上下文，因此选择具有完全相同上下文的样本是不可行的。为了解决这个问题，研究者设计了一个全面策略，依赖于可观察的上下文（时间片段和周期阶段），并采用样本相似性作为未观察到上下文的代理。这包括：

时间片段：选择与测试样本在时间维度上紧密对齐的样本。
周期阶段：选择与测试样本在周期阶段上差异最小的样本。
通过样本相似性处理未观测上下文：假设具有相似输入的样本更有可能共享相似的上下文。

最后，研究者提出了完整的 SOLID 算法，结合了上述策略，通过首先筛选时间片段和周期阶段，然后基于相似性选择样本。

实验效果

研究者使用了8个真实世界的时间序列数据集进行实验，包括电力消耗、交通、疾病、天气等不同领域的数据。这些数据集被划分为训练集、验证集和测试集。同时还选择了多种现有的时间序列预测模型作为基线，包括 Informer、Autoformer、FEDformer、ETSformer、Crossformer、DLinear 和 PatchTST。这些模型在各自的架构上进行了标准化的预训练。

应用 Reconditionor 检测器计算互信息（MI）得分，以量化模型对 CDS 的易感性。结果如下：

对于测试集中的每个样本，使用 SOLID 适配器框架进行模型校准。这包括选择与测试样本具有相似上下文的训练样本，并使用这些样本对模型的预测层进行微调。结果如下：

研究者进一步研究了 SOLID 中关键参数（如上下文定义的参数和微调学习率）对模型性能的影响。通过可视化技术，展示 SOLID 在具体案例中的性能改进情况。结果如下图所示：

通过这些实验步骤，论文全面地验证了提出方法的有效性和实用性，并展示了其在处理时间序列预测中的分布偏移问题方面的潜力。

扫下方二维码，加入时序人学术星球

星球专注于时间序列领域的知识整理，前沿追踪

提供论文合集、视频课程、问答服务等资源

260+篇专栏笔记，已有240+小伙伴加入

价格随着内容丰富而上涨，早入早享优惠哦~

时间序列学术前沿系列持续更新中 ⛳️

后台回复"讨论"，加入讨论组一起交流学习 🏃

往期推荐阅读

NeurIPS 2024 | 分段时序多分类任务下的一致性学习框架

KDD 2024 | 首个基于 Diffusion 的自监督时序表示方法

港大智慧城市大模型 OpenCity 来袭! 时空预测是否将在 GPT 时代重塑？

KDD 2024 | RHiOTS：评估层级化时序预测算法的可靠性

时间序列预测中如何构建层级化的 Transformer 架构？

KDD 2024 | FNSPID：整合新闻与股价的大规模金融数据集

KDD 2024 | 检测并优化时序预测中的分布偏移问题

LSTM再升级！原作者携xLSTM回归，扩展LSTM到数十亿参数

KDD 2024 | ShapeFormer：多维时序分类中基于形状的Transformer

综述 | 可解释性人工智能（XAI）在金融时间序列预测中的应用

ICML 2024 | CaRiNG：在非可逆生成过程中学习时间因果表示

WWW 2024 | FCVAE：从频率角度重新审视 VAE 在无监督异常检测中的效果

ICML 2024 | BayOTIDE：针对多变量不规则时间序列的高效插补算法

ICML 2024 | 时序异常检测应该如何设计有效的模型？

ICML 2024 | 探索“河流网络拓扑+GNN”在洪水预测任务中的有效性

觉得不错，那就点个在看和赞吧

http://mp.weixin.qq.com/s?__biz=Mzg3NDUwNTM3MA==&mid=2247501586&idx=1&sn=c4f1ecb965c5ff58211ff70e45f60fb2

时序人

专注于时间序列领域下的科研、工业干货分享，紧跟AI+等领域的科技前沿

最新文章

无惧漂移！D3R方法可用于不稳定多元时间序列异常检测，SOTA提升11%

无需安装，一个文件本地运行大模型！

EffiCANet：基于卷积注意力的高效时间序列预测，显著降低计算成本

NeurIPS 2024 | 重新审视时间戳信息在时序预测中的作用

快速学会登上nature的热门算法，LSTM！

综述 | 时空图神经网络模型在时间序列预测和分类中的应用

填补空白！Salesforce 提出首个通用时序预测模型评测基准 GIFT-Eval

LSTM依然能打！原作者带队最新开源成果吊打Transformer和Mamba

涨点神器！100个即插即用缝合模块【合集下载】

清华与深大提出TimeBridge，有效处理长期时间序列预测中的非平稳性问题

Salesforce 推出 Moirai-MoE，新视角设计下一代时序基础模型

一文解读：时序基础模型的缩放定律

FoundTS：首个覆盖多场景的时序预测基础模型评测基准

最强总结，99个时间序列+时空数据的顶会创新！

正常时序转化为图像，进行高效且可解释的多元时序异常检测

NeurIPS 2024 | 时间序列相关论文盘点（附原文源码）

Time-MMD：首个涵盖9大主要数据领域的多域多模态时间序列数据集

华东师大团队首创！时间序列异常预测开启全新时序任务

时序异常检测新进展！华为诺亚方舟实验室&华东师大提出首个时序异常检测通用模型

快速学会登上nature的热门算法，LSTM！

如何处理多频段时序特征？这个Transformer变体显著提升预测效果

20场Kaggle机器学习比赛Top方案GrandMaster整理

PeFAD：边缘设备中高效的联邦异常检测框架

KDD 2024 | 数据驱动的分布偏移检测与自适应

NeurIPS 2024 | 分段时序多分类任务下的一致性学习框架

KDD 2024 | 首个基于 Diffusion 的自监督时序表示方法

必看的11种主流注意力机制创新研究！(附代码）

港大智慧城市大模型 OpenCity 来袭! 时空预测是否将在 GPT 时代重塑？

KDD 2024 | RHiOTS：评估层级化时序预测算法的可靠性

博后招募 | 清华大学裴丹老师课题组招收时间序列博士后

这届审稿人是不是有毛病！？？？

时间序列预测中如何构建层级化的 Transformer 架构？

文末送书 | 豆瓣9.6，多语言版本全球发行，这本书为何这么受欢迎？

KDD 2024 | FNSPID：整合新闻与股价的大规模金融数据集

KDD 2024 | 检测并优化时序预测中的分布偏移问题

多模态融合，顶会超神了！

KDD 2024 | 时间序列相关论文盘点（附原文源码）

LSTM+Transformer=金融时序预测超高精准度！

LSTM又火了！最新52个创新思路+全部开源代码！

LSTM再升级！原作者携xLSTM回归，扩展LSTM到数十亿参数

发paper必备82个即插即用缝合模块！附下载

KDD 2024 | ShapeFormer：多维时序分类中基于形状的Transformer

综述 | 可解释性人工智能（XAI）在金融时间序列预测中的应用

文末送书 | AI for Science：一本书，洞察未来的科技生态！

AI顶会今年这情况，很严重，大家做好准备吧！

ICML 2024 | CaRiNG：在非可逆生成过程中学习时间因果表示

WWW 2024 | FCVAE：从频率角度重新审视 VAE 在无监督异常检测中的效果

清华第二届城市科学大会报名启动！文末赠送2个免费与会名额！

各位，请入局AI大模型，现在！立刻！马上！！

ICML 2024 | FlashST：一个简洁有效新范式，助力智慧城市时空预测

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉