点击名片
关注并星标
#TSer#
从数据生成的角度来看,上下文驱动的分布偏移(CDS)在特定上下文中引入了预测偏差,并对传统的训练范式提出了挑战。本文介绍一篇来 KDD 2024 的研究工作,该工作提出了一种用于检测和适应训练有素的模型中 CDS 的通用校准方法,称为基于残差的 CDS 检测器(Reconditionor),通过评估预测残差与其对应上下文之间的互信息来量化模型对 CDS 的脆弱性。Reconditionor 得分高表明易感性严重,因此需要模型适应。
在这种情况下,研究者提出了一个简单而强大的模型校准适配器框架,称为样本级上下文化适配器(SOLID)。该框架涉及策划一个与提供的测试样本上下文相似的数据集,然后对模型的预测层进行有限步骤的微调。研究者的理论分析表明,这种适应策略可以实现最佳的偏差-方差权衡,并且可以轻松适应广泛的模型。
【论文标题】
Calibration of Time-Series Forecasting: Detecting and Adapting Context-Driven Distribution Shift
【论文地址】
https://arxiv.org/abs/2310.14838
【论文源码】
https://github.com/HALF111/calibration_CDS
论文背景
现有的时间序列预测模型通常没有考虑这些上下文因素,导致在特定上下文中的预测存在偏差,并在训练和测试数据集之间存在分布偏差时,无法做出最优预测。因此需要一种能够检测和适应 CDS 的新方法。
图2:传统框架(上方)与所提框架(下方)的示意图。通过在每次预测之前通过上下文适应对模型进行校准,可以缓解上下文驱动的分布偏移(CDS)。
模型方法
01
基于残差的CDS检测器
研究者提出了一种新的检测器,称为 Reconditionor,用于评估训练好的模型对 CDS 的敏感性。这个检测器通过计算预测残差和它们对应上下文之间的互信息(Mutual Information,MI)来量化模型对 CDS 的脆弱性。如果 Reconditionor 得分较高,表明模型对 CDS 的敏感性较强,因此需要模型适应。
02
样本级上下文化适配器
在检测到模型对 CDS 有显著敏感性的情况下,作者提出了一个简单但有效的适配器框架 SOLID,用于模型校准。这个框架包括以下步骤:
数据增强:为每个测试样本创建一个包含具有相似上下文的先前样本的数据集。
选择操作:选择与给定样本具有相似上下文的先前样本。
微调预测层:在有限的步骤中对模型的预测层进行微调,以适应新的上下文。
理论分析表明,这种适应策略能够在偏差和方差之间达到最优的平衡。
图3:本文所提出的校准框架流程
03
上下文化数据集选择
由于无法获得控制数据生成过程的真实上下文,因此选择具有完全相同上下文的样本是不可行的。为了解决这个问题,研究者设计了一个全面策略,依赖于可观察的上下文(时间片段和周期阶段),并采用样本相似性作为未观察到上下文的代理。这包括:
时间片段:选择与测试样本在时间维度上紧密对齐的样本。
周期阶段:选择与测试样本在周期阶段上差异最小的样本。
通过样本相似性处理未观测上下文:假设具有相似输入的样本更有可能共享相似的上下文。
最后,研究者提出了完整的 SOLID 算法,结合了上述策略,通过首先筛选时间片段和周期阶段,然后基于相似性选择样本。
实验效果
扫下方二维码,加入时序人学术星球
星球专注于时间序列领域的知识整理,前沿追踪
提供论文合集、视频课程、问答服务等资源
260+篇专栏笔记,已有240+小伙伴加入
价格随着内容丰富而上涨,早入早享优惠哦~
时间序列学术前沿系列持续更新中 ⛳️
后台回复"讨论",加入讨论组一起交流学习 🏃
往期推荐阅读
觉得不错,那就点个在看和赞吧