时序异常检测新进展！华为诺亚方舟实验室&华东师大提出首个时序异常检测通用模型

科技 2024-10-18 18:30 中国

点击名片

关注并星标

#TSer#

扫下方二维码，加入时序人学术星球

参与算法讨论，获取前沿资料

（270+篇专栏笔记，已有250+同学加入学习）

今天给大家介绍时间序列的首个通用异常检测模型，由华为诺亚方舟实验室与华东师范大学联合发表，创新性地从信息瓶颈角度考虑模型的泛化能力并提出双解码器对抗训练策略，在多个数据集上进行 zero-shot 异常检测也能达到其他模型全量训练的效果。

【论文标题】

Towards a General Time Series Anomaly Detector with Adaptive Bottlenecks and Dual Adversarial Decoders

【论文地址】

https://arxiv.org/abs/2405.15273

论文背景

现有的异常检测方法通常需要针对每个特定的数据集进行单独的模型训练。当可用的训练数据不足时，这些方法由于其有限的泛化能力，往往难以适应多样化的应用场景。针对这一问题，这篇文章提出了一种通用的时间序列异常检测模型，通过在多源数据集上预训练，该模型无需目标场景训练数据即可实现高效检测，性能优于使用目标场景数据集训练的模型。

为了实现通用异常检测能力，该论文作者从信息瓶颈的角度设计了自适应瓶颈以增强模型的泛化能力，同时通过双解码器对抗性训练策略提升模型在不同目标场景的异常检测性能。

模型方法

预训练阶段，这篇论文的作者同时将正常时序数据以及通过异常注入得到的带噪声扰动的异常时序数据（无需人工标注）输入模型训练。原始数据经过 Patch 划分、位置互补的掩码，并通过编码器（Encoder）后得到的表征被送入自适应瓶颈层（Adaptive Bottlenecks）模块自适应地挑选适合数据重构的信息瓶颈。随后，通过双解码器分别对正常和异常数据进行重构，并使用重构误差引导模型训练。

自适应瓶颈层

自适应瓶颈模块创新性地从动态信息瓶颈的角度考虑了模型面临大规模多源数据时的泛化能力，增强了模型从多域数据中学习正常时间序列模式的能力。现有的工作仅使用单一的瓶颈层，导致其面对多源数据时难以保证在不拟合噪声的同时进行有效重构。为满足多源预训练数据不同的信息瓶颈偏好，这篇文章提出了包含不同隐式空间大小的各种信息瓶颈的集合（Bottleneck Pool），并通过自适应路由机制 R(z) 为输入数据独特的重构要求灵活地选择合适的瓶颈大小。

双解码器对抗训练

为了进一步处理多源数据下正常与异常数据决策边界更复杂的问题，这篇论文还创新性地采用了编码器与解码器对抗性训练的方法。该论文作者认为，作为一个通用异常检测模型，仅仅通过对正常数据进行建模难以应对大规模不同领域的时序数据中更多样的异常表现形式以及更复杂的正常和异常模式的决策边界。

对此，该论文作者提出了一种双解码器对抗性训练策略，并显式地将带有扰动噪声的异常数据纳入预训练过程。这部分数据可以由异常注入生成，不局限于人工标注。对于正常数据，Encoder 和正常 Decoder 最小化正常数据的重构误差，对于异常数据，Encoder 和异常 Decoder 采用对抗性训练。训练目标可以表示为如下形式：

这种对抗性训练策略可以引入梯度反转层（Gradient Reverse Layer, GRL）实现。通过这种策略，模型在预训练的过程中扩大了正常和异常模式的差异，同时避免了编码器过度拟合可能因领域而异的特定模式，从而提升模型在不同场景下的异常检测能力。

实验效果

在实验中，为了验证模型的有效性，这篇文章在 9 个常用的领域各异的异常检测评估数据集上进行了实验，并与现有的 19 个异常检测模型进行了比较。文中提出的模型经过在多源数据集上预训练，可以直接作为新数据集的 zero-shot 异常检测器，并取得比那些专门为每个数据集进行训练的模型更优的效果。

论文的作者对比了不同瓶颈层大小的模型效果，结果显示，不同数据集对瓶颈层大小的偏好各异，固定瓶颈层大小的模型在不同数据集上的表现不够稳定。相对而言，自适应瓶颈层能够根据数据集特点动态调整，从而在各个数据集上都能取得更优的效果。

此外，文中同样将 Baseline 进行大规模预训练并直接进行异常检测，发现它们的泛化能力并未达到理想效果。这一对比进一步说明了对于一个通用异常检测模型，大规模数据预训练以及独特的模型设计缺一不可。更多实验分析请详见论文原文。

扫下方二维码，加入时序人学术星球

星球专注于时间序列领域的知识整理，前沿追踪

提供论文合集、视频课程、问答服务等资源

270+篇专栏笔记，已有250+小伙伴加入

价格随着内容丰富而上涨，早入早享优惠哦~

时间序列学术前沿系列持续更新中 ⛳️

后台回复"讨论"，加入讨论组一起交流学习 🏃

往期推荐阅读

如何处理多频段时序特征？这个Transformer变体显著提升预测效果

PeFAD：边缘设备中高效的联邦异常检测框架

KDD 2024 | 数据驱动的分布偏移检测与自适应

NeurIPS 2024 | 分段时序多分类任务下的一致性学习框架

KDD 2024 | 首个基于 Diffusion 的自监督时序表示方法

港大智慧城市大模型 OpenCity 来袭! 时空预测是否将在 GPT 时代重塑？

KDD 2024 | RHiOTS：评估层级化时序预测算法的可靠性

时间序列预测中如何构建层级化的 Transformer 架构？

KDD 2024 | FNSPID：整合新闻与股价的大规模金融数据集

KDD 2024 | 检测并优化时序预测中的分布偏移问题

LSTM再升级！原作者携xLSTM回归，扩展LSTM到数十亿参数

KDD 2024 | ShapeFormer：多维时序分类中基于形状的Transformer

综述 | 可解释性人工智能（XAI）在金融时间序列预测中的应用

ICML 2024 | CaRiNG：在非可逆生成过程中学习时间因果表示

WWW 2024 | FCVAE：从频率角度重新审视 VAE 在无监督异常检测中的效果

觉得不错，那就点个在看和赞吧

http://mp.weixin.qq.com/s?__biz=Mzg3NDUwNTM3MA==&mid=2247501669&idx=1&sn=9bcc7ab76734ffbd0f635ce49a2e3f44

时序人

专注于时间序列领域下的科研、工业干货分享，紧跟AI+等领域的科技前沿

最新文章

无惧漂移！D3R方法可用于不稳定多元时间序列异常检测，SOTA提升11%

无需安装，一个文件本地运行大模型！

EffiCANet：基于卷积注意力的高效时间序列预测，显著降低计算成本

NeurIPS 2024 | 重新审视时间戳信息在时序预测中的作用

快速学会登上nature的热门算法，LSTM！

综述 | 时空图神经网络模型在时间序列预测和分类中的应用

填补空白！Salesforce 提出首个通用时序预测模型评测基准 GIFT-Eval

LSTM依然能打！原作者带队最新开源成果吊打Transformer和Mamba

涨点神器！100个即插即用缝合模块【合集下载】

清华与深大提出TimeBridge，有效处理长期时间序列预测中的非平稳性问题

Salesforce 推出 Moirai-MoE，新视角设计下一代时序基础模型

一文解读：时序基础模型的缩放定律

FoundTS：首个覆盖多场景的时序预测基础模型评测基准

最强总结，99个时间序列+时空数据的顶会创新！

正常时序转化为图像，进行高效且可解释的多元时序异常检测

NeurIPS 2024 | 时间序列相关论文盘点（附原文源码）

Time-MMD：首个涵盖9大主要数据领域的多域多模态时间序列数据集

华东师大团队首创！时间序列异常预测开启全新时序任务

时序异常检测新进展！华为诺亚方舟实验室&华东师大提出首个时序异常检测通用模型

快速学会登上nature的热门算法，LSTM！

如何处理多频段时序特征？这个Transformer变体显著提升预测效果

20场Kaggle机器学习比赛Top方案GrandMaster整理

PeFAD：边缘设备中高效的联邦异常检测框架

KDD 2024 | 数据驱动的分布偏移检测与自适应

NeurIPS 2024 | 分段时序多分类任务下的一致性学习框架

KDD 2024 | 首个基于 Diffusion 的自监督时序表示方法

必看的11种主流注意力机制创新研究！(附代码）

港大智慧城市大模型 OpenCity 来袭! 时空预测是否将在 GPT 时代重塑？

KDD 2024 | RHiOTS：评估层级化时序预测算法的可靠性

博后招募 | 清华大学裴丹老师课题组招收时间序列博士后

这届审稿人是不是有毛病！？？？

时间序列预测中如何构建层级化的 Transformer 架构？

文末送书 | 豆瓣9.6，多语言版本全球发行，这本书为何这么受欢迎？

KDD 2024 | FNSPID：整合新闻与股价的大规模金融数据集

KDD 2024 | 检测并优化时序预测中的分布偏移问题

多模态融合，顶会超神了！

KDD 2024 | 时间序列相关论文盘点（附原文源码）

LSTM+Transformer=金融时序预测超高精准度！

LSTM又火了！最新52个创新思路+全部开源代码！

LSTM再升级！原作者携xLSTM回归，扩展LSTM到数十亿参数

发paper必备82个即插即用缝合模块！附下载

KDD 2024 | ShapeFormer：多维时序分类中基于形状的Transformer

综述 | 可解释性人工智能（XAI）在金融时间序列预测中的应用

文末送书 | AI for Science：一本书，洞察未来的科技生态！

AI顶会今年这情况，很严重，大家做好准备吧！

ICML 2024 | CaRiNG：在非可逆生成过程中学习时间因果表示

WWW 2024 | FCVAE：从频率角度重新审视 VAE 在无监督异常检测中的效果

清华第二届城市科学大会报名启动！文末赠送2个免费与会名额！

各位，请入局AI大模型，现在！立刻！马上！！

ICML 2024 | FlashST：一个简洁有效新范式，助力智慧城市时空预测

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉