时序 + CNN：顶会的 “奇葩” 但超有效的方向！

2024-11-11 21:00 安徽

在近年来的深度学习领域中，【时间序列 + CNN】（卷积神经网络）可谓是备受瞩目。它通过将卷积神经网络应用于时间序列数据，有力地提升了模型在特征提取和模式识别等任务中的表现。时间序列 + CNN 技术在金融预测、健康监测以及工业设备故障检测等多个领域都取得了显著的成果，其独特的方法和出色的表现，使其成为研究领域的热点之一。

为了助力大家深入了解【时间序列 + CNN 】的方法，并探寻到创新之处，本文精心汇总了近两年来【时间序列 + CNN】相关的 20 篇顶会顶刊的研究成果。我们不仅对这些论文进行了梳理，还整理了其来源，并且将论文的代码也都一一整理妥当。希望这些精心整理的内容，能为各位的研究工作提供有价值的参考和助力。

需要的同学扫码添加我

回复“时序CNN”即可全部领取

1.DeconfuseTrack: Dealing with Confusion for Multi-Object Tracking

这篇文章介绍了一种名为DeconfuseTrack的新型多目标跟踪方法，旨在解决多目标跟踪（MOT）中的混淆问题。多目标跟踪在计算机视觉领域中非常重要，它在视频监控、自动驾驶和人机交互等多个领域都有广泛应用。该方法的核心是提出了一种简单、通用且高度可解释的数据关联方法，称为分解数据关联（Decomposed Data Association, DDA）。DDA通过一系列非基于学习的模块将传统关联问题分解为多个子问题，并针对每个子问题引入新的线索进行选择性处理，以减少检测、轨迹和关联时的混淆。

文章还引入了一种名为Occlusion-aware Non-Maximum Suppression（ONMS）的方法，它能够保留更多的遮挡检测，从而增加与轨迹关联的机会，并间接减少因漏检而造成的混淆。基于DDA和ONMS，作者设计了DeconfuseTrack跟踪器，专门针对MOT中的混淆问题进行解决。通过在MOT17和MOT20数据集上进行的广泛实验，证明了DDA和ONMS显著提高了几种流行跟踪器的性能。DeconfuseTrack在MOT17和MOT20测试集上达到了最先进的性能，显著优于基线跟踪器ByteTrack，在HOTA、IDF1、AssA等指标上有显著提升，这验证了作者的跟踪设计有效减少了由简单全局关联引起的混淆。

文章还对DDA和ONMS进行了详细的介绍和分析，DDA通过分解全局关联问题为多个子问题，并通过匈牙利算法解决成本矩阵来获得分配结果，然后通过检测消歧模块（DDM）、轨迹消歧模块（TDM）和关联消歧模块（ADM）进一步细化分配结果。ONMS则通过设置两个不同的非极大值抑制阈值来保留更多的遮挡检测框，从而为数据关联阶段保留更多的信息。

此外，文章还进行了消融实验，验证了DDA中各个组件的有效性，并通过调整混淆减少因子κ来展示DeconfuseTrack对不同设置的鲁棒性。最后，作者将DDA和ONMS集成到其他流行的跟踪器中，证明了它们具有强大的通用性，能够轻松集成到现有的跟踪系统中并提高性能。文章通过可视化结果展示了DeconfuseTrack在处理遮挡、图像模糊和相机运动等问题时的优势，强调了其在减少ID切换、目标丢失和定位错误等混淆问题上的有效性。

2.Visual Prompt Multi-Modal Tracking

这篇文章提出了一种新颖的视觉提示多模态跟踪方法（Visual Prompt Multi-Modal Tracking, ViPT），旨在通过继承基础模型的强大表征能力来改善多模态跟踪任务。多模态跟踪因其能够利用不同模态间的互补性，提高跟踪的鲁棒性而受到关注。然而，现有的多模态跟踪方法面临下游数据稀缺和迁移能力差的问题。文章的灵感来源于语言模型中提示学习（prompt learning）的最新成功，ViPT通过学习与模态相关的提示（prompts），调整冻结的预训练基础模型，以适应各种下游多模态跟踪任务。

ViPT的核心思想是在保持预训练RGB模型的知识的同时，仅引入少量可训练参数（不到模型参数的1%），从而实现对多模态跟踪任务的适应。具体来说，ViPT在冻结的基础模型中插入了几种简单轻量的模态互补提示器（Modality-Complementary Prompter, MCP）块，这些块能够有效地学习不同模态间的互补性。这种方法不仅在参数效率上具有优势，而且在多个下游跟踪任务上，包括RGB+Depth、RGB+Thermal和RGB+Event跟踪，都超越了全微调（full fine-tuning）范式，实现了最先进的性能。

文章还对ViPT进行了广泛的实验评估，证明了视觉提示学习在多模态跟踪中的潜力。实验结果表明，ViPT在保持参数效率的同时，能够在多个下游任务上达到最先进的性能。此外，作者还探讨了ViPT在不同配置下的性能，包括使用不同数量的MCP块以及在不同训练数据集大小和可训练参数数量下的表现。这些探索性实验进一步验证了ViPT的有效性和泛化能力。

文章的贡献可以总结为：提出了一种新颖的视觉提示跟踪框架，该框架通过学习提示有效地将现成的基础模型适应到下游多模态跟踪任务；设计了模态互补提示器，为任务导向的多模态跟踪生成有效的视觉提示；广泛的实验表明，该方法在多个下游任务上实现了最先进的性能，并且具有参数效率。

最后，文章讨论了ViPT的潜在应用和未来工作，指出尽管ViPT在视觉提示方面取得了成功，但还有扩展到更多跟踪任务的潜力，如视觉-语言跟踪。此外，尽管ViPT为多模态跟踪任务提供了统一的架构，但仍需针对不同的多模态任务分别训练，未来的工作将探索对多种模态进行联合训练的通用模型。

需要的同学扫码添加我

回复“时序CNN”即可全部领取

3.Spanning Training Progress: Temporal Dual-Depth Scoring (TDDS) for Enhanced Dataset Pruning

这篇文章提出了一种新的数据集剪枝方法，名为Temporal Dual-Depth Scoring（TDDS），旨在提高数据集的效率，同时保持与完整数据集相当的性能。数据集剪枝的目标是构建一个核心子集（coreset），这个子集能够在减少训练数据的同时，尽可能地保持模型性能。现有方法通常依赖于训练过程中的快照（snapshot）来识别代表性样本，但这些方法在不同的剪枝率和跨架构场景中泛化能力较差。

文章指出，现有研究通过考虑训练动态，例如遗忘事件和概率变化，来解决这一问题，但这些方法通常使用平均方法，难以在不忽略泛化良好的样本的情况下整合更广泛的训练动态。为了应对这一挑战，TDDS采用了双层深度策略，在第一层深度中，估计每个样本在训练过程中的个体贡献，确保全面整合训练动态。在第二层深度中，关注第一层识别出的样本贡献的变异性，以突出泛化良好的样本。

通过在CIFAR和ImageNet数据集上进行的广泛实验，验证了TDDS相较于先前最先进方法的优越性。特别是在CIFAR-100数据集上，TDDS仅使用10%的训练数据就达到了54.51%的准确率，超过了基线方法12.69%以上。文章还提供了代码，以便其他研究者复现和利用这一方法。

文章首先介绍了数据集剪枝的重要性和现有方法的局限性，然后详细介绍了TDDS方法的动机、设计和实现。TDDS方法的核心在于使用时间双重深度评分策略，通过两个层次的评分来平衡训练动态的整合和良好泛化样本的识别。内层（第一层）通过将样本梯度投影到每 epoch 的累积梯度上，来近似每个样本在每个 epoch 的实际贡献。外层（第二层）基于内层计算的投影梯度的变异性来识别泛化良好的样本。

此外，文章还探讨了TDDS方法在不同参数设置下的性能，包括估计范围 T、窗口大小 K 和衰减系数 β。通过消融研究，展示了TDDS的双层深度策略在不同剪枝率下的有效性。最后，文章证明了TDDS在多种现实复杂场景中的鲁棒性，包括图像损坏和标签噪声。

总体而言，这篇文章为数据集剪枝领域提供了一种新的视角和方法，通过精心设计的时间双重深度评分策略，有效地提高了核心子集的泛化能力，为深度学习中的高效数据利用提供了新的途径。

需要的同学扫码添加我

回复“时序CNN”即可全部领取

http://mp.weixin.qq.com/s?__biz=Mzk0NzcyNDQ3Nw==&mid=2247487410&idx=1&sn=841c77f9f89e8636796855ac79ea6e29

AI学术工坊

分享最新AI资源

最新文章

别再 “单打独斗”！特征融合技术带领深度学习模型 “组团出道”！

博士招生 | 智能交通、智能网联驾驶方向博士研究生招生(西交利物浦大学)

别让夜间眩光 “闪瞎” 视觉算法！Flare7K++ 带着解决方案闪亮登场

揭秘 LSTM与CNN的完美联姻，论文从此不再愁！

真实到离谱！1000 个如同人类 “克隆” 的个体进入西部世界，AI 相似度达到 85%，细节令人震撼！

CMAE横空出世，在视觉任务中取得惊人成果

多模态生成发文量飙升，最新成果统一两大技术，含金量爆表！

博士招生 | 澳门理工大学人工智能药物发现中心招收全奖博士生 (2025年入学)

重大突破！新型自适应程序助力多模态学习，弥补缺失模态性能短板！

从城市到高速，自动驾驶如何重塑交通版图？

Nature发声：“人类亲吻难题” 让LLM原形毕露！各大模型全军覆没，所谓强大的它们，根本不懂推理，仅仅是被高估的工具罢了。

超越传统：新型变换器框架在 WSSS 中展现卓越性能！

别人还在迷茫，目标追踪已凭借精准定位 “笑傲江湖”！

博士招生 | 深圳理工大学人工智能学院客座研究生招聘

绝绝子！VST++ 助力显著性检测，“实力圈粉” 没商量！

别人苦苦训练，HPT 模型0起步却让通用机器人性能 “一骑绝尘”！

3D人体姿势数据为何缺乏语言描述？PoseScript 数据集如何填补这一空白？

仅有少量样本，“小样本学习 + 多模态” 凭啥在 AI 领域风生水起？

博士招生 | 悉尼科技大学(QS世界排名88)招收2025年入学的数据科学/AI方向的博士生和访问学生学者

VSR 模型的 “逆天改命” 术 —— 提示调整，C 位出道！

被秀到了！图神经网络与强化学习的梦幻联动，开启了智能决策新纪元

哈佛突破：新一代AI精准诊断癌症，准确率惊人！

深度全卷积新贵 SegNet 登场，能否打破语义分割现有格局？

高光谱图像恢复大作战，看 Transformer 如何显神通！

大模型微调背后的神秘力量：你了解多少？

博士招生 | 香港科技大学广州-陈煌栒老师招收网络信息物理系统与人工智能的交叉方向的博士/RA

深度揭秘：计算机视觉 + 注意力机制融合，为何成为学术研究新宠

清华团队重磅突破！具身智能 Scaling Law 被破解，GPT 时刻或将来临，宁德时代联创助力

只训练一个GNN已过时？解耦图神经网络：多管齐下的神秘训练策略

时序 + CNN：顶会的 “奇葩” 但超有效的方向！

不可思议！RGBE-Gaze 数据集，让凝视追踪更上一层楼

博士招生 | 中科院物理所李迪组招聘【光学/图像/自动化/人工智能/细胞生物学】博/硕/科研助理

万能涨点&出创新点神器：对比学习！15种创新方法全面汇总

国务院：博士学位论文，不再非写不可

博士招生 | 香港理工大学2025博士生招生，每月近1.9万津贴

EfficientTrain++：一种高效视觉骨干训练的新突破

博士招生 | 福建医科大学健康数据科学博士招生研究方向：医疗大数据与人工智能

kaggle新赛 | 只要你有扎实得金融基础，刚刚好又会一点编程就能参加这个比赛！

图像超分辨：清华甩出Inf-DiT：Diffusion Transformer 任意分辨率上采样，可节省超过5倍显存！

招生 | 浙江大学吴超老师课题组招收偏计算机方向博士后和科研助理

kaggle新赛 | 只要你有扎实得金融基础，刚刚好又会一点编程就能参加这个比赛！

视觉跟踪新范式：MixFormer 的混合注意力机制与预训练策略

博士招生 | 英国顶尖大学卡迪夫大学招人工智能、机器学习算法及应用全奖博士或联培博士、教师

kaggle新赛 | 只要你有扎实得金融基础，刚刚好又会一点编程就能参加这个比赛！

博士招生 | 香港理工大学2025博士生招生，每月近1.9万津贴

kaggle新赛 | 只要你有扎实得金融基础，刚刚好又会一点编程就能参加这个比赛！

真实世界图像超分辨率：交互式调制如何应对复杂退化挑战？

kaggle新赛 | 只要你有扎实得金融基础，刚刚好又会一点编程就能参加这个比赛！

博士招生 | 南京大学智能科学与技术学院，范琦老师招收2025年入学的博士生，以及实习生、科研助理

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉