厉害了，LSTM+Transformer王炸创新，精准度又高了！

文摘 2025-01-09 11:36 安徽

【LSTM+Transformer】是近年来在深度学习领域中备受关注的一种混合模型，通过将长短期记忆网络（LSTM）的时序建模能力与Transformer的强大上下文表示能力相结合，显著提升了模型在处理复杂时序数据和自然语言处理任务中的表现。LSTM+Transformer技术在文本生成、机器翻译和时间序列预测等多个领域展示了其潜力和有效性，其创新的方法和良好的表现使其成为研究的热点之一。

为了帮助大家全面掌握LSTM+Transformer的方法并寻找创新点，本文总结了最近两年【LSTM+Transformer】相关的20篇最新论文的研究成果，这些论文的文章、来源以及论文的代码都整理好了，希望能为各位的研究工作提供有价值的参考。

需要的同学扫码添加我

回复“LSTM23”即可全部领取

1、EditFollower: Tunable Car Following Models for Customizable Adaptive Cruise Control Systems

-这篇文章提出了一种名为Editable Behavior Generation (EBG) 的数据驱动型车辆跟随模型，旨在为自适应巡航控制系统（Adaptive Cruise Control, ACC）提供可定制的驾驶行为调整功能。当前的ACC系统通常采用固定设置，无法直观地捕捉驾驶员的社会偏好，这可能导致驾驶员与系统功能的脱节。EBG模型通过整合不同的礼貌程度计算方法到长短期记忆（LSTM）和Transformer架构中，提供了一种全面捕捉细微驾驶动态的方法。通过在训练过程中整合不同的不礼貌值，该模型能够生成具有不同礼貌程度的真实车辆跟随行为轨迹。

-文章首先介绍了驾驶技术的现状，指出全自动驾驶车辆尚未普及，因此先进的驾驶辅助系统（ADAS）在提升驾驶体验方面发挥着重要作用。其中，自适应巡航控制（ACC）是ADAS的关键组成部分。然而，现有ACC系统通常使用预设的距离或时间间隔等固定设置，未能满足驾驶员不同的社会偏好，这限制了它们在优化驾驶体验方面的有效性。
-为了克服这些限制，文章提出了EBG模型。该模型首次允许根据驾驶不礼貌程度调整驾驶行为。具体来说，研究者利用带有不礼貌标签的真实车辆跟随数据来训练EBG模型，该模型根据输入的不礼貌值综合模拟跟随车辆的未来轨迹，从而生成现实感强的车辆跟随行为。文章还介绍了在训练期间标记不礼貌值的不同框架，并设计了一种礼貌损失函数，以匹配生成轨迹的不礼貌值与输入值。
-通过在HighD和Waymo数据集上的实验结果，展示了EBG模型与基线相比，在间距和速度均方误差（Mean Squared Error, MSE）上都有所降低，证明了风格可控性。据作者所知，这项工作代表了第一个能够动态调整不礼貌程度的数据驱动车辆跟随模型。该模型为考虑到驾驶员社会偏好的ACC系统的发展提供了宝贵的见解。
-文章还回顾了基于规则的车辆跟随模型和数据驱动模型的相关研究，并讨论了可控驾驶行为的研究进展。此外，文章详细介绍了EBG模型的关键组成部分，包括问题定义、驾驶不礼貌程度的计算方法、模型架构和损失函数。最后，通过在HighD和Waymo数据集上的实验评估，展示了EBG框架的有效性，并讨论了如何通过调整不礼貌程度来控制驾驶行为，为自适应巡航控制功能的发展提供了见解。
-文章以对未来工作的展望结束，提出可能的研究方向，包括探索额外的礼貌程度计算方法、扩展到不同的数据集和驾驶场景评估，以及进行用户研究以收集人类驾驶员对驾驶不礼貌程度的偏好和反馈。

2、Enhancing Robotic Arm Activity Recognition with Vision Transformers and Wavelet-Transformed Channel State Information

-这篇文章介绍了一种新颖的机器学习方法，用于通过室内环境中的信道状态信息（Channel State Information, CSI）测量来识别机械臂活动。该方法结合了离散小波变换（Discrete Wavelet Transform, DWT）和视觉变换器（Vision Transformers, ViT），旨在提高在视线受阻或隐私顾虑较高的场景下，如智能家居应用中，机械臂活动的识别准确性。
-文章首先指出，传统的基于视觉的机械臂活动识别方法依赖于直线视线（Line-of-Sight, LoS），这在某些环境中可能不切实际，并且可能引发隐私问题。作为一种新的范例，被动Wi-Fi感知利用CSI测量来识别室内环境中的人类和机械臂活动。研究者们提出的这种方法在机械臂活动识别方面，尤其是在视线被障碍物阻挡时，不依赖外部或内部传感器或视觉辅助，相较于卷积神经网络（CNN）和长短期记忆（LSTM）模型，展现出了更高的性能。
-文章详细介绍了所提出的基于DWT和ViT的方法。首先，使用DWT作为降噪技术来处理CSI测量数据，以减少由多径干扰和其他无线设备引起的信号衰减和干扰，这些干扰可能会掩盖CSI数据中的微小变化。然后，将降噪后的CSI数据输入到ViT中进行特征提取和分类。ViT利用多头自注意力（MHSA）机制，能够捕捉复杂的时序和空间关系，从而实现对机械臂活动的高准确度识别。
-实验部分，研究者们使用了四种不同的数据收集场景和四种不同的机械臂活动进行了测试。实验结果表明，DWT可以显著提高视觉变换器网络在机械臂活动识别中的准确性。文章还提供了详细的算法伪代码，描述了模型的每个阶段，包括DWT降噪过程和变换器块中的特征提取步骤。
-此外，文章还对不同模型在各个场景下的性能进行了比较分析，包括CNN、CNN-LSTM、Transformer、ViT和ViT-DWT模型。结果显示，ViT-DWT模型在所有场景中均取得了最高的准确率、精确率、召回率和F1分数，证明了其在机械臂活动识别任务中的优越性。
-最后，文章进行了敏感性分析，探讨了不同学习率和批量大小对ViT-DWT模型性能的影响，并确定了最佳的超参数设置。文章得出结论，Wi-Fi感知在人类活动识别（HAR）和机械臂活动识别（RAR）中的有效性已经得到了证实，而本文提出的ViT-DWT方法进一步推动了这一领域的发展。通过持续创新建模技术，可以提高RAR系统的精度和上下文感知能力，从而拓宽Wi-Fi感知应用的范围。

需要的同学扫码添加我

回复“LSTM23”即可全部领取

3、New Rotation Period Measurements for Kepler Stars Using Deep Learning: The 100K Sample

-这篇文章提出了一个新的框架，用于从光变曲线预测恒星属性。研究者们分析了开普勒太空任务的光变曲线数据，并开发了一种新工具，用于推导主序星的恒星自转周期。利用这个工具，他们提供了迄今为止最大（108785颗恒星）和最准确（平均误差1.6天）的恒星自转样本。他们的模型，名为LightPred，是一个新颖的深度学习模型，旨在从光变曲线中提取恒星自转周期。该模型采用了一种双分支架构，结合了长短期记忆（LSTM）和Transformer组件，以捕捉数据中的时序和全局特征。

-LightPred模型在模拟光变曲线数据集上进行了训练，这些数据集使用现实斑点模型生成，并通过对开普勒光变曲线的自监督对比预训练来提高其性能。评估表明，LightPred在准确性和鲁棒性方面优于经典方法，如自相关函数（ACF）。研究者们将LightPred应用于开普勒数据集，生成了迄今为止最大的主序星自转周期目录。他们的分析揭示了与先前研究相比，周期向更短的系统性偏移，表明可能需要对恒星年龄估计进行潜在修订。他们还研究了恒星活动对周期确定的影响，并发现了明显的周期-活动关系。此外，他们还证实了轨道周期小于10天的食双星中的潮汐同步现象。

-文章中还讨论了经典自转测量分析方法，包括Lomb-Scargle周期图和自相关函数等，并指出这些方法虽然成功，但可能耗时且难以应用于大型数据集。此外，这些方法通常难以处理表现出多个周期性或不断演变的斑点模式的复杂光变曲线。近年来，机器学习技术在自动化和提高自转周期测量的准确性方面显示出了潜力。特别是深度学习模型，已证明能够从时间序列数据中提取复杂特征，并在广泛的恒星类型和自转周期上进行准确预测。-文章还介绍了数据驱动的机器学习方法，其中创建了一个模拟光变曲线的数据集来训练模型，并预测所需的属性。然后，使用训练好的模型，可以在真实数据样本上预测属性。研究者们提出了一种数据驱动方法，使用基于模拟的深度学习模型结合自监督学习来推导恒星的内在参数。模型使用预处理的恒星光变曲线以及光变曲线的自相关函数的变化作为输入，并学习预测自转周期和恒星倾角。

-文章的结构包括介绍背景和上下文、讨论先前使用的方法，然后介绍新的分析和结果。研究者们开源了他们的代码，以便其他研究者可以访问和使用。

-总的来说，这篇文章展示了深度学习在从光变曲线中提取基本恒星属性方面的潜力，为理解恒星演化和人群统计学开辟了新的途径。

需要的同学扫码添加我

回复“LSTM23”即可全部领取

欢迎投稿

想要让高质量的内容更快地触达读者，降低他们寻找优质信息的成本吗？关键在于那些你尚未结识的人。他们可能掌握着你渴望了解的知识。【AI前沿速递】愿意成为这样的一座桥梁，连接不同领域、不同背景的学者，让他们的学术灵感相互碰撞，激发出无限可能。

【AI前沿速递】欢迎各高校实验室和个人在我们的平台上分享各类精彩内容，无论是最新的论文解读，还是对学术热点的深入分析，或是科研心得和竞赛经验的分享，我们的目标只有一个：让知识自由流动。

📝 投稿指南：

确保文章为个人原创，未在任何公开渠道发布。若文章已在其他平台发表或即将发表，请明确说明。
建议使用Markdown格式撰写稿件，并以附件形式发送清晰、无版权争议的配图。
【AI前沿速递】尊重作者的署名权，并为每篇被采纳的原创首发稿件提供具有市场竞争力的稿酬。稿酬将根据文章的阅读量和质量进行阶梯式结算。

📬 投稿方式：

您可以通过添加我们的小助理微信（aiqysd）进行快速投稿。请在添加时备注“投稿-姓名-学校-研究方向”

长按添加AI前沿速递小助理

AI前沿速递

持续分享最新AI前沿论文成果

最新文章

本地部署最强开源模型—DeepSeek-r1（保姆喂饭级教程）

2025 Kaggle 小白练习赛——使用保险数据集进行回归！

深度译读《DeepSeek FAQ》- 关于 DeepSeek 的答疑解惑

2025即插即用，Mamba线性注意力机制模块，持续起飞！

目前主流的attention方法都有哪些？

Tip 2024 | CGA特征融合模块，短短几行代码，有效提点，即插即用

TPAMI 2024 | 真的鲨疯啦！深度视觉学习诚不欺我！

AAAI 2024 | Conv-Former：卷积赋能，实现Transformer效果的即插即用模块！

【计算机视觉新突破】GLOMAP：重新定义全局结构光运动（SfM）的高效系统

如何评价大语言模型架构 TTT ？Transformer这次真的要没了？

NeurIPS | HiLo注意力机制：即插即用，精准捕获高低频特征

Flare7K++：解决夜间耀斑难题的综合数据集与流程

有小黑子说我家ViT在小数据集上不work，我真的忍不了了!

CVPR ｜只用一部分就好，别再傻乎乎的用普通卷积了！

博士招生 | 上海理工大学光学工程博士招生（优青教授课题组，物理、光纤传感、人工智能方向）

如何评价 Kimi 发布的多模态推理模型 k1.5？

告别手工特征提取！SparseViT 开启图像篡改定位新篇

CricaVPR：开启视觉位置识别新篇章，跨图像相关性助力性能飞跃

漫谈 Transformer 中的绝对位置编码、相对位置编码和融合位置编码（旋转位置编码 RoPE）

Nature | 给出材料性质就能输出材料结构，微软最新MatterGen模型，真猛！

博士招生 | 南方科技大学ai{DEAL} 课题组人机交互与教育技术方向博士后招聘

ECCV 2024 | 最新直方图transfomer，直接涨点起飞！

博士招生 | 吉林大学计算机学院90后教授、博士生导师招生、招老师啦！

AAAI 2024 | 动态频域fft模块，几行代码，有效提点，即插即用

得克萨斯大学提出一种解码器，以极低计算成本达成医学图像分割SOTA新性能！

TPAMI 2024 | 神来一笔！无监督半监督怎么进行球形空间领域适应呢？

超越Transformer，魔改的Mamba将横扫顶会？！

ICCV 2023 | 多尺度线性注意力模块，有效涨点，即插即用

博士招生 | 英国斯旺西大学招收研究型硕士（无需上课）和博士

CVPR 2024 | 单头注意力机制(SHSA)，即插即用，涨点起飞！

CVPR 2024 | 最新即插即用注意力机制+ffn层

博士招生 | 新加坡国立大学（NUS）招聘多名机器学习控制相关的全奖博士生 , 博士后

ECCV 2024 | 小波变换卷积的即插即用，引入了频域信息，助你涨点起飞

博士招生 | 加拿大阿尔伯塔大学招收电磁、无线通信、机器学习方向全奖硕士/博士/博士后/访问学者

TPAMI 2024 | 多模态融合超前研究！维度情感识别！

像教女朋友一样教你用Cuda实现PyTorch算子

TPAMI 2024 | 全新框架！深度学习可解释度量学习！

招生 | AI方向博士后招聘--北航杭州国际校园薪金40万起！

厉害了，LSTM+Transformer王炸创新，精准度又高了！

看我操作，手写一个神经网络训练架构！

一句话就能让论文评分飞升！上交大揭露大模型审稿背后的深度逻辑及风险！

【扩散模型】拿下CVPR两篇最佳论文，它究竟有何特别之处？我直呼牛批克拉斯！

博士招生 | 上海交通大学人工智能学院赵波课题组招硕博士生/实习生

一文读懂如何使用图框架构建多代理应用程序

博士招生 | 上海科技大学信息科学与技术学院 - 汪婧雅教授团队招收机器学习方向博士

仅需一万块钱！清华团队靠强化学习让 7B模型数学打败GPT-4o

TPAMI 2024 | 变态但很有效的图像识别方法！对于小样本泛化有奇效！

Stable Video Diffusion整出新活！学习【扩散模型视频】掌握3D/视频生成变革！

北京AI公司联合哈工大深圳联合招聘生物医学AI算法科研实习生（北京深圳均可）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉