全局注意力+位置注意力=精度近乎100%!

文摘   2025-01-01 21:40   山东  

全局注意力机制位置注意力机制的结合,是深度学习非常有潜力的方向!为深度学习模型提供了一种强大的工具,特别是在处理具有复杂空间结构和时序关系的任务时。

这种结合能够充分利用两者的优势,提高模型的性能和准确性。比如代表模型AFFAM,就实现了精度高达99.29%的效果。全局注意力机制关注输入数据的所有部分,通过对整个输入序列或图像进行加权处理,能够捕捉全局范围内的关键信息,有助于模型理解数据的整体结构和内容,更准确地识别关键特征和模式。而位置注意力机制,则侧重利用输入数据中元素的位置信息,帮助模型理解元素之间的空间或时序关系,从而更好地捕捉图像中的对象位置等关键信息。

为让大家紧跟领域前沿,我给大家梳理了7种代表性的结合方法,原文和代码都有,一起来看!

扫描下方二维码,回复「全局+位置」

免费获取全部论文合集及项目代码

论文赏析

  1. Enhancing Multivariate Time Series Classifiers through Self-Attention and Relative Positioning Infusion

「论文简述」

在本文中,作者提出了两个新的注意力块(全局时间注意力模块和时间伪高斯增强自我注意力模块),它们可以增强基于深度学习的TSC方法,即使这些方法是针对特定数据集或任务设计和优化的。作者通过在英吉利大学(UEA)基准(30个多元时间序列分类(MTSC)数据集的标准化集合)上评估多个最先进的基于深度学习的TSC模型来验证这一说法。

实验表明,添加提议的注意力块可以将基本模型的平均准确率提高3.6%。此外,提出的TPS块使用了一个新的注入模块来包含变压器中的相对位置信息。作为一个计算复杂性较低的独立单元,它使TPS的性能优于大多数最先进的基于dnn的TSC方法。

  1. Adaptive feature fusion with attention mechanism for multi-scale  target detection

「论文简述」

为了检测不同大小的目标,YOLO V3和DSSD等目标检测器采用多尺度输出。为了提高检测性能,YOLO V3和DSSD通过结合两个相邻尺度进行特征融合。然而,仅在相邻尺度之间进行特征融合是不够的。它还没有在其他尺度上利用这些特性。此外,拼接作为一种常见的特征融合操作,不能提供一种机制来学习不同尺度下特征的重要性和相关性。

本文提出了一种多尺度目标检测的自适应特征融合注意机制(AFFAM)。AFFAM利用路径层和亚像素卷积层来调整特征映射的大小,有助于更好地学习复杂的特征映射。此外,AFFAM分别利用全局注意机制和空间位置注意机制,自适应地学习通道特征在不同尺度上的相关性和空间特征的重要性。最后,作者将AFFAM与YOLO V3相结合,构建了一个高效的多尺度目标探测器。

  1. DPAFNet: A Residual Dual-Path Attention-Fusion Convolutional Neural  Network for Multimodal Brain Tumor Segmentation

「论文简述」

本文提出了一种基于双路径(DP)模块和多尺度注意力融合(MAF)模块的高效三维分割模型(DPAFNet)。在DPAFNet中,采用双路径卷积来扩大网络规模,并引入剩余连接来避免网络退化。提出了一种注意融合模块,对通道级全局和局部信息进行融合,将不同尺度的特征图进行融合,得到语义信息丰富的特征。这使得小肿瘤的对象信息得到了充分的重视。

此外,三维迭代扩张卷积合并(IDCM)模块扩展了接受域,提高了上下文感知能力。消融实验验证了扩张卷积合并模块的最优扩张速率组合,并证明了由于后处理方法提高了分割精度。

  1. Combining Global and Local Attention with Positional Encoding  for Video Summarization

「论文简述」

本文提出了一种新的有监督视频摘要方法。为了克服现有基于rnn的总结架构的缺点,即与远程帧的依赖关系建模和并行化训练过程的能力有关,开发的模型依赖于使用自注意机制来估计视频帧的重要性。与以往通过观察整个帧序列来建立帧依赖关系模型的基于注意的摘要方法不同,该方法结合了全局和局部多头注意机制来发现不同粒度级别的帧依赖关系的不同建模。

此外,所利用的注意力机制集成了对视频帧的时间位置进行编码的组件-这在制作视频摘要时非常重要。在两个数据集(SumMe和TVSum)上的实验表明,与现有的基于注意力的方法相比,所提出的模型是有效的,并且与其他最先进的监督总结方法相比具有竞争力。

扫描下方二维码,回复「全局+位置」

免费获取全部论文合集及项目代码



AI科研技术派
专注于人工智能领域。每日更新AI技术干货、前沿资讯、算法知识、论文/比赛推荐、面试分享等行业资源。
 最新文章