万能涨点&出创新点神器:对比学习!15种创新方法全面汇总

2024-11-08 22:43   安徽  

【对比学习】作为深度学习领域近年来备受瞩目的一项技术,它有着独特的学习模式。这种模式主要是通过最大化相似样本间的相似度,并同时最小化不同样本间的相似度,以此来获取有用的特征表示。在图像处理、自然语言处理以及语音识别等多个领域中,对比学习都展现出了非凡的实力,取得了令人瞩目的显著成果。也正是因为其独特的方法和卓越有效的表现,使得对比学习成为了当前研究领域的热点之一。

为了助力大家全面且深入地掌握对比学习的方法,进而挖掘其中的创新点,本文精心梳理了最近两年内与【对比学习】相关的 15 篇顶会顶刊的研究成果。不仅如此,我们还将这些论文的文章内容、来源信息以及对应的代码都进行了详细整理。相信这些内容能够为各位的研究工作提供极具价值的参考,成为大家在研究对比学习之路上的有力帮手。


需要的同学扫码添加我

回复“对比学习15”即可全部领取


三篇论文解析

1、BaCon: Boosting Imbalanced Semi-supervised Learning via Balanced Feature-Level Contrastive Learning

方法

本文提出了一种名为 BaCon(Balanced Feature-Level Contrastive Learning)的方法,旨在解决类别不平衡的半监督学习(CISSL)问题。BaCon 通过在特征级别上进行对比学习来实现更平衡的特征分布,具体方法包括:

  • 特征分布的直接正则化:通过设计对比损失来直接对特征表示的分布进行正则化。
  • 类别中心作为正样本:计算每个类别的特征中心作为对比学习的正样本。
  • 可靠的负样本选择(Reliable Negative Selection, RNS):在一个小批量中为对比学习选择足够且可靠的负样本。
  • 平衡的温度调整(Balanced Temperature Adjusting, BTA):根据数据分布的波动,动态调整对比损失中的类别温度系数,实现自适应学习。

创新点

  • 特征级别的对比学习:与以往在实例级别上进行调整的方法不同,BaCon 直接在特征级别上进行分布的正则化,以实现更平衡的特征表示。
  • 类别中心的动态计算:提出了一种动态计算类别中心的方法,使得正样本锚点能够更好地代表每个类别的特征。
  • 可靠的负样本选择机制:BaCon 提出了一种新颖的负样本选择机制,能够在保持负样本数量的同时,确保负样本的可靠性。
  • 平衡的温度调整策略:针对不平衡的数据分布,BaCon 设计了一种自适应的温度调整策略,使得模型能够根据不同类别的分布情况进行动态调整。

2、Dynamic Conceptional Contrastive Learning for Generalized Category Discovery

方法

本文提出了一种名为 Dynamic Conceptional Contrastive Learning (DCCL) 的框架,用于解决广义类别发现(Generalized Category Discovery, GCD)问题。GCD 旨在自动聚类部分标记的数据,这些数据包含已知类别和新类别的实例。DCCL 框架通过以下步骤实现:

  • 动态概念生成(Dynamic Conception Generation, DCG):基于无参数的 Infomap 算法,结合半监督概念巩固方法,动态生成概念标签。
  • 双级对比学习(Dual-level Contrastive Learning, DCL):结合概念级和实例级对比学习目标,通过动态记忆更新机制,确保与最新的概念进行比较。
  • 概念级对比学习:通过采样特定数量的概念标签和实例,使用对比损失函数拉近与对应概念标签的实例特征,并推开与其他概念标签的实例特征。
  • 概念记忆更新:采用动量更新机制,根据每个对应实例特征更新概念表示。
  • 实例级对比学习:结合监督对比损失和自监督对比损失,对模型进行微调。

创新点

  • 动态概念生成机制:提出了一种新颖的动态概念生成和更新机制,能够确保一致的概念学习,并进一步促进 DCCL 框架的优化。
  • 双级对比学习:通过结合概念级和实例级对比学习,能够更有效地利用未标记样本之间的关系,提高聚类准确性。
  • 概念级动量更新:设计了一种概念级动量更新方法,以保持概念表示的一致性,有助于模型在整个训练过程中的稳定优化。
  • 广义类别发现:针对 GCD 问题,提出了一种新的解决方案,能够处理包含已知和未知类别的未标记数据,这在实际应用中更为现实。


需要的同学扫码添加我

回复“对比学习15”即可全部领取


3、Edge Guided GANs with Multi-Scale Contrastive Learning for Semantic Image Synthesis

方法

该论文提出了一种新颖的边缘引导生成对抗网络(ECGAN),结合了对比学习,用于语义图像合成任务。以下是该方法的关键组成部分:

  • 边缘生成器(Edge Generator):直接从输入的语义标签生成边缘特征和边缘图,为图像合成提供结构化信息。
  • 图像生成器(Image Generator):利用边缘生成器提供的信息,生成逼真的图像。
  • 注意力引导的边缘传输模块(Attention Guided Edge Transfer Module):将边缘生成器中的有用结构信息选择性地传输到图像生成器,以改善合成图像的质量。
  • 语义保持模块(Semantic Preserving Module):根据原始语义布局有选择地突出显示类依赖特征图,以保留语义信息。
  • 相似性损失(Similarity Loss):构建相似性地图以监督学习,明确地捕捉类别内和类别间的语义依赖关系。
  • 对比学习模块(Contrastive Learning Module):提出了一种新的对比学习方法,利用标记布局中的全局语义相似性来学习结构化良好的像素语义嵌入空间。
  • 多尺度对比学习(Multi-Scale Contrastive Learning):提出一种新的多尺度对比学习方法,通过明确探索多个输入语义布局中标记像素的结构,从不同尺度捕获更多的语义关系。
  • 多模态判别器(Multi-Modality Discriminator):用于区分两种模态空间(边缘和图像)的输出,以提高生成的边缘和图像质量。

创新点

  • 边缘引导的图像生成:首次探索从语义布局生成边缘,并利用生成的边缘指导生成逼真图像。
  • 注意力引导的边缘传输:提出一种有效的注意力引导边缘传输模块,选择性地传输边缘结构信息。
  • 语义保持模块:设计了一种新的模块,突出显示基于输入语义标签图的类依赖特征图,以生成语义一致的结果。
  • 相似性损失:提出了一种新的相似性损失,以捕捉类内和类间的语义依赖性,从而实现稳健的训练。
  • 对比学习:提出了一种新的对比学习方法,利用标记布局中的全局语义相似性来学习结构化良好的像素语义嵌入空间。
  • 多尺度对比学习:提出了一种新的多尺度对比学习方法,通过引入两种新的多尺度和跨尺度对比学习损失,强化了局部-全局特征的一致性。
  • 端到端训练:整个框架可以端到端训练,使每个组件都能相互受益。
  • 内存效率:与需要为每个类别单独建模的方法相比,该方法在内存使用上有显著优势,这使得它能够在相同的GPU设备上使用更大的批次大小进行训练/测试。


需要的同学扫码添加我

回复“对比学习15”即可全部领取

AI学术工坊
分享最新AI资源
 最新文章