记得给 “应用机器学习” 添加星标,收取最新干货
作者:悉尼科技大学,香港城市大学 杨浩然
今天跟大家分享一篇来自于悉尼科技大学、香港城市大学关于为图对比学习生成高质量对比样本的文章,该文章运用了反事实因果的概念来生成负样本。该文章首先总结了目前图对比学习工作中现有对比样例生成方法及其局限性,随后介绍了生成高质量对比样例的要求并分析了其与反事实因果概念之间的联系,最后作者们基于此分析提出了一种新颖的对比样例生成方法用于生成高质量对比样例并提高图对比学习模型的表现效果。
论文: https://arxiv.org/abs/2207.00148
在本文所介绍的文章中,其技术方面主要涵盖三部分内容:
反事实因果概念简介 :一个关于反事实因果的通俗解释就是在决策中用尽可能少的改变来使得最终决策结果发生变化从而判定该决策过程中的关键因素。而生成高质量负样本的要求则是生成样本在形式上要尽可能相似,使得分类器难以对其进行区别 ,但在语义层面生成的样本要与原始样本有显著不同。不难发现,反事实因果概念与高质量负样本生成要求高度相似。 问题建模 :由于该文章首先尝试采用反事实因果概念来自适应生成对比样例,因此很有必要先提出一个抽象的训练目标来作为整篇文章的核心,后续的具体技术方案将围绕该核心展开。 两种自适应图扰动方法 :图数据是复杂且抽象的,蕴含了多层次的信息(如结构信息和特征信息等),该文章以反事实因果为核心提出了两种自适应图扰动方法,分别针对图数据的结构信息和特征信息生成负样本用于进行后续的对比学习。
本文将在后续内容中详细介绍该论文的技术细节,列出相关实验结果分析,并总结。
1 反事实因果概念简介
反事实推理是一种基本的推理方式,有助于人们了解他们的行为和世界规则。一个反事实推理的简单定义指出反事实是对“如果XXX会发生什么”问题所给出的概率性回答。为帮助读者更好理解反事实因果的概念,本文借用论文中的示例来做一个解释。
如上图所示,该图以向金融机构申请贷款为例:有人想申请贷款,但在金融机构进行风险评估后,申请被拒绝。许多因素与最终决定有关,例如申请人的年龄、收入和信用卡数量。申请人为获得贷款所需做出的最低改变是每月额外赚取1000美元或取消两张信用卡。
反事实是一种思维机制,用于发现与现有事实相矛盾的事实,并可能改变决策过程的结果。反事实有一些限制。首先,许多因素可能会影响最终结果。然而,反事实必须应用尽可能小的变化来实现这样的目标。其次,反事实必须是可行和合理的。在上图中,如果申请者每月多赚 100 万美元,金融机构会毫不犹豫地发放贷款。但是,申请者的薪水变化远高于前文中所提到的“每月多赚1000美元”且不太可能在短期内实现,因此,每月多赚一百万美元并不是反事实。
2 问题建模
在该论文中,作者运用了反事实因果概念来生成高质量的负样本用于对比学习,并给出了形式化的描述。假设 为输入的原始图数据, 和 是基于输入图生成的负样本,则目标函数可表示如下:
其中 代表着相似度衡量模块,用于计算两个图之间的相似性(如结构相似性和特征相似性), 是用于预测图数据语义的预测器(如标签预测), 而 则是KL-散度公式,用于衡量预测器输出的概率分布差异。不难看出,第一个目标是期望生成的负样本在形式上跟原始输入数据尽可能相似,而第二个目标则是让负样本和原始输入数据在语义层面上尽可能不同。后文将细化这两个抽象的目标。下图为该论文所提出的方法的概览图。
3 两种自适应图扰动方法
该论文为尽可能获取图数据的多层次信息,分别从图结构和图特征两方面来进行对比学习,因此也针对两各不同层次设计了不同的负样本生成方法。
3.1 结构扰动
结构扰动旨在改变图形结构以生成对比样本,可以帮助模型学习原始图中的关键结构信息。给定一个扰动矩阵 对原始输入图的邻接矩阵进行扰动:
但我们要注意到得到的 值域并不是 , 因此为了让 符合邻接矩阵定义,我们还需要额外处理:
其中 函数是为了使 中的值均在 范围内,而 是一个决定是否保留边的阈值。
3.2 特征掩盖
特征掩盖是常用的一种图扰动方法,在该论文中作者基于反事实因果给出了一种自适应的特征掩盖方法。首先给定一个掩盖矩阵 ,并限制它所有值均在 范围内:
其中 与 类似,都是阈值,通常设定为0.5。然后可以得到经过部分掩盖的特征矩阵:
需要注意的是此处矩阵乘法为点乘而不是上一节中的叉乘。
3.3 扰动程度衡量
为了确保得到的负样本与原始输入在形式上尽可能相似,我们需要衡量扰动的程度并确保其尽可能的小。针对结构扰动,我们需要让两个邻接矩阵的差距尽可能小,而针对特征扰动,我们则需要让掩盖矩阵中“1”尽可能多:
其中F指矩阵的F-范数。
4 实验结果
根据对比实验结果,该论文提出的方法在大多数情况下有最好的表现:
!
5 总结
在该论文中,作者提出了一种名为 CGC 的新方法来生成图对比学习的高质量负样本。与当前的图对比学习方法和一些经典的图核和图嵌入方法相比,它在对比实验中大多数情况下都有着最好的表现。此外,作者还研究并验证了使用不同类型的图学习模型来生成负样本的有效性。作者指出发现对图数据的更复杂部分(例如,节点特征或邻接矩阵)进行扰动将为图对比学习带来更多优势。另外,作者还从矩阵范数的角度探讨了如何为高质量负样本生成选择相似性度量。现在有来越多的人关注此项工作已提出新的方法来取代传统的随机扰动方法来取得更好的效果。
点击左下角 “阅读原文”, 获取原始论文。