TPAMI 2024 | EBMGC-GNF:通过好邻居融合实现高效平衡的多视图图聚类

文摘   2024-11-16 19:00   辽宁  

点击下方PaperEveryday”,每天获得顶刊论文解读

点击加入论文投稿、写作、阅读分享交流群

论文信息

题目:EBMGC-GNF: Efficient Balanced Multi-view Graph Clustering via Good Neighbor Fusion

EBMGC-GNF:通过好邻居融合实现高效平衡的多视图图聚类

作者:Danyang Wu; Zhenkun Yang; Jitao Lu; Jin Xu; Xiangmin Xu; Feiping Nie

论文创新点

  • 1 跨视图好邻居投票(CGNV)模块:该模块旨在通过引入锚点评估两个节点之间的标签一致性,有效地捕获多视图中的一致性信息。这种方法不仅适用于多视图图聚类(MGC)任务,而且对多视图相关任务具有重要的理论意义。
  • 2 自适应加权机制:该机制能够根据每个视图的重要性分配不同的权重,从而整合多视图信息,捕捉多视图数据中的多样性。
  • 3 基于p-幂函数的平衡正则化项:该正则化项能够定量调整聚类的平衡属性,通过调整超参数p的值,可以实现更加平衡的聚类结果,这对于处理不同分布的数据尤为重要。
  • 4 图粗化和加速坐标下降算法:为了提高多视图图聚类的效率,论文提出了一种图粗化方法和基于加速坐标下降的优化算法,显著降低了模型的时间复杂度,从传统的O(n^3)降低到O(|E| + m^2),使得模型在大规模数据集上的应用变得更加可行。

摘要

在多视图图聚类中,从多个图谱中提取一致的结构对于聚类结果至关重要。为了实现这一目标,我们提出了一种名为EBMGC-GNF(Efficient Balanced Multi-view Graph Clustering via Good Neighbor Fusion)的模型,该模型通过设计跨视图好邻居投票模块,全面提取多个视图中可信的一致邻居信息。此外,我们引入了一种基于p-幂函数的新颖平衡正则化项,以调整聚类的平衡属性,帮助模型适应不同分布的数据。为了解决EBMGC-GNF的优化问题,我们将EBMGC-GNF转换为高效的图粗化形式,并基于加速坐标下降算法进行优化。在实验中,大量结果表明,在大多数情况下,我们的提议在有效性和效率方面都优于现有的最先进方法。

关键字

  • 多视图聚类
  • 基于图的聚类
  • 平衡聚类

I. 引言

多视图聚类是无监督多视图学习领域中的一个基本任务。根据现有多视图聚类方法背后的机制和原则,它们大致可以分为五个不同的类别:共训练风格算法[1],多核学习[2],多视图图聚类[3],多视图子空间聚类[4]和多任务多视图聚类[5]。近年来,基于图的多视图聚类(MGC)作为多视图聚类中的一个突出子领域崛起。目前,基于图的多视图聚类模型主要分为三种类型,如图1所示,根据它们的学习方案进行分类。
  1. 第一类专注于从多个视图相似性矩阵或谱嵌入中学习一致的谱嵌入,通过K-means[7]或谱旋转[8]生成聚类结果。这一类进一步细分为核近似[8],流形近似[10]和图重建[11],代表性模型包括CoregSC[12],DGMC[13]和PF-CEL[14]用于核近似,MEA[15]和SCML[16]用于流形近似,AMGL[17]和MLAN[18]用于图重建。
  2. 第二类旨在通过对多个视图相似性矩阵应用结构化约束来学习块对角相似性矩阵,直接表示聚类结果。此外,这一类中的主要学习策略主要包括Frobenius范数最小化[19]和内积最小化[20]。采用Frobenius范数最小化的代表性模型包括SwMC[21],SFMC[22]和CDMGC[23]。同时,内积最小化的典型方法包括MVGL[24]等。
  3. 第三类致力于开发多种策略,从多视图谱嵌入中获取一致的聚类(软)指示矩阵。然后,这一类可以细分为以下几组:分解近似[25]和自适应Procrustes[26]等。代表性模型用于分解近似包括NESE[27],MSGL[28]和OP-LFMVC[29]。同时,自适应Procrustes的典型模型包括AWP[30],MAGC[31]等。
然而,现有的三种类型未能充分开发邻居之间的关系,它们也极不平衡,使它们不适合处理具有多种分布的数据。此外,如图1和上文所述,我们列出的三种类型都不能避免具有时间复杂度的特征值分解。因此,迫切需要提出一个灵活高效的模型,能够有效地融合信息并调整聚类的属性平衡。
在本文中,我们提出了一种通过好邻居融合实现高效平衡的多视图图聚类(EBMGC-GNF)模型来应对上述挑战。首先,为了增强多视图信息的整合,我们提出了两个融合机制,旨在充分利用多视图图数据中的一致性和多样性。1) 考虑到多个视图之间的差异,我们提出采用投票机制来识别一些可靠的先验矩阵,这些矩阵可以用于提取多个视图之间的一致性信息。为了从每个视图中提取有利的特征,我们提出了引入锚点的方法来评估两个节点之间的标签一致性。结合上述两点,我们设计了一个跨视图好邻居投票(CGNV)模块,如图2所示,以实现跨视图信息一致性的有效挖掘。2) 为了考虑不同视图的不同重要性,我们为每个视图分配自适应权重。此外,我们使用获得的先验知识直接优化指示矩阵,如图1所示。通过采用该方法,我们避免了传统谱分解方法中耗时的谱操作。因此,我们的提议确保了有效性和效率。此外,我们提出了一个平衡正则化项,通过调整超参数有效控制模型最终聚类结果的平衡趋势。此外,我们提出了一种转换,将提出的模型转换为两阶段过程,包括通过好邻居的图粗化和随后在粗化图上的聚类。为了解决新提出的模型所提出的优化挑战,我们提出了一个高效算法。该算法的时间复杂度为,其中,与谱分解相比,计算成本较低。为了验证此模型的性能,我们在几个涉及多视图聚类的基准数据集上进行了实验,这些实验验证了我们的提议在大多数指标上取得了最佳结果。总之,本文的主要贡献可以总结如下:
  • 丰富性:为了全面融合多视图信息,我们提出了两个融合机制。我们提出的CGNV模块有效地捕获了多个视图中的一致性。该模块不仅适用于MGC任务,而且对多视图相关任务具有重要的理论意义。此外,我们提出的自适应加权机制捕获了多个视图中的多样性。
  • 平衡性:我们提出了一种基于p-power函数的新型平衡正则化项,可以定量调整聚类的平衡属性。在方法论部分,我们提供了严格的理论证明,证明随着p值的增加,可以实现平衡聚类。
  • 效率:为了提高MGC任务的效率,我们提出的EBMGC-GNF模型避免了耗时的谱分解过程,直接学习指示矩阵。此外,实验部分表明,我们的模型在MGC任务的运行时间方面优于现有模型。
本文的其余部分组织如下:第II节回顾了一些现有的基于图的多视图聚类模型。第III节提出了跨视图好邻居投票模块,这是我们提议的核心操作,并提供了两个具体模型:EBMGC-GNF和EMGC2F。第IV节介绍了我们模型的详细优化算法。第V节提供了验证我们模型优势的实验。符号表示。我们表示第s个视图的无向加权图为,其中表示节点集,表示边集,表示相似性矩阵。的度矩阵表示为,其中的拉普拉斯矩阵表示为。此外,对于矩阵表示第i行第j列的元素。分别表示第i列和第i行。对于向量表示第i个元素。我们用表示L1范数,即其元素的绝对值之和,用表示中非零元素的数量。在处理集合时,表示集合的基数。对于的子集中的补集表示为。我们还定义为在第c个元素处为1,其余元素为0的向量。在标量情况下,对于范围在内的标量,我们表示为。当提到标量时,表示这两个变量之间存在正相关。指示函数如果则等于1,否则为0。

III. 方法

本节作为论文[32]的扩展。在本节中,我们提出了一种通过好邻居融合实现高效平衡的多视图图聚类(EBMGC-GNF)模型,以实现从多个视图图{G(1), ..., G(v)}中有效整合信息并做出一致的聚类决策。为了提高可读性,我们通过四个主要组成部分展示EBMGC-GNF模型,并在图2中描述了工作流程以供参考。

A. 多视图图聚类与全面融合框架

我们从单视图案例开始。设表示包含所有样本的集合,表示第个聚类的样本集合,表示相对于的补集。人们普遍认为,集合()之间的相似性应该被最小化。从层次数据聚类[33]中汲取灵感,我们将()视为两个超节点,并建立它们之间的相似性作为成对相似性的总和:
然而,直接最小化上述方程可能会导致聚类过大或过小。为了解决这个问题,我们应用了一个关于最终聚类大小的正则化项,记作。然后,方程被转换为:
考虑到所有聚类,聚类模型可以表示为:
我们将问题(3)的范围扩展到多个视图。为了反映每个视图的重要性,我们为第s个视图分配了自适应权重。因此,问题(3)被转换如下:
其中约束是为了确保在给定的约束下,解决方案满足以下标准:
在问题(4)中,表示在缺乏先验知识的情况下的自适应权重。因此,我们假设应该是视图损失的负相关。这是因为在多视图学习中,当一个视图的损失较低时,我们倾向于认为该视图可能表现更好。基于此,我们提出了方程(5)的标准。为了确保方程(5)成立,我们使用以下约束。我们将在优化部分后面讨论,这个标准将被严格满足。此外,我们给出的约束有以下好处。首先,它允许我们抑制表现不佳的视图。其次,使用连续权重更有利于我们对各个视图进行组合,以获得更好的性能。在后续部分,我们继续从多个视图中提取一致信息。

B. 跨视图好邻居投票模块

本节的目标是识别在多个视图中保持一致的先验知识。我们旨在为每个视图获得可靠的特征,因此我们提出了一个模块,通过引入锚点来评估两个节点之间的标签一致性。通过设计不同的干预方法来处理锚点,可以满足不同级别的信息提取需求。目前,可以通过引入锚点以多种方式确定两个节点的标签,这里我们考虑一种称为好邻居[34]的通用干预类型。对于每个节点,我们将其-最近邻的集合表示为。如果有个样本满足
那么的好邻居,其中是指示函数。图3提供了图形表示。考虑到视图之间的差异,我们使用投票机制获得一些可靠的先验标签。因此,我们提出了一个名为跨视图好邻居投票(CGNV)的模块。为了更好地说明,我们首先引入一个系数矩阵来描述第s个视图中好邻居之间的关系。矩阵定义如下:
其中表示的第(i, j)个元素,表示中节点-最近邻集合。是超参数,且。为了从不同视图中挖掘每个节点对的一致好邻居信息,我们引入一个矩阵通过投票捕获跨视图好邻居:
其中表示如果节点在超过一半的视图中是好邻居(),则它们被认为是跨视图好邻居。我们的下一个目标是利用中的信息生成可靠的成对标签,指示是否属于同一聚类。为了实现这一点,我们建立了一个图,其邻接矩阵对应于,并使用Tarjan算法[35]识别该图中的连通分量。随后,我们设计了一个成对标签矩阵如下:
实际上,作为从多个视图的好邻居中整合一致的成对标签信息的手段。此外,我们为集合引入了的成对标签约束,从而增强了问题(4)如下:
值得注意的是,的实现是灵活的。除了我们之前提供的参数化方法外,还可以采用其他非参数化方法,例如最近邻。模型的有效性和效率受到的影响。

C. 平衡正则化

接下来,我们讨论问题(10)的正则化项。本文考虑了两种不同的正则化项。第一种是衡量聚类间平均链接的,正式表示为。为了实现平衡聚类的需求,我们提出了一种新的平衡正则化项,并提供了严格的理论保证,可以有效控制最终聚类分布的平衡趋势。接下来,我们提供了详细的证明,证明随着p值的增加,正则化可以实现平衡聚类分布。为了简化符号,我们将问题(10)的目标值表示为,将表示为
定理1:假设(其中)。如果对于所有,则对于任何一对聚类集合,存在一个阈值,使得当时,问题(10)的目标确保

证明。之间的比率确定如下:
不失一般性,我们假设。然后,我们乘以分子和分母,方程可以重写为:
通过直接放松,我们得到以下近似界限:
当存在足够大的时,我们有:
根据定理1,随着p的增加,越来越多的集合将满足。当p设置为足够大的值时,将实现平衡聚类结果,因为,其中(它可以是,如果c不能被n整除)被限制为任何其他聚类集合的平衡。这结束了证明。

D. 模型推导和进一步转换

为了简化问题,我们引入了一个指示矩阵,其中的每一行对应一个样本,每一列对应一个聚类。因此,基于集合的问题(10)可以重写为指示形式。具体来说,1);2);3);4)。通过这些替换,我们得到以下问题:
在此基础上,我们提出了基于锚点的跨视图好邻居投票模块和p-幂平衡正则化项,得出以下模型,称为通过好邻居融合实现高效平衡的多视图图聚类(EBMGC-GNF):
随后,为了更好地评估EBMGC-GNF中平衡正则化项的有效性,我们引入了一个简化模型,称为通过全面融合实现高效多视图图聚类(EMGC2F),通过使用简单的正则化替换p-幂平衡正则化:
此外,在EMGC2F中,先前构建的成对矩阵B直接由1NN邻居构成,以简化计算。总的来说,问题(16)和(17)都是从同一个框架,即问题(15)中推导出来的。问题(16)是我们主要提出的模型,它考虑了全面的好邻居和平衡正则化,问题(17)可以看作是问题(16)的简化形式(或消融形式)。在获得约束后,我们惊讶地发现它可以被表示为图粗化形式。这种转换更有利于模型优化。为了提供更全面的描述,我们使用方程(1)中描述的集合操作符。设B由m个对角块组成。这表明图M中有m个连通分量。构成第d个分量的样本集合定义为。本质上,我们可以将视为一个超节点,它通过好邻居关系在原始图中聚合了样本。请注意,G(s)中第k个聚类的样本集合由表示。根据问题(10)中指定的条件,由几个不同的组组成。换句话说,我们可以将表示为,其中表示相应的索引。有了这些定义,我们得到以下结果:
为了进一步简化,我们考虑使用先前提取的好邻居信息对每个视图的原始图进行粗化,然后构建粗化图的相似性矩阵。具体来说,对于第s个视图,我们构建一个包含m个节点的图,相似性矩阵是,其中。另外,我们定义一个向量,其中。将这些元素代入方程(18),我们得到:
我们提出了一个新的指示矩阵,约束为,这与从问题(10)到(15)的转换类似。基于粗化的多视图,我们可以将问题(15)重构为以下形式:
其中的拉普拉斯矩阵,代表不同的正则化:
  • EBMGC-GNF模型:
  • EMGC2F模型:

IV. 优化

本节致力于解决问题(20)的优化。我们采用块坐标下降方法[36]来优化问题(20)中的两个变量。这种方法涉及交替固定一个变量,同时交替更新另一个变量。

A. 固定E,更新

为了更好地说明,我们表示。然后,当E固定时,问题(20)可以简化为:
由于约束,我们应用柯西-施瓦茨不等式[37]并得到:
在这种情况下,等式成立当且仅当,其中是一个常数。这意味着目标函数在满足上述约束时达到其最小值。已知E已经预设,我们只需要确定所需的来获得的值。通过展开约束,我们得到以下结果:
结合,我们有:
将方程(24)代回方程(23),我们得到计算的表达式:
可以证明,方程(25)也证明了当存在约束时,与视图的损失负相关。

B. 固定,更新E

固定时,问题(20)关于E可以写成:
经过某些等价变换后,问题(26)可以表示为:
为了方便起见,我们表示,然后我们有:
问题(27)可以写成:
由于约束与行无关,我们可以使用坐标下降算法[38]直接处理问题(28)。设E表示当前解。在寻找解以更新第d行时,它可以从c个选择中选择,包括,其中,对于所有。为了帮助理解,我们引入作为零向量,并定义对于所有为矩阵,其第d行是,其余行与E中的行相同。有了这些定义,的计算可以表示为,其中:
方程(29)中的计算可能耗时,因为存在多个冗余计算。为了简化过程,我们提出新的定义
并提出以下等价变换:
其中等式(ii)成立是因为对于所有,有。然后方程(29)可以细化为:
显然,计算主要涉及重复计算的不同,这既昂贵又冗余。为了进一步加速过程,我们建议根据上一次迭代中的和E计算这些值。具体来说,我们指定作为中1的元素的索引,然后讨论以下两种情况的策略:情况1:当时,很明显,然后根据不同的正则化可以计算为:
  • 时:
  • 时:
情况2:当时,很明显,然后可以计算为:
  • 时:
  • 时:
然后,将方程(32)、(34)或(33)、(35)代入方程(31),我们可以高效地计算问题(31)中的并获得最优的。为了更新,我们必须计算。为此,我们指定作为中1的元素的索引,然后讨论计算的以下两种情况:1)当时,很明显,因此
2)当时,很明显,因此
由于右侧的每个项已经计算过,因此不需要额外的计算。
为了获得E的最优解,我们可以交替更新和E,直到它们收敛。通过这种方式,我们完成了问题(20)的优化,算法1提供了整个优化过程的总结。一旦获得E,我们可以推断问题(10)的指示矩阵F如下:

C. 收敛性分析

在算法1中,我们通过交替优化和E来解决相应的子问题。因此,我们可以确认问题(20)的目标值将持续减少,直到算法1收敛。算法1的收敛性可以通过以下方式证明。在(t+1)次迭代中,假设我们有E(t)和,我们通过解决方程(21)中的子问题来更新,并得到以下不等式:
然后根据问题(26)的优化,我们更新E(t)并得到以下不等式:
结合不等式(39)和(40),我们得到:
由于E和是有界的,也是有界的。结合不等式(41),我们得出结论,问题(20)的目标值将单调递减,直到算法1收敛。

D. 时间复杂度分析

如前所述,我们将问题转化为图粗化和粗化图聚类。在时间复杂度分析中,我们可以将其分为两个不同的部分。图粗化的对应于方程(7)到(9),其时间复杂度为O(|E|)。另一方面,粗化图聚类的时间复杂度为O(m^2vt),其中t是迭代的总次数,对应于算法1。因此,模型的总时间复杂度为O(|E| + m^2vt)。然而,大多数情况下v ≪ m使我们能够进一步将时间复杂度降低到O(|E| + m^2)。考虑到|E| ≪ n^2和m ≪ n,很明显我们提出的模型的时间复杂度远低于通常需要O(n^3)复杂度的谱分解的时间复杂度。

V. 实验

在本节中,我们评估了我们的提议EBMGC-GNF和EMGC2F在多视图聚类(MGC)上的性能,并在广泛使用的基准数据集上进行了实验。为了将我们的提议与现有的最先进多视图聚类模型进行比较,我们选择了11个竞争对手,包括AMGL[17]、SwMC[21]、MLAN[18]、MVGL[24]、AWP[30]、SFMC[22]、NESE[27]、CDMGC[23]、OP-LFMVC[29]、MVSC[39]和AASC[40]。我们的实验在一台配备Intel i7-7700k @ 3.6GHz CPU处理器、32 GB RAM和MATLAB 2020b的开发环境中进行,因为所有基线都使用了这个环境。在深入结果之前,我们概述了实验设置。我们使用[21]中描述的方法构建K最近邻图,并将最近邻居的数量固定为10。对于需要使用K-means进行后处理的技术,如AMGL、MVSC和AASC,我们运行K-means 100次,并记录最低目标值的解。此外,我们使用多视图谱嵌入作为OP-LFMVC的预处理输入矩阵。在本文中,我们使用最近邻层次初始化(N2HI)方法[41]来处理与基于图的离散优化相关的模型。

A. 数据集

在这次比较实验中,我们选择了6个广泛使用的数据集。这些数据集的统计信息在表III中给出,其中样本表示总样本数,聚类表示总聚类数。特征的维度由视图-v表示。接下来,我们提供了这些数据集的概述:
  • COIL20[42]包含20个对象,每个对象水平旋转360°,每隔5°拍摄一张照片。总共包含1,440张灰度图像。
  • DIGIT10[43]由10000个样本和3个视图组成。每个样本是一个手写数字(0-9)。
  • MSRC[44]有5个视图,包含7个类别(树木、建筑物、飞机、牛、人脸、汽车和自行车),共210张图像。
  • ORL[45]包含400张40个不同人的图像,总共有四个视图,每个视图对应于一个手工设计的特征。
  • BBCSPORT[46]由从BBC Sport网站收集的544个文档组成。每个文档被分成两个部分,并手动用五个主题标签进行注释。
  • 100LEAVES[47]来自UCI知识库。该数据集包含1600个样本,涵盖100种植物,每个样本都通过其纹理直方图、细边缘和形态描述来识别。

B. 有效性评估

我们进行测试以评估我们的模型在六个真实数据集上的有效性,通过比较实验展示了我们的提议对多视图聚类的改进。通过将分配给每个样本的标签与数据集提供的标签进行比较,我们可以评估聚类结果。聚类性能通过四个常用的聚类指标来衡量:准确度(ACC)、归一化互信息(NMI)、F1分数和调整兰德指数(ARI)。在五个数据集(COIL20、DIGIT10、MSRC、ORL和100LEAVES)上的聚类结果表明,EBMGC-GNF击败了所有最先进的竞争对手,如表II所示。在BBCSPORT数据集上,EBMGC-GNF仅次于表现最好的AWP,但明显领先于其他比较模型。具体来说,在COIL20数据集上,EBMGC-GNF比最佳竞争对手提高了0.1083(ACC)、0.0383(NMI)、0.1155(F1)和0.1224(ARI)。在DIGIT10数据集上,EBMGC-GNF比最佳竞争对手提高了0.0209(ACC)、0.0325(NMI)、0.0351(F1)和0.0391(ARI)。在MSRC数据集上,EBMGC-GNF比最佳竞争对手提高了0.0477(ACC)、0.0909(NMI)、0.0836(F1)和0.0972(ARI)。在ORL数据集上,EBMGC-GNF比最佳竞争对手提高了0.0575(ACC)、0.0076(NMI)、0.0343(F1)和0.0354(ARI)。在100LEAVES数据集上,EBMGC-GNF比最佳竞争对手提高了0.0512(ACC)、0.0185(NMI)、0.0654(F1)和0.0661(ARI)。此外,表II表明EBMGC-GNF在所有指标上始终优于EMGC2F。这种优越性能归功于CGNV模块的灵活性和EBMGC-GNF的整体平衡,与EMGC2F相比。特别地,在BBCSPORT数据集上,EBMGC-GNF比EMGC2F提高了0.0331(ACC)、0.0552(NMI)、0.0758(F1)和0.1020(ARI),在100LEAVES数据集上,EBMGC-GNF比EMGC2F提高了0.0887(ACC)、0.0310(NMI)、0.1175(F1)和0.1188(ARI)。此外,我们确定在比较算法中获得最高ARI指数值的比较模型作为最佳竞争对手。然后我们绘制了EMGC2F、EBMGC-GNF和最佳竞争对手之间每个指标差异的图表,如图5所示。从图5中可以看出,EBMGC-GNF不仅在大多数数据集上提供了最佳结果,而且与最佳竞争对手相比也有显著的改进。评估CGNV模块。在本文中,我们提出了一个跨视图好邻居投票(CGNV)模块,以从多个视图中提取可信的成对标签。因此,精度,即正确提取的成对标签(根据真实标签)与所有提取的成对标签的比率,对整个模型至关重要。如果精度太低,整个模型的性能将不可避免地下降。如果精度高,它将对后续的聚类过程产生积极影响。在实验中,我们报告了主要提出的EBMGC-GNF模型和简化的EMGC2F模型的CGNV模块的精度,在图4中。如图4所示,我们发现EBMGC-GNF模型在所有数据集上的精度都超过0.99,这表明其在捕获多个视图间一致信息以准确形成聚类方面的有效性。具体来说,EBMGC-GNF模型在COIL20、MSRC、ORL和100LEAVES数据集上的精度为1,在DIGIT10数据集上的精度为0.9950,在BBCSPORT数据集上的精度为0.9970。虽然DIGIT10和BBCSPORT数据集上的精度没有达到1,但它仍然表明了高精度和最小误差。同时,EMGC2F采用了更简单的策略,在COIL20、MSRC、ORL和BBCSPORT数据集上实现了1的精度,在DIGIT10数据集上的精度为0.9581,在100LEAVES数据集上的精度为0.9989。总之,EBMGC-GNF在所有数据集上表现一致,在DIGIT10数据集上与EMGC2F相比有显著改进。

C. 效率评估

运行时间分析。基于第IV-D节的计算复杂度分析,我们评估了我们提议的实际运行时间。为此,我们运行每个模型五次,记录平均执行时间。结果如图6所示。图6中的结果清楚地表明,我们的模型与其他模型相比提供了减少的运行时间,使其成为所有分析数据集中最快的。我们的模型在所有数据集上持续展现出最快的性能,特别是在较大的数据集上。例如,在DIGIT10数据集上,我们模型的运行时间明显优于竞争方法,表明了显著的优势。我们的结果表明,EBMGC-GNF的优化效率显著优于其他模型,如我们的理论分析所预测的,EBMGC-GNF优化的O(|E| + m^2vt)复杂度远比当前依赖于谱分解的模型的O(n^3)复杂度更有效。所有上述结果表明,我们的方法EBMGC-GNF在所有方法中的运行时间仅次于EMGC2F,而它远低于其他方法。收敛性分析。在第IV节中,我们提供了理论证明,表明问题(20)的目标值将持续减少,直到算法1收敛。EBMGC-GNF和EMGC2F的收敛曲线在实验部分中描述,如图7所示。这个图表清楚地展示了算法1的快速收敛能力。在问题(16)和(17)中,我们为EBMGC-GNF和EMGC2F引入了两种正则化项。实验结果表明,两个模型都表现出色。尽管EMGC2F具有稍快的运行时间,但与EMGC2F相比,EBMGC-GNF在准确性指标上显示出更高的准确性。因此,这两个模型非常适合在对速度和准确性有不同优先级的场景中使用。同样值得注意的是,两个模型通常在运行时间和准确性方面都优于以前提出的模型。

VI. 结论

本文介绍了EBMGC-GNF模型,用于多视图聚类(MGC),主要目标是直接从多个视图中学习一致的聚类标签,从而消除了当前模型所需的耗时的谱分解。该模型设计了两种信息融合机制,可以高效可靠地挖掘和融合跨视图邻居信息。此外,我们提出了一个平衡正则化项,通过严格的理论证明,确保了平衡聚类。我们提供了一个时间复杂度为O(|E| + m^2vt)的高效优化算法。我们的实验结果表明,我们的模型既有效又高效。特别是,EBMGC-GNF使用可靠和一致的信息作为直接约束,代表了最简单的方法。然而,将来可能需要考虑如何以更灵活和细致的方式使用信息。

声明

本文内容为论文学习收获分享,受限于知识能力,本文对原文的理解可能存在偏差,最终内容以原论文为准。本文信息旨在传播和学术交流,其内容由作者负责,不代表本号观点。文中作品文字、图片等如涉及内容、版权和其他问题,请及时与我们联系,我们将在第一时间回复并处理。

#论  文  推  广#

 让你的论文工作被更多人看到 


你是否有这样的苦恼:自己辛苦的论文工作,几乎没有任何的引用。为什么会这样?主要是自己的工作没有被更多的人了解。


计算机书童为各位推广自己的论文搭建一个平台,让更多的人了解自己的工作,同时促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 计算机书童 鼓励高校实验室或个人,在我们的平台上分享自己论文的介绍、解读等。


稿件基本要求:

• 文章确系个人论文的解读,未曾在公众号平台标记原创发表, 

• 稿件建议以 markdown 格式撰写,文中配图要求图片清晰,无版权问题


投稿通道:

• 添加小编微信协商投稿事宜,备注:姓名-投稿

△长按添加 PaperEveryday 小编


PaperEveryday
为大家分享计算机和机器人领域顶级期刊
 最新文章