点击下方“PaperEveryday”,每天获得顶刊论文解读
点击加入论文投稿、写作、阅读分享交流群
论文信息
题目:EBMGC-GNF: Efficient Balanced Multi-view Graph Clustering via Good Neighbor Fusion
EBMGC-GNF:通过好邻居融合实现高效平衡的多视图图聚类
作者:Danyang Wu; Zhenkun Yang; Jitao Lu; Jin Xu; Xiangmin Xu; Feiping Nie
论文创新点
1 跨视图好邻居投票(CGNV)模块:该模块旨在通过引入锚点评估两个节点之间的标签一致性,有效地捕获多视图中的一致性信息。这种方法不仅适用于多视图图聚类(MGC)任务,而且对多视图相关任务具有重要的理论意义。 2 自适应加权机制:该机制能够根据每个视图的重要性分配不同的权重,从而整合多视图信息,捕捉多视图数据中的多样性。 3 基于p-幂函数的平衡正则化项:该正则化项能够定量调整聚类的平衡属性,通过调整超参数p的值,可以实现更加平衡的聚类结果,这对于处理不同分布的数据尤为重要。 4 图粗化和加速坐标下降算法:为了提高多视图图聚类的效率,论文提出了一种图粗化方法和基于加速坐标下降的优化算法,显著降低了模型的时间复杂度,从传统的O(n^3)降低到O(|E| + m^2),使得模型在大规模数据集上的应用变得更加可行。
摘要
关键字
多视图聚类 基于图的聚类 平衡聚类
I. 引言
第一类专注于从多个视图相似性矩阵或谱嵌入中学习一致的谱嵌入,通过K-means[7]或谱旋转[8]生成聚类结果。这一类进一步细分为核近似[8],流形近似[10]和图重建[11],代表性模型包括CoregSC[12],DGMC[13]和PF-CEL[14]用于核近似,MEA[15]和SCML[16]用于流形近似,AMGL[17]和MLAN[18]用于图重建。 第二类旨在通过对多个视图相似性矩阵应用结构化约束来学习块对角相似性矩阵,直接表示聚类结果。此外,这一类中的主要学习策略主要包括Frobenius范数最小化[19]和内积最小化[20]。采用Frobenius范数最小化的代表性模型包括SwMC[21],SFMC[22]和CDMGC[23]。同时,内积最小化的典型方法包括MVGL[24]等。 第三类致力于开发多种策略,从多视图谱嵌入中获取一致的聚类(软)指示矩阵。然后,这一类可以细分为以下几组:分解近似[25]和自适应Procrustes[26]等。代表性模型用于分解近似包括NESE[27],MSGL[28]和OP-LFMVC[29]。同时,自适应Procrustes的典型模型包括AWP[30],MAGC[31]等。
丰富性:为了全面融合多视图信息,我们提出了两个融合机制。我们提出的CGNV模块有效地捕获了多个视图中的一致性。该模块不仅适用于MGC任务,而且对多视图相关任务具有重要的理论意义。此外,我们提出的自适应加权机制捕获了多个视图中的多样性。 平衡性:我们提出了一种基于p-power函数的新型平衡正则化项,可以定量调整聚类的平衡属性。在方法论部分,我们提供了严格的理论证明,证明随着p值的增加,可以实现平衡聚类。 效率:为了提高MGC任务的效率,我们提出的EBMGC-GNF模型避免了耗时的谱分解过程,直接学习指示矩阵。此外,实验部分表明,我们的模型在MGC任务的运行时间方面优于现有模型。
III. 方法
A. 多视图图聚类与全面融合框架
B. 跨视图好邻居投票模块
C. 平衡正则化
D. 模型推导和进一步转换
EBMGC-GNF模型:, EMGC2F模型:。
IV. 优化
A. 固定E,更新
B. 固定,更新E
当时:
当时:
当时:
当时:
C. 收敛性分析
D. 时间复杂度分析
V. 实验
A. 数据集
COIL20[42]包含20个对象,每个对象水平旋转360°,每隔5°拍摄一张照片。总共包含1,440张灰度图像。 DIGIT10[43]由10000个样本和3个视图组成。每个样本是一个手写数字(0-9)。 MSRC[44]有5个视图,包含7个类别(树木、建筑物、飞机、牛、人脸、汽车和自行车),共210张图像。 ORL[45]包含400张40个不同人的图像,总共有四个视图,每个视图对应于一个手工设计的特征。 BBCSPORT[46]由从BBC Sport网站收集的544个文档组成。每个文档被分成两个部分,并手动用五个主题标签进行注释。 100LEAVES[47]来自UCI知识库。该数据集包含1600个样本,涵盖100种植物,每个样本都通过其纹理直方图、细边缘和形态描述来识别。
B. 有效性评估
C. 效率评估
VI. 结论
声明
#论 文 推 广#
让你的论文工作被更多人看到
你是否有这样的苦恼:自己辛苦的论文工作,几乎没有任何的引用。为什么会这样?主要是自己的工作没有被更多的人了解。
计算机书童为各位推广自己的论文搭建一个平台,让更多的人了解自己的工作,同时促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 计算机书童 鼓励高校实验室或个人,在我们的平台上分享自己论文的介绍、解读等。
稿件基本要求:
• 文章确系个人论文的解读,未曾在公众号平台标记原创发表,
• 稿件建议以 markdown 格式撰写,文中配图要求图片清晰,无版权问题
投稿通道:
• 添加小编微信协商投稿事宜,备注:姓名-投稿
△长按添加 PaperEveryday 小编