引用格式:
Yi SHI, Hanjia YE, Dongliang MAN, Xiaoxu HAN, Dechuan ZHAN, Yuan JIANG. Revisiting multi-dimensional classification from a dimension-wise perspective. Front. Comput. Sci., 2025, 19(1): 191304阅读原文:
虽然类别不平衡问题在多分类范式中得到了广泛的研究,但由于不平衡偏移现象,其在多维度分类(MDC)背景下的研究受到了限制。当样本属于一个标签维度(LD) 中的次要类而属于另一个 LD 中的主要类时,样本作为次要类或主要类实例的分类变得不明确。以前的 MDC 方法主要强调实例方面的标准,忽略了维度方面的预测能力,即跨 LD 的平均分类性能。我们强调了维度指标在现实 MDC 应用中的重要性,并引入了两个这样的指标。此外,我们观察每个 LD 内的不平衡类别分布,并提出一种新颖的不平衡感知融合模型(IMAM)来解决 MDC 问题。
图 1. 我们展示了从一个 LD 到另一个 LD 的不平衡转移。图中计算 Zappos 数据集上两个 LD 上的实例数量。图中彩色块标注的数值表示对数后的值转型。当 LD 更改时,许多主要类实例会变成次要类实例。换句话说,实例的主要/次要类属性很难跨 LD 保留。
1. 我们首先将任务分解为多个多类分类问题,为每个 LD 分别创建不平衡感知深度模型。这种简单的方法在 LD 上表现良好,并且不会牺牲实例标准的性能。 2. 随后,我们采用 LD-wise 模型作为多个教师,并将他们跨所有 LD 的知识转移到统一的学生模型。图 2. 我们提出的 IMAM 方法的图示,该图展示了基于具有两个 LD 的 MDC 问题。在分解步骤 (a) 中,我们为每个 LD 构建不平衡感知深度模型。在融合步骤(b)中,我们使用前一步中的模型作为教师,并将他们的知识融合到一个学生模型中。特征(绿色)和分类器(红色)蒸馏都有助于匹配模型之间的知识。下标“T”表示教师部分。“CE”表示交叉熵。
表 1. 四种传统 MDC 方法、四种深度 MDC 方法以及我们的 IMAM 在四个真实数据集上的性能。我们计算了实例和标签方面的四个评估指标。文章精要 | 南京大学李宇峰教授团队:RTS:面向带有噪声标记时序数据的稳健学习方法
2024 18(6):186332
文章精要 | 北京航空航天大学黄迪教授团队:FIFAWC:群体行为识别的具有详细注释和丰富语义的数据集 2024 18(6):186351
文章精要 | 中科院软件所马菲菲研究员团队、计算所曹娟研究员团队合作提出:基于提示的对抗样本生成和鲁棒性提升方法 2024 18(4):184318
文章精要 | 南京航空航天大学黄圣君教授团队:基于成对置信度对比信息的鲁棒AUC优化 2024 18(4):184317
文章精要 | 北京航空航天大学王薇教授团队:基于区块链和联邦学习的物联网流量入侵检测算法 2024 18(5):185328
Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐B类期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;入选“中国科技期刊卓越行动计划项目”。