文章精要 | 山西大学钱宇华教授团队:距离关联内嵌数据表征方法

学术   2024-09-24 12:17   北京  

       

      FCS“优秀青年计算机科学家论坛”于2019年启动,以尊重科学贡献、传播更多优秀成果为宗旨。论坛作者审视自己的研究领域,介绍研究方向和研究进展。本论坛所有文章均为特邀稿件。

      本期“优秀青年计算机科学家论坛”推出山西大学钱宇华教授团队的成果——距离关联内嵌数据表征方法。



作者简介
      钱宇华,山西大学计算智能与中文信息处理教育部重点实验室教授、博士生导师,主要从事计算智能、数据挖掘与知识发现方面的科研教学工作。近五年来,先后在国际国内重要学术刊物和国际会议发表学术论文70余篇,其中SCI收录40余篇,获发明专利2项,软件著作权登记1项。论文引用达近3000次,4篇论文入选“Web of Science”高引用论文名单。



引用格式:

Xinyan LIANG, Yuhua QIAN, Qian GUO, Keyin ZHENG. A data representation method using distance correlation. Front. Comput. Sci., 2025, 19(1): 191303 

阅读原文:



问题概述


      特征间关联性已被证实可用于提升数据的表征能力。然而,原始关联数据重构方法可能面临如下两个问题:重构数据维度必定高于原始数据维度及所采用的关联度量方法无法平衡算法的有效性和高效性。为解决这两个问题,本文提出一个新颖的内嵌关联的表征提升方法,称为AssoRep。
      文章旨在提出更高效、有效的关联内嵌的数据表征学习,基于泰勒展开式内嵌距离相关系数到原表征空间,提升数据的表征能力。




技术步骤


      通过幂次函数丰富原始数据中的关系形式,内嵌特征间距离相关系数到原特征空间,并使用主成分降维技术构建结构紧凑的特征关联内嵌的数据新表征。




实验结果

    

      大量实验结果表明,基于本文提出的距离关联表征学习技术,可有效提升数据的分类性能,并在样本规模较大的数据集上具有更优的性能表现。


文章推荐:


文章精要 |  华东师范大学钱鸿副教授团队:基础模型增强的无梯度认知诊断 2025 19(1)191318


文章精要 | 南京大学李宇峰教授团队:RTS:面向带有噪声标记时序数据的稳健学习方法 2024 18(6)186332


文章精要 | 北京航空航天大学黄迪教授团队:FIFAWC:群体行为识别的具有详细注释和丰富语义的数据集 2024 18(6)186351


文章精要 | 南京航空航天大学黄圣君教授团队:基于成对置信度对比信息的鲁棒AUC优化 2024 18(4)184317


期刊简介

Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐B类期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;入选“中国科技期刊卓越行动计划项目”。

FCS
Frontiers of Computer Science期刊公众号
 最新文章