近日,智慧教育学院(计算机科学与技术学院)杜明晶副教授指导的电子信息专业硕士研究生李宇蕊发表了一篇题为《Contrastive Learning-Based Multi-View Clustering for Incomplete Multivariate Time Series》的文章,于2024年12月2日在人工智能顶级期刊《Information Fusion》(SCI一区)上正式发表。
这是我校研究生首次以第一作者身份在该期刊上发表学术成果,标志着我院在研究生教育培养及人工智能领域研究上的显著进步。
期刊介绍
《Information Fusion》是人工智能领域与计算机科学的国际顶级期刊,主要刊载信息融合、数据融合、知识融合等方面的最新研究成果。该期刊属于中科院SCI一区期刊,CAAI-A类期刊,最新影响因子为14.8。
论文介绍
不完整多变量时间序列聚类是时间序列分析中的一个研究热点,其目的是将包含缺失数据的多变量时间序列划分为不同的聚类。基于对比学习的多视图聚类方法有望解决这一问题,然而,现有的方法通常不是为时间序列设计的,它们中的大多数都难以捕获时间序列的固有属性,并且容易失去其维度间的相关性因而会损害数据的完整性。与此同时,它们通常利用数据增强技术来生成样本对进行对比学习。这些现有的数据增强技术并不适合时间序列,而且引入了不确定性因素,这些因素降低了对比学习的表示学习能力。为了解决这些挑战,提出了一种基于对比学习的不完整多变量时间序列(MVCIMTS)多视图聚类方法。在这种方法中,MTS中的每个变量都被视为一个单独的视图,从而支持多视图学习方法。为了更好地利用时间序列的内在信息,MVCIMTS使用了基于GRU的模型架构,该架构将插入和聚类集成在统一的深度学习框架中。通过这种方法可以有效地推断缺失视图,学习适合聚类的表示,从而提高对不完整时间序列的聚类性能。此外,引入了一种专门为MTS量身定制的创新对比学习方法,该方法确保了对视图之间共同语义和聚类一致性的探索不受不确定性因素的影响。它假设同一样本内的每个时间序列变量具有相似的表示,从而考虑了变量之间的相关性,提高了表示的质量。据悉,这是第一次将基于对比学习的多视图深度聚类应用于不完整MTS的尝试,在7个基准数据集上对5种多视图聚类方法和2种时间序列聚类方法进行了广泛的对比实验。结果表明,本文所提出的方法优于其他最先进的方法。
图1 算法框架
在7个数据集上对5种流行的多视图聚类算法和2种时间序列聚类算法相比,所提算法在聚类效果、表征学习、参数鲁棒性方面都有一定程度的提升。
图2 表征可视化实验结果
图3 参数敏感性实验结果
图4 收敛性实验结果
作者简介
李宇蕊:江苏师范大学智慧教育学院(计算机科学与技术学院)2021级电子信息专业硕士研究生;
杜明晶:江苏师范大学智慧教育学院(计算机科学与技术学院)副教授、硕士生导师;
蒋翔:江苏师范大学智慧教育学院(计算机科学与技术学院)讲师、硕士生导师;
张楠:温州大学计算机科学与人工智能学院副教授、硕士生导师。
排版|卞枫韵
一审|林威宇
二审|黄有玉
三审|董永权