近日,智慧教育学院(计算机科学与技术学院)杜明晶副教授指导其电子信息专业硕士研究生李宇蕊发表了一篇题为《Feature Weighting-Based Deep Fuzzy C-Means for Clustering Incomplete Time Series》的文章,于2024年9月24日在人工智能顶级期刊《IEEE Transactions on Fuzzy Systems》(SCI一区)上在线发表。
这是我校电子信息专业研究生首次以第一作者身份在该期刊上发表学术成果,标志着我院在研究生教育培养及人工智能领域研究上的显著进步。
1
期刊介绍
《IEEE Transactions on Fuzzy Systems》是全球模糊系统领域的顶级期刊,主要刊载模糊逻辑、模糊集合理论和模糊系统等方面的最新研究成果。该期刊属于中科院SCI一区期刊,CCF-B/CAAI-B类期刊,影响因子为10.7。
2
论文介绍
时间序列聚类是一种重要的无监督数据分析技术,广泛应用于医学、股票分析等领域。然而,在现实世界中的一些场景下,时间序列数据不可避免地存在缺失值,从而降低了传统聚类方法的效率。在不完整时间序列中,现有的聚类方法通常采用两阶段策略,即首先插补缺失值,然后聚类。然而,这种将插补与聚类分离的方法可能导致优化目标不一致,增加参数调优的复杂性,从而可能导致不满意的聚类结果。对此,本文提出了一种不完整时间序列的端到端深度模糊聚类模型,简称EEDFC,该模型通过整合多个损失,在统一的框架内共同优化插补和聚类。在插补部分,模型利用注意力机制来解决长序列中依赖关系的挑战,并引入了一种对抗策略来增强插补和特征表示学习能力,从而减少了从插补到聚类的误差传播。在聚类部分,实现了一种基于特征加权的模糊聚类算法(FWFC),同时考虑了簇内紧密性和簇间分离性。此外,采用指数距离,将加权策略集成到KL散度损失中,与插补部分联合训练和优化,以提高聚类性能。
图1 算法框架
在10个数据集上与11种流行的两阶段和一阶段聚类算法相比,所提算法在聚类效果、噪声鲁棒性、运行效率方面都有一定程度的提升。
图2 消融实验结果
图3 参数敏感性实验结果
图4 收敛性实验结果
3
作者简介
李宇蕊:江苏师范大学智慧教育学院(计算机科学与技术学院)2021级电子信息专业硕士研究生;
杜明晶:江苏师范大学智慧教育学院(计算机科学与技术学院)副教授、硕士生导师;
张文斌:江苏师范大学智慧教育学院(计算机科学与技术学院)讲师、智能科学与技术系主任;
蒋翔:江苏师范大学智慧教育学院(计算机科学与技术学院)讲师、硕士生导师;
董永权:江苏师范大学智慧教育学院(计算机科学与技术学院)院长、教授、硕士生导师。
排版|原 静 张素雅
审核|黄有玉 吴福玉