近日,我校计算机科学与工程学院白静教授指导研究生林淦、蒋金哲等对图像数据增强技术进行了深入的研究与全面综述。该项研究题为“Frontiers and Developments of Data Augmentation for Image: From Unlearnable to Learnable”(图像数据增强的前沿与发展:从不可学习到可学习),已被国际顶级学术期刊《Information Fusion》正式录用。
DOI:https://doi.org/10.1016/j.inffus.2024.102660
01
图1 论文题目及摘要等基本
《Information Fusion》是计算机科学领域内人工智能及理论方法方向的权威期刊,致力于展示多传感器、多来源、多过程信息融合领域的最新研究成果,促进相关学科之间的交流与合作。该期刊被SCI和EI检索,并位于JCR1区,中科院计算机科学1区(Top期刊),五年平均影响因子高达16.1,是计算机科学领域极具影响力的学术期刊之一。
数据增强(Data Augmentation)是深度学习中扩展训练数据的关键技术,可有效缓解深度学习模型中有限训练数据引起的过拟合问题。如图 2 所示,我们根据“变化”策略将现有数据增强方法分为不可学习和可学习的数据增强;此外,根据 ''变化'' 属性的来源、范围和内容,我们将这两种类型的方法细分为单样本和多样本、全局和局部、图像域和特征域。进而,综述了各类不可学习数据增强方法(如图3)和可学习数据增强(如图4、图5),并围绕图像分类(图6)、目标检测、图像分割和图像超分辨率重建四个下游任务梳理了各类数据增强方法的应用,最后围绕五个问题对现有数据增强方法进行总结,并就四个方向提出了展望。
02
图2数据增强方法分类
03
图3 不可学习数据增强方法
04
图4 可学习数据增强—基于生成模型的数据增强方法
05
图5 可学习数据增强—目标驱动的数据增强方法
06
图6 用于图像分类任务的各种图像数据增强方法的性能比较
该成果以北方民族大学为第一完成单位,获得了国家自然科学基金、宁夏自然科学基金、宁夏青年拔尖人才和北方民族大学研究生创新项目的资助。
来源:北方民族大学计算机学院公众号
编辑:褚昆鹏
监制/审核:彭鹏、李家伟
终审:魏兆军