中国兰花具有深厚的文化意义和巨大的经济价值,但其栽培面临品种混杂、识别困难等问题,且存在商业炒作和假冒伪劣等现象,因此需要一个高效、准确的品种识别系统。深度学习技术在图像分类任务中取得了显著进展,但在兰花品种分类方面的研究尚属空白。为了弥补这一差距,湖南省园艺研究所李卫东研究员团队花费一年多的时间收集和整理,构建了一个名为 Orchid2024 的中国兰花品种图像数据集,用于中国兰花品种分类。该数据集包含超过 15 万张图像,涵盖8个种 1275 个不同品种,涉及到中国 12 个省级行政区的 20 个城市。研究团队引入了各种参数高效微调(Parameter-Efficient Fine-Tuning, PEFT)方法来加速模型开发,实现了最高的 top-1 准确率 86.14% 和 top-5 准确率 95.44%。最近,该项研究结果以“Orchid2024: A cultivar-level dataset and methodology for fine-grained classification of Chinese Cymbidium Orchids”为题发表于Plant Methods。命名与分类:遵循林奈分类系统,以属种名加拼音标注品种名,根据开花花朵的外观进行分类,并设置了6个额外类别以增强模型的分类准确性和应用范围。数据收集与处理:在 2022 年 10 月至 2024 年 1 月期间,通过多种途径系统地收集中国兰花图像,包括科研机构的种植基地、参加展览和会议、技术支持平台以及网络搜索等,覆盖了多个地区和多种兰花品种,并利用计算机程序对收集到的超过 50 万张图像进行预处理,包括去除低质量和重复图像、提高数据纯度等。针对不同种的兰花品种图像,邀请相应的资深种植者进行专业数据标注,标注完成后研究团队进行三轮质量评估,以确保标注质量符合预期标准。图1 Orchid2024数据集图像采集的来源,2023 年。数据集结构:包含156,630张图像和1,275个品种,按照6:2:2的比例划分为训练集、验证集和测试集。数据集分为粗粒度层次和细粒度层次,粗粒度层次对应中国兰花的种,包含 8 个种和一个额外的类别;细粒度层次对应中国兰花品种,包含 1269 个品种和 6 个额外的子类,这种分层结构有助于更系统地对兰花进行分类和研究。
表1 Orchid2024 数据集的详细结构。
数据集特征:具有高多样性,包括不同种和品种的图像数据,且存在差异;同时数据集分布不平衡,不同品种的图像数量差异较大。
图3 不同种和品种的兰花示例。由于植物育种方法和目标的差异,每个种类中由蓝色边框标注的品种之间具有高度相似的特征,而用红色边框勾勒出的品种与那些蓝色边框标注的品种相比表现出显著的差异。
图4 Orchid2024数据集的样本数量分布情况。表2 Orchid2024 数据集与其他数据集的比较。
PEFT策略探索:采用预训练和微调的研究范式,选择Vision Transformer(ViT)模型作为预训练模型,并使用PEFT方法进行微调,以构建中国兰花的图像分类模型。评估了不同PEFT方法在Orchid2024数据集上的有效性,包括Adapter、低秩适应(LoRA)、视觉提示调整(VPT)等方法。实验与评估:在Orchid2024数据集中对各种视觉PEFT方法进行系统评估,以确定最佳分类性能的配置,并分析PEFT方法设计选择对其整体有效性的影响。实验设置包括使用在ImageNet-21k数据集上训练的ViT/B-16模型作为预训练模型,进行100个周期的训练,采用多种评估指标等。PEFT方法性能比较:LoRA和Bias tuning方法在测试精度上超过全参数微调,Adapter性能与之相当,VPT性能较低,Bias tuning表现出色。不同PEFT方法的相对性能会因任务和数据分布而变化,LoRA在Orchid2024数据集上表现出强大的泛化能力。
图6 在Orchid2024 数据集上使用默认配置的PEFT方法的性能比较。(A)不同 PEFT 方法在 Orchid2024 数据集上的测试准确率,(B)这些 PEFT 方法的可训练参数比例。消融实验结果:增加 Linear probe、LoRA、Partial - 1 和 VPT - Deep 的可训练参数可提高准确性,LoRA 的不同配置表现较好,LoRA - QVKO 效果最佳。监督预训练的模型性能优于自监督学习的 MAE,在 ImageNet - 21k 数据集上预训练的模型通常表现更好,LoRA 与 ImageNet - 21k 预训练模型结合是优势方法。PEFT 方法对学习率敏感,使用较低学习率和权重衰减通常效果更好,LoRA - QV 在不同参数组合下相对更稳健。
表3 不同参数PEFT方法的参数配置对模型性能的影响。表4 不同参数PEFT方法中预训练模型对模型性能的影响。
表5 不同参数PEFT方法中学习率和权重衰减对模型性能的影响。
Orchid2024 数据集和分类系统可以帮助研究人员研究兰花的形态、生理和生态,也可以帮助种植者进行品种识别、培育和保护,还可以帮助市场参与者进行标签和分类,确保市场的透明度和信任度,同时也为现有细粒度图像分类研究提供了新的数据源。Peng, Y., Zhou, Y., Zhang, L., et al. Orchid2024: A cultivar-level dataset and methodology for fine-grained classification of Chinese Cymbidium Orchids[J]. Plant Methods, 2024, 20, 124.• ROSE-X:用于评价3D植物器官分割方法的带注释数据集