【文献综述】农业中高效的标记学习

文摘   科技   2024-10-06 06:20   美国  

【微信群】智慧农业交流群🌽

该公众号免费宣传:招生/招聘等信息,联系即可!


标题:

Label-efficient learning in agriculture: A comprehensive review

第一作者 :Jiajia Li

美国密歇根州立大学

第二作者 :Dong Chen

美国密歇根州立大学

通讯作者:Zhaojian Li

美国密歇根州立大学

🛰️🛩️🌱🌱🌱🌱🌱🌱🌱🌱🌱🧠💻

图文摘要

研究背景:随着深度学习(DL)和机器学习(ML)在农业中的应用不断扩大,它们在除草、植物病害诊断、农业机器人和精确畜牧管理等领域取得了显著的成果。然而,这些模型对大规模标注数据的依赖极大地限制了其广泛应用。数据标注不仅耗费成本且费时,特别是在农业应用中,这促使研究人员开发标签高效的学习方法,以减少数据标注的需求。本文提出了一种系统的标签高效学习方法分类,并回顾了这些方法在农业中的应用。
研究目标:旨在综述和系统分类标签高效的深度学习方法,尤其是在农业中的应用。这些方法包括弱监督学习(如主动学习、半监督学习、弱监督学习)和无监督学习(如自监督学习和完全无监督学习)。论文的目标是为未来农业中的标签高效学习方法的研究方向提供建议,并指出现存的挑战。

研究方法:

  • 文献综述方法: 采用PRISMA方法系统收集文献,并根据监督的程度对方法进行分类,重点涵盖了自监督、半监督和弱监督等学习方法。

  • 分类体系: 根据监督程度,该分类系统主要分为弱监督学习和无监督学习,分别介绍了多种子领域的具体算法和应用案例。

  • 农业应用回顾: 对标签高效学习在精准农业、植物表型分析、和农产品后处理质量评估等方面的应用进行了详细讨论。


主要总结:
  • 弱监督学习:

    • 主动学习: 通过选择最有信息量的样本进行标注,减少标注成本。例如,应用在桉树病害识别中,通过熵和密度选择算法,大幅降低了标注成本。

    • 半监督学习: 利用大量未标注数据进行训练,如大豆病害识别中,伪标签方法与卷积神经网络结合,大幅提升了模型性能。

    • 弱监督学习: 使用粗略标签,如图像级别标签,通过多实例学习(MIL)和类激活映射(CAM)等方法进行植物病害的自动化识别。

  • 无监督学习:

    • 自监督学习: 通过对未标注数据生成伪标签进行特征学习,特别是在植物病害检测中,自监督对比学习(如Siamese网络)取得了显著的精度提升。

  • 应用领域: 标签高效学习在农业中应用广泛,包括精准农业中的植物病害监测、杂草管理、果实检测以及水产养殖中的鱼类喂养状态识别等。


代表性标签高效学习技术的综合分类法。我们的分类法包括两个主要类别(以蓝色框显示),每个类别由多个子区域(以绿色框显示)组成。

主动学习算法示意图:基于流的选择性采样和基于池的采样主动学习。𝐿𝜇分别表示已标记和未标记的数据集。
基于不确定性的查询策略的框架。选择并查询高度不确定的样本。
“noise student”算法. student被指定为每次迭代的new teacher。

不同注释类型的标签成本示例

多实例学习 (MIL) 的实例和包生成过程。这些包是分组到集合中的实例。“+” 和 “-” 分别表示正实例和负实例。

Grad-CAM 的可视化 、Grad-CAM++ 和 Score-CAM在两个输入图像上。Score-CAM 显示相关物体的浓度较高。

自我监督学习的管道。


DeepCluster 算法的框架。深度特征迭代聚类,集群分配用作伪标签来学习CNN.

SimCLR 框架算法。两个相关视图 (𝑣和𝑣’)𝑥是从两个数据增强(𝑡𝑇和𝑡𝑇').基本编码器网络𝑓𝜃和一个投影头𝑔𝜃经过训练以使用对比损失最大化一致性。

BYOL 算法框架.BYOL 最大限度地减少了𝑞𝜃(𝑧𝜃)和sg(𝑧𝜉)哪里𝜃是经过训练的权重,𝜉是𝜃和sg表示停止渐变。

SwAV 算法框架.代码𝑄𝜃和𝑄‘𝜃是通过匹配图像特征 (𝑦𝜃和𝑦'𝜃) 添加到一组原型𝐶.

JULE 算法框架. 一个简单但有效的端到端学习框架,用于从未标记的图像集中共同学习深度表示和图像集群。

用于柑橘螨虫和害虫分类的基于注意力的多实例学习引导式方法 

用于估计苹果数量以进行产量估计的半监督/无监督学习算法的管道 .(a) 输入图像。(b) 超像素分割。(c) 苹果分割。(d) 检测。

用于检测、分割和跟踪葡萄的弱监督学习算法框架

域适应算法

用于检测和分割马铃薯缺陷的弱监督方法的中间结果示例

提出的草莓异常检测自监督方法的架构

结:

论文在主动学习、半监督学习及自监督学习方面展示了新颖的技术细节,特别是在植物病虫害监测和产量预测中展现出很好的应用前景。尽管方法多样且具创新性,但研究也指出了在处理多样化农业场景和复杂环境数据时面临的挑战。未来的工作可以进一步优化这些方法在不同农业场景中的泛化能力和效率。

新颖技术细节:

  1. 使用自监督学习进行无标签数据的植物健康监测。

  2. 结合深度卷积神经网络和弱监督学习提升分类精度。

  3. 主动学习减少了农作物病虫害检测中的标注成本。

推荐指数:⭐‍⭐⭐⭐

链接

https://doi.org/10.1016/j.compag.2023.108412【权责声明】

遥感与数字农业
分享数字农业和人工智能相关的技术,文献,招聘,产品等信息。 建立智慧农业学界业界一体化公众号平台 如需推广,回复公众号即可。