中国农业科学院油料所油料品质化学与加工利用团队在《食品科学》发表综述:机器学习与计算机视觉技术在食品质量评价中的研究进展

2024-07-21 12:28   江苏  

近日,中国农业科学院油料作物研究所油料品质化学与加工利用创新团队在《食品科学》期刊上发表了题为“机器学习与计算机视觉技术在食品质量评价中的研究进展”的综述性论文。硕士研究生黄晓琛为本文的第一作者,魏芳研究员为本文的通讯作者

该综述讨论了近年来机器学习和计算机视觉技术在食品质量评价领域中的应用,并重点介绍了卷积神经网络、人工神经网络、支持向量机以及计算机视觉技术的相关原理和应用情况。此外,还针对基于机器学习和计算机视觉技术的食品质量评价方法在农产品、海产品、肉类产品等方面的预测与分类进行了全面的总结。最后强调了机器学习和计算机视觉技术在食品质量评价领域的机会和挑战,以指导未来食品质量评价系统的进一步研究




一、背景介绍

近年来,随着社会对食品质量和安全的关注度不断提高,计算机视觉技术在食品质量评价领域逐渐受到重视并开始广泛应用。通过学习技术,如人工神经网络、卷积神经网络和支持向量机等,研究人员能够利用大量的食品图像和相关数据进行训练,从而实现对食品质量的自动评估和监测。特别是深度学习技术的发展,使得计算机能够更加准确地识别食品的外观、形状、颜色等特征,进而对其进行分类、预测和质量检测。除了在食品质量评价中的常规应用,学习技术还被用于更复杂的任务,如食品缺陷检测、异物检测、新鲜度评估等。这些技术不仅可以提高食品生产和加工的效率,还能够减少人为因素带来的误差,从而确保食品质量和安全。然而,尽管学习技术在食品质量评价中的应用取得了显著进展,但仍然存在一些挑战需要克服。例如,食品图像数据集的获取和标注成本较高,数据质量和数量的不足可能会影响模型的性能和泛化能力。此外,模型的可解释性和透明性也是一个重要问题,尤其是在需要对食品质量评价结果做出解释或决策的情况下。因此,未来的研究需要继续探索如何提高数据集的质量和规模、优化模型的鲁棒性和可解释性,以及开发更加高效和可持续的食品质量评价系统。

本综述对计算机视觉(computer visionCV)和机器学习(machine learningML技术在食品质量评估领域的原理、优势、局限性、特点进行总结,并探讨它们在食品质量评价中的应用情况,重点讨论不同种类食品质量评估的应用场景,介绍MLCV技术在不同场景中的算法与方法,探讨它们在食品质量评价中的应用情况。

二、机器学习及模型介绍

Fig. 1. General configuration of machine learning system

食品质量对人们的日常生活和健康状况有直接影响,因此长期以来,针对食品质量检测技术的研究从未停止。传统的食品检测技术在解决食品质量问题上发挥了重要作用。然而,随着时代的进步、消费者对食品的复杂性和对食品质量认知的提高,对即时了解食品质量的需求也日益迫切。在这种背景下,计算机视觉(computer visionCV)和机器学习(machine learningML)技术的迅速发展为食品质量评估带来了革命性的变革。目前有一些常用的技术用于解决分类以及测定问题,如决策树、人工神经网络(artificial neural networkANN)等,主要用于食品图像分类、食品识别以及食品加工检测等,图1展示了ML的一般结构


人工神经网络(artificial neural networkANN

Fig. 2. General topological structure of artificial neural network


ANN的特点主要体现在高效和自学习能力上,它能够对复杂的数据信息进行分类、聚类,并与学习目标结合。图2展示了ANN的一般拓扑结构。作为一种数据处理模型,ANN的构建方式类似于生物神经系统处理大脑信息模式,其主要由大量高度相关的处理单元即神经元组成,通过协同工作来解决复杂问题。目前ANN的应用与开发依然是研究的核心领域。近年来,ANN已应用于CV食品质量评价中的分类、预测和分级。

在一些应用中,Abbaspour-Gilandeh等提出了一种非破坏性方法,基于混合ANN-粒子群优化-particle swarm optimizationPSO算法和混合ANN-人工蜂群artificial bee colony algorithm ABC)算法用于评估苹果的组成特性,利用4001000 nm范围内的光谱数据估计红鲜苹果的一些机械和物理化学特性,包括衡量果汁中糖度和酸度之间平衡的指标(Brix minus acidBrimA)、硬度、酸度以及淀粉含量,最高决定系数R2分别为:BrimA0.898、硬度为0.8、酸度为0.825、淀粉含量为0.973。选择最有效的波长预测其性质,其中5 测定BrimA9 可测定硬度、7 可测定酸度、5 测定淀粉含量。在这种情况下,ANN-ABC1 000 重复中的最佳R2分别为0.8280.7380.9000.923。通过评估结果,发现通过选择合适的光谱范围可以提高基于光谱数据方法估计精度

支持向量机(support vector machinesSVM

Fig. 3. Schematic diagram of classification with support vector machines

目前,SVM是备受ML领域关注的二分类模型之一。SVM模型具有很强的泛化能力和不错的准确性,它是将实例表示为空间中的点,通过映射使得单独类别的实例被尽可能宽且明显的间隔分开,然后将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。从本质上讲,SVM模型通过推导一个使类边界之间的边界最大化的最优分离超平面解决定性分类或定量回归问题。图3展示了SVM的分类原理图。

随着时代的发展,SVM也逐渐应用在了食品当中,Mannaro2022SVM技术应用于传统撒丁岛扁平面包生产过程,以确保对面包的质量把控。面包在离开发酵室时,其形状以及颜色可能存在不规则、不均匀的问题,因此作者基于SVM算法构建了一个ML模型,并在生产阶段对不同面包片的大小和形状,以及由于环境和生产变量所导致的形状变化进行记录,将这些数据作为训练集提供给ML模型。模型构建完成后,作者利用该算法对后续一年多的收购过程中面包片大小的预测结果进行了记录,结果表明,作者所提出的算法被证明能够快速而准确地估计面包片的大小。并且在最坏的情况下,该算法产生的最大误差等于像素大小的2.2%这一算法显著提升了生产产品的质量,并且能够及时提醒面包生产者在生产过程中可能出现的错误,帮助他们及时采取措施进行修改或补救。

卷积神经网络(convolutional neural networksCNN
目前,DL在分类和模式识别等领域受到了广泛的关注,许多的研究者都开始将其应用在食品掺假等问题的检测上。其中CNN被认为是在处理复杂任务时非常有效的算法之一,比如图片或物体的识别,以及食品成熟度的评估。除了这些方面,CNN在食品领域还有许多其他广泛的应用。Sun Li2021提出了一种基于CNN苹果质量与外观分类的改进方法,考虑到苹果外观数据量不足,因此他们的方法是基于少量样本进行改进的。对收集来的完整的苹果数据,作者将这些数据进行分割,分割完成后,利用深度卷积生成对抗网络和非生成数据增强进行数据扩展,最后将预处理后的数据输入到本文提出的Imp-ResNet50模型中进行分类。模型完成后作者用360 张苹果图像进行对比实验,对该方法在训练图像质量、运行时间和分类精度等方面的性能进行了验证。结果表明,该方法不仅可以得到高质量的训练样本,同时还有效地缩短了方法的运行时间。当然该方法相较于以往的分类方法,其分类的准确率更高,高达96.5%。在后续的研究中,通过对不同品种苹果的适应,该方法或许能够更好地应用于苹果分类市场中。

三、计算机视觉技术



CV是一种快速、经济、灵活的方法,类似于人类视觉,但能够同时对多个外观参数进行高精度、高强度的分析CV技术包含了高光谱CV系统和多光谱CV系统。高光谱CV系统经常被用于捕获高光谱和空间分辨率的图像,用于基础研究。而多光谱CV系统的功能是捕获高光谱CV系统选择的有效波长的单色图像。因为成像系统的可负担性、可及性以及易用性,因此在食品的生产与质量控制上有很大的帮助,又因其非侵入性、非破坏性的特点,对于需要即采即检的水果、蔬菜等产品可以避免破坏样本并提高效率。并且CV技术可以通过图像数据提供关于样本的纹理、颜色等信息,利用这些表型特征可以对分析农产品等食品提供有效帮助


四、ML-CV技术在食品质量评价中的应用

食品质量评价的相关问题(如食品溯源、食品安全、食品营养等)对人类健康、营养和疾病具有潜在影响,引起了广泛的关注。而近年来,ML-CV技术在农产品的分类与品质指标预测领域中应用广泛,为了全面了解ML-CV技术在食品质量评价领域中的应用,我们按照食品的类型以及不同模型在其中应用方向进行分类,并将其总结在表1中


Table 1 Applications of machine learning and computer vision technology in food classification and prediction


五、挑战及未来展望


本文深入探讨了CVML技术在食品质量评估领域的应用。随着CV技术与ML技术在食品评价领域的发展,CVML技术已经越来越多地应用到实际生产中。可以在收获时,通过对水果、蔬菜以及农产品受损伤程度进行分级,缩短人工分级所需要的时间;还可以在工厂的加工过程中,实时监控生产产品的质量,对于不合格的产品进行提前清除。然而,CVML技术在食品质量评估中仍然面临着一些挑战和障碍,CV技术与ML技术并不能够对食品质量进行全面的评价,并且在数据处理过程中还会出现算法的鲁棒性和可解释性等问题。因此在后续优化的过程中,还需要对不同环境下模型的适配能力进行深度研究,并且加强CV技术提供的数据精度。在未来越来越多的食品将朝着多样化、个性化的需求发展,而CV技术和ML技术将逐步实现对食品质量的精准把控,并进行有针对性的调控。同时,ML技术在食品质量预测和控制方面也展现出了强大的潜力。通过对大量的历史数据和实时监测数据进行分析和学习,ML算法能够建立高度准确的预测模型,预测食品的成分、含量、新鲜度等关键指标。这些预测模型不仅可以帮助企业优化生产工艺和管理流程,提高产品质量和生产效率,还可以为监管部门提供科学依据,加强对食品安全的监管和管理。

综上所述,未来MLCV技术在食品质量评估领域的应用需要不断发展,为食品安全和质量保障提供更可靠的支持,并为食品行业的可持续发展和消费者的健康提供更多可能性。


本综述得到了国家自然科学基金联合基金项目(U21A20274);“十四五”国家重点研发计划重点专项(2021YFD1600103);农业农村部油料作物生物学与遗传育种重点实验室开放课题(KF2023008);中国农业科学院创新工程项目(CAAS-ASTIP-2013-OCRI);湖北省自然科学基金创新群体项目(2023AFA042)等项目的资助。

END

供稿:黄晓琛

责任编辑:魏芳

论文链接:https://doi.org/10.7506/spkx1002-6630-20240131-284


关于我们



中国农业科学院油料作物研究所油料品质化学与营养创新团队脂质分析实验室致力于突破脂质组分析所面临的生物基质复杂、脂质及其代谢产物种类繁多且结构复杂、定性和定量分析困难等共性关键技术瓶颈,建立高效,高通量的脂质组分析平台,并将该平台广泛应用于:(1)不同生物种质资源中脂质组成;(2)应用于食品安全与质量控制;(3)脂质的生物功能与营养学评价;(4)开发新的功能脂质。


脂质组分析平台:

扫码关注更多精彩

油料脂质分析实验室
中国农业科学院油料作物研究所脂质剖析与鉴定课题组致力于突破脂质组分析所面临的生物基质复杂、脂质及其代谢产物种类繁多且结构复杂、定性和定量分析困难等共性关键技术瓶颈,建立高效,高通量的脂质组分析平台。
 最新文章