《食品科学》:河南科技大学殷勇教授等:基于Fisher判别分析可分性信息融合的马铃薯VC含量高光谱检测方法

健康   2024-11-21 17:36   北京  
马铃薯又称土豆、洋山芋等,具有粮菜兼具的特点。马铃薯中VC含量丰富,是马铃薯品质的重要指标。马铃薯VC含量的快速检测可用于马铃薯的品质监控,同时为马铃薯育种、筛选、产业原料的选择提供便利。近年来,高光谱成像(HSI)技术因其快速、分辨率高等优点,被广泛应用于农产品病害检测、缺陷检测、肉制品质量检测、掺假掺杂等方面。Fisher判别分析(FDA)是一种经典的分类方法,能够生成光谱特征的线性组合,并构建用于分类的线性识别模型,可以将FDA看作一种数据融合方法,用于构建检测模型的输入变量。
河南科技大学食品与生物工程学院的郭林鸽、于慧春、殷勇*以HSI技术检测马铃薯VC含量为切入点,提出一种基于FDA可分性数据融合的检测模型输入变量构建方法,并借助PLS模型和反向传播神经网络(BPNN)模型提高马铃薯VC含量检测结果的准确性。由于FDA本身也是一种分类方法,故该检测模型既能实现马铃薯品种鉴别,也能实现马铃薯VC含量检测。

光谱预处理

对预处理前后的数据分别建立PLS和BPNN模型,采用R2p和预测集均方根误差(RMSEP)作为模型的评价指标。R2p越接近1,RMSEP越小,说明拟合程度越高,模型越可靠。由表1可知,与原始数据所建模型的预测能力相比,一阶导数预处理后所建PLS模型的预测能力与其基本相当,但BPNN模型的预测能力较低,不适合作为马铃薯VC含量检测模型的预处理方法。其余5 种方法预处理后所建模型的预测能力均优于原始数据所建模型的预测能力,尤其是经MSC方法预处理后所建PLS和BPNN模型,R2p和RMSEP由0.858 2和1.652 6、0.893 9和1.467 3分别提高至0.928 4和1.173 9、0.956 5和0.935 4,极大地提高了模型的预测能力。因此,初步确定MSC为原始数据的预处理方法。

如图1所示,MSC通过偏移校正能有效减少由于散射水平不同引起的光谱差异,增强光谱与数据之间的相关性,提升模型预测能力,这与表1的结果相吻合。因此确定MSC为光谱预处理方法。

特征波长提取


2.1基于CARS算法的特征波长提取

在CARS算法中,设定蒙特卡罗采样次数为50,采用5折交叉验证计算RMSEP。由图2可知,当采样次数为28 次时获得的RMSECV最小,对应特征变量个数为34,故此时所选的34 个特征变量即为提取结果。

2.2基于SPA的特征波长提取

在SPA中,设定特征变量个数选择范围为1~90,最小的RMSECV对应的变量个数即为特征波长个数。由图3可知,特征变量个数为36时,RMSECV达到最小且逐渐稳定,此时提取的36 个特征波段对应的波长为最终的特征波长。

2.3基于CARS-SPA组合算法的特征波长提取

在CARS-SPA组合算法中,SPA进行二次特征波长提取时的变量为1~34。通过CARS算法提取34 个特征波长,再经SPA二次提取得到23 个特征波长。CARS-SPA组合算法能极大减少特征波长的个数,简化模型运算。
如表2所示,CARS-SPA组合算法提取的特征波长数最少,但其所建模型的相关系数最低,虽然模型得到简化,但降低了模型的预测能力。与SPA相比,CARS算法提取的特征波长数量相对较少,所建模型的相关系数高,RMSEP小,能有效减少光谱信息中的冗余信息,更适合作为马铃薯光谱数据的特征波长提取方法。经CARS算法筛选出的34 个特征波段所建PLS和BPNN模型将R2p和RMSEP由最初的0.928 4和1.173 9、0.956 5和0.935 4分别提高到0.948 6和0.996 7、0.972 6和0.772 3,实现了简化模型的同时提高模型的可靠性,这与文献中采用CARS所达到的效果类似。结合表1、2可以发现,BPNN模型预测结果优于PLS模型预测结果。因此,可初步确定BPNN更适合作为检测马铃薯VC含量的建模方法。

检测模型输入变量构建结果

FD1、FD2分别是基于CARS算法提取的34 个特征波长经FDA融合后对样本间差异性判别能力前两位的变量。图4是FD1和FD2对不同样本间可分离性的可视化表达,训练集和测试集的分类正确率均达到100%,表明FD1、FD2能检测出不同样本间的差异性,且经FDA融合后的变量相互正交,可减少变量间的关联性对模型的影响。

由表3可知,FD1和FD2累计判别能力仅有0.93左右,若以FD1、FD2组成向量作为检测模型的输入变量,可能会对模型的准确性造成不利影响。而FD1、FD2、FD3对样本间差异的累计判别能力接近于100%,FD4及其后变量对样本间差异的判别能力可忽略不计。因此,选择由FD1、FD2、FD3组成向量作为VC含量检测模型的输入变量。

VC检测模型构建

通过传统方法测得4 种马铃薯VC含量作为预测模型的真实值,通过PLS和BPNN模型分别获得VC含量预测值,根据拟合结果判断模型的准确性。由表4可知,除湖北马尔科马铃薯外,经FDA融合后建立的BPNN模型获得的VC含量预测值与传统方法测得的VC含量真实值基本一致,模型预测结果良好。

由表5可知,经FDA生成的输入变量所构建的PLS和BPNN模型的R2p均有所提高,尤其是经FDA构建的输入变量构建的BPNN模型R2p由0.972 6提高到0.999 0,RMSEP也由0.772 3减小到0.172 7。由此可知,经FDA构建的输入变量能有效提高马铃薯VC含量预测模型的预测能力。此外,基于不同输入变量的BPNN模型的相关性能参数均优于PLS模型,与表1、2结果一致。故确定BPNN为预测马铃薯VC含量的建模方法。

基于MSC-CARS-FDA-BPNN的序贯组合方法建立4 类马铃薯VC预测模型的预测值和真实值的拟合结果如图5所示。湖北马尔科马铃薯有2 个样本的预测值略偏大,其余样本预测值均在14.33~14.36 mg/100 g内,与表4的真实值基本一致。说明基于FDA可分性数据融合构建的输入变量能提高马铃薯VC含量预测结果的准确性。

5 结论

采集4 种不同品种的马铃薯的高光谱数据,探究6 种预处理方法对模型预测VC含量结果的影响,确定MSC为最优预处理方法。在对比3 种特征波长提取方法提取效果的基础上,借助PLS模型和BPNN模型探讨了经FDA融合前后模型预测结果的准确性,并确定最优预测模型。对比分析SPA、CARS算法和CARS-SPA组合算法提取的特征波长对VC含量检测结果准确性的影响,发现CARS算法筛选的34 个特征波长能很好表征不同品种马铃薯的重要信息,不仅简化了模型运算,还提高了模型检测结果的准确性。将34 个特征波长进行FDA可分性融合后生成新变量,发现前3 个变量(FD1、FD2、FD3)对样本间差异的累计判别能力达99%以上,将该组合变量作为VC含量检测模型的输入变量,显著提高了VC含量检测结果的准确性。探讨不同输入变量的PLS、BPNN模型R2p和RMSEP发现,BPNN模型的预测值和真实值拟合效果更好,更适合用于马铃薯VC含量的检测。

综上,经FDA可分性数据融合所构建的输入变量能显著提高马铃薯VC含量检测结果的准确性。同时,采用MSC-CARS-FDA-BPNN的序贯组合方法不仅实现了马铃薯中VC含量的快速、准确检测,还实现了马铃薯的种类鉴别。



作者简介


通信作者

殷勇河南科技大学食品与生物工程学院教授,博士生导师,河南省首届高校青年骨干教师,河南省学术技术带头人,河南省杰出青年科学基金获得者,美国农业工程学会会员。主持或参与完成国家级、省部级科研项目9项,在《Sensors and Actuators B》 《Journal of Food Engineering》《农业工程学报》《农业机械学报》《仪器仪表学报》等著名杂志上发表论文60余篇,SCI、EI检索50余篇,获省部级科技进步二等奖2项,出版专著1部,教材1部。主持或参与国家级、省部级项目各7项,现为《Sensors and Actuators B》 《Food and Bioprocess Technology》《Food Control》《农业机械学报》《农业工程学报》《食品科学》等期刊评阅人,国家自然科学基金函评专家,中国农业机械学会基础技术学会理事。现从事农产品、食品快速无损智能检测技术等方面研究。该技术涉及农产品/食品的各种物理与化学特性,传感器融合技术、计算机技术、电化学技术、全局优化技术、计算数学等内容。所指导的研究生具有跨界的知识结构,尤其为今后从事AI、数据处理等方面的工作奠定了基础,为以后在多种领域就业储备了必要的基础技能。

第一作者:

郭林鸽河南科技大学食品与生物工程学院食品科学与工程专业,全日制硕士研究生,研究方向为食品检测与智能分析。

本文《基于Fisher判别分析可分性信息融合的马铃薯VC含量高光谱检测方法》来源于《食品科学》2023年45卷第7期164-171页,作者:郭林鸽,殷 勇*,于慧春,袁云霞。DOI:10.7506/spkx1002-6630-20230808-034点击下方阅读原文即可查看文章相关信息。

实习编辑:栾文莉;责任编辑:张睿梅。点击下方阅读原文即可查看全文。图片来源于文章原文及摄图网

近期研究热点

《食品科学》:浙江大学程焕高级工程师等:基于化学计量学鉴定不同甜橙精油挥发性成分
《食品科学》:福建农林大学郭玉琼教授等 :基于感官评价和代谢组学分析叶用枸杞茶
《食品科学》:浙江海洋大学张宾教授、水珊珊博士等:热加工对3 种带鱼肌球蛋白功能特性的影响
《食品科学》:河南工业大学张玉荣教授等:基于稻谷原粮品质的米饭和米粉食用品质快速判别
《食品科学》:南京财经大学汤晓智教授等:基于藜麦蛋白Pickering乳液模拟牛油

《食品科学》:江南大学翟齐啸教授等:肠道菌群研究模型和组学技术在食品化学危害物风险评估中的应用

食品科学杂志
传播食品科学知识,促进食品科技交流,弘扬中国传统饮食文化,倡导健康安全饮食习惯。
 最新文章