124 基于傅里叶变换近红外光谱的鲜食猕猴桃硬度无损预测

文摘   科学   2024-04-27 17:00   陕西  
点击蓝字 关注我们





文献解读 124



主题

猕猴桃

题目

Non-destructive prediction of ready-to-eat kiwifruit firmness based on Fourier transform near-infrared spectroscopy

期刊

Postharvest Biology and Technology

中科院分区1影响
因子
7.0
第一作者Gang Ding通讯作者

Zhiqiang Guo, Yunliu Zeng

单位

园艺作物种质创新与利用国家重点实验室,华中农业大学柑橘保鲜技术研究中心

原文链接

https://doi.org/10.1016/j.postharvbio.2024.112908


01
研究背景

猴桃是一种呼吸跃变型水果,在食用前需要成熟和软化。新收获的果实通常很坚硬(在70100 N之间),在储存过程中,果实的硬度逐渐降低直到果实软化可食。然而,鲜食猕猴桃在运输过程中很容易损坏。根据猕猴桃的硬度对猕猴桃进行分类以确保安全运输至关重要,亟需开发一种准确的猕猴桃硬度无损预测工具。

传统的硬度测试方法包括将硬度探针压入果肉中。然而,这种方法耗时且具有破坏性,无法满足分级线上快速检测的要求。基于光学原理开发的器件可以有效地应对这些挑战,已被证明可有效评估内外部水果质量。然而,由于光谱信息难以及时采集,难以在分级线上快速分选,因此很难达到令人满意的预测效果。相比之下,傅里叶变换近红外(FT-NIR)光谱可将时域光谱信号转换为频域频谱图,显示不同频率分量的强度。随后,通过建立利用已知果实硬度与其在近红外光谱中的吸收特性之间的关系的模型,可以预测未知样品的硬度。尽管已经取得了诸多进步,但在准确预测可供食用的果实硬度方面仍然存在挑战。


02
材料与方法

1. 植物材料和处理

2. FT-NIR数据收集

3. Kiwifirm™和渗透计GY-4的硬度测定

4. 数据分析

4.1. 数据预处理

在该研究中,选择了一系列数据预处理技术,包括多元散射校正(MSC)、Savitzky-Golay平滑(SG)、一阶导数(FD)和二阶导数,以建立RBF神经网络回归模型,用于预测建模目的。

4.2. 光谱波段的降维

采用了两种常用的光谱波段选择方法,竞争性自适应重加权采样(CARS)和顺序投影算法(SPA)。此外,应用传统的降维技术主成分分析(PCA)进行特征降维。

4.3. 模型评估指标

FT-NIR获得的光谱信息使用5种常见的回归指标来评估模型的预测性能。这些指标包括拟合系数(RC^2、RD^2)和均方根误差(RMSEC、 RMSEP)的校准集以及测试集的相对预测差(RPD)。


03
实验结果


3.1 猕猴桃保质期硬度变化的FT-NIR分析
数据收集开始,大多数水果样品的平均硬度低于40 N(图1A)。在建立全面的无损硬度预测模型之前,对样品进行分割。将408个无异常猕猴桃样品按73的比例分为校准组和测试组。校准装置和测试装置的硬度测量结果如表1所示。

图1. 猕猴桃的保质期硬度(A)和傅里叶变换近红外反射光谱的分布(B)

表1. 猕猴桃硬度统计

共采集了408个猕猴桃样本,获得了由1557个波段组成的FT-NIR数据。图1B显示光谱表现出明显的背景干扰和基线漂移,进行了光谱数据预处理以简化模型,针对每种预处理方法制定了不同的RBF回归模型,并根据预测结果选择最有效的预处理方法。如表2所示,当使用全光谱范围构建RBF模型时,RP^2测试集为0.41,RPD为1.30,低于1.4,表明所建立的模型对猕猴桃硬度的预测不可靠。然而,使用光谱预处理方法改善之后所构建的模型相对可靠,可以粗略预测猕猴桃的硬度。结果表明,FD预处理方法的预测效果最好,FD-RBF模型的测试集最高,RMSEP最低,RPD为1.92,预测效果最好。因此,后续的所有实验都将基于FD预处理方法进行。

表2. 使用不同方法基于全波段数据的预测结果

采用FD预处理方法,采用SVR-LinearSVR-RBFSVR-PolyRBFPLSR等多种方法建立猕猴桃硬度预测模型。因此,使用RBF构建的模型具有最低的RMSEP0.718,最高的R^20.727,最高RPD1.916,表明RBF模型是最可靠的(1.4<RPD<2.0)(表3)。

表3. 不同预处理方法下RBF模型的预测结果

3.2 预测模型的优化

使用CARS进行降维的结果表明,选择过程遵循指数衰减函数(图2A)。选定的光谱特征的数量最初迅速减少,然后趋于平稳。此外,随着样品数量的增加,RMSEC先降低后迅速增加(图2B),这可能归因于在选择的后期阶段消除了过多的非必要光谱特征。最小RMSEC是在26次迭代后实现的,相应的选择为271波长。由于蒙特卡罗采样的随机性,CARS方法在波段选择中引入了随机性和不确定性,这可能导致光谱特征缺失或冗余的问题。因此,对CARS进行了多次迭代,并保留了在20多次迭代中选择的波段,总共有256个波段。

图2. CARS迭代,显示变化和SPA功能选择。A和B表示CARS迭代的结果,显示了所选光谱特征数量的变化以及相对于样本数量的均方根误差(RMSE)。C表示SPA特征选择的结果

同样,由于CARS方法的随机性和不确定性,很容易包含冗余波段。为了减少特征带的数量,采用SPA算法进一步提取CARS选择的特征带。SPA是一种采用矢量投影分析,根据最小RMSEP选择最佳特征波长数量的正向特征选择方法。图2C演示了RMSEP的变化作为SPA选择的有效波长数量的函数。可以观察到,RMSEP随着有效波长数量的增加而降低。根据CARS选择的频段,SPA将选定的频段数量从256个减少到196个。
在这里,通过使用CARSCARS-SPA选择的PCA降维波段,并将保留信息的参数设置为0.999,分别获得了CARSCARS-SPA选择的波段的184个和188个新特征(表4)。

表4. 通过不同特征提取方法提取的特征变量的数量

如表5所示,RBF神经网络模型对预测集的拟合系数均大于0.80,RPD大于2.2,表明该模型在预测猕猴桃的硬度方面具有较为可靠和令人满意的性能。在4种特征提取方法中,FD-CARS-PCA方法的结果最好,在测试集中的决定系数为0.901,最大RPD为3.181。与其他波长选择方法相比,它表现出更好的拟合性能和预测稳定性。与使用全谱数据构建的RBF模型相比,该模型在特征选择后表现出显著的预测性能,验证了特征选择方法的有效性。此外,可以观察到,在使用RBF构建预测模型时,训练集上的性能远优于测试集上的性能,表明模型在一定程度上存在过拟合,这可能是由于样本量小,模型隐藏层过于复杂。因此,我们以SVR模型为参考构建了回归模型,并探讨了使用不同回归模型对四种特征提取方法的影响。
5. 不同特征提取方法建立的RBF模型预测结果

研究选取RBF、线性核(Linear)和多项式核(Poly3个优化核函数进行建模分析。使用不同核函数获得的预测结果如表6、表7、表8所示。

6. 不同特征提取方法建立的SVRRBF)模型预测结果

7. 通过不同特征提取方法建立的SVRLinear)模型的预测结果

8. 不同特征提取方法建立的SVRPoly)模型预测结果

6至表8的结果表明,使用不同特征提取方法建立的SVR模型均具有较高的预测精度。具体而言,FD-CARSRBF)和FD-CARS-PCA-SVRRBF)的RPD均超过3.3,表明这两种方法在SVR模型中具有最高的预测精度。
7和表8显示,使用线性函数或Poly函数构建的SVR模型也表现出较高的预测精度。此外,FD-CARS-SVRLinear)在所有方法中实现了最高的预测精度。
对表中数据的综合分析表明,使用SVR方法构建的模型优于使用RBF网络方法构建的模型。
3显示了FD-CARS-SVRRBF)建模方法下训练集和测试集的测量和预测果实硬度值的相关图表。

图3. 在波段选择和降维之前(A)和之后(B),训练集和测试集的实测值和预测值的相关性。x轴表示实测值,y轴表示预测值

3.3 无损检测装置的相关性分析

总体而言,FT-NIR模型的数据拟合效果相对较好。训练集和测试集的拟合曲线值分别为0.790.92。与Kiwifirm™相比,FT-NIR模型的拟合曲线呈线性,与实际硬度数据的相关性更高。Kiwifirm™通过用探针敲击水果表面来测量水果的表皮数据以描述其实际硬度,内部处理器将弹性特性转换为数值。然而,果实软化主要是由于淀粉和细胞壁的降解。在果实的缓慢软化过程中,聚半乳糖醛酸酶等酶活性的增加导致果胶的降解和细胞壁多糖的液化。水果快速软化的主要原因是淀粉分解,这发生在细胞壁逐渐分解之前。因此,仅根据果皮数据很难描述果实硬度的变化。此外,其可能无法完全实现无损测试,因为它可能会破坏猕猴桃的完整性。

基于货架时间的曲线拟合具有较高的R^2。在预测相关性方面,基于货架时间的分类方法可能比基于硬度的分类方法更合适。对于硬度较高的猕猴桃,FT-NIR模型表现出更好的预测性能,对于硬度低于10 N的果实,Kiwifirm™在预测性能方面优于FT-NIR模型。然而,FT-NIR模型的整体预测性能仍然优于Kiwifirm™

图4. FT-NIR模型和Kiwifirm™获得的数据与实际硬度数据的相关性。A和D表示FT-NIR模型和Kiwifirm™获得的数据与实际硬度的相关性;B、E表示按货架时间分类后的相关性;C和F表示基于硬度分类后的相关性

05
结论
猕猴桃行业对鲜食猕猴桃的需求一直在增加。果实硬度的选择性测定对鲜食猕猴桃的运输和零售具有重要意义。为了提高果实硬度的预测精度,我们通过数据预处理、特征选择和降维等方式优化了FT-NIR算法。FD-CARS-SVRRBF算法在评估猕猴桃保质期内的硬度方面表现出优异的性能。FT-NIR模型比Kiwifirm™优越性更显著,特别是在10~40  N的硬度范围内。该模型可用于分选线上鲜食猕猴桃的无损硬度评估,提升鲜食猕猴桃产品的质量。


本文图表均来自本文献


END
微信号:kiwifruitplus
邮箱:mihoutaojia517@163.com
-扫码关注我们-

文献解读:王家琪

 编辑:王家琪

 校稿:赵沁雨

 审核:马婷婷

  《猕猴桃加》微信公众号所使用的文章和图片属于相关权利人所有,因客观原因,如存在不当使用的情况,敬请相关权利人随时与我们联系及时处理。欢迎转发朋友圈,如需转载,请标明“转载自《猕猴桃加》”。

欢迎加入猕猴桃加
welcome

邀稿:【猕猴桃加】诚邀猕猴桃相关领域专家、业内人士及广大师生在我们的平台上发布与猕猴桃相关的科研、资讯等内容。(投稿请联系vx:kiwifruitplus)


交流沟通:欢迎所有关心和对祖国猕猴桃事业感兴趣的小伙伴们一起进行沟通交流。可以通过公众号给小编留言或者私戳(vx:kiwifruitplus)


转载合作:可以通过vx:kiwifruitplus或【猕猴桃加】邮箱(mihoutaojia517@163.com)联系我们。

猕猴桃加
一群热爱猕猴桃的人们,愿祖国猕猴桃事业越来越好
 最新文章