《食品科学》:昆明理工大学张付杰副教授等:基于近红外光谱技术结合ARO-LSSVR的天麻中有效成分含量快速检测

健康   2024-09-07 11:06   北京  

天麻是兰科植物天麻的干燥块茎,又称定风草、水洋芋,既是一种名贵的中药材,也是保健食品。研究表明,天麻中的有效药用成分是酚类,包括天麻素、对羟基苯甲醇(天麻苷元)、4-羟苄基甲醚、4-(4-羟苄氧基)苄基甲醚;在这些成分中,通常以天麻素和对羟基苯甲醇二者的含量评估天麻的药效和价格,是衡量天麻品质的重要指标。近红外光谱技术以创新性和非破坏性的优势在我国农产品检测和食品领域有着广泛的应用,同时也在中药材质量监控、含量检测等方面应用较多。
昆明理工大学现代农业工程学院的李珊珊、张付杰*、李丽霞等采用便携式近红外光谱仪(900~1700 nm)采集光谱,基于原始光谱数据和预处理后的光谱数据,采用CARS和迭代保留信息变量(IRIV)提取特征波长,并对比两种特征提取算法的建模结果。利用人工兔优化算法(ARO)进行最小二乘支持向量回归(LSSVR)模型参数的优化,根据决定系数和均方根误差(RMSE),建立并选择天麻素及对羟基苯甲醇的最佳预测模型,以期为天麻的有效成分含量快速检测提供理论依据。

1 数据预处理

采集的天麻光谱数据存在外界环境的干扰和大量噪声的影响,并且会有基线漂移的现象,因此需要通过预处理的方法消除外界因素对光谱信息的影响。使用The Unscrambler X 10.4(64-bit)软件对光谱数据进行预处理,其中,卷积平滑(SG)可以去除噪声,标准正态变量变换(SNV)可以校正在光谱采集过程中因散射现象等引起的光谱误差。考虑到不同预处理方法的不同作用,选择2 种预处理结合作为提高原始光谱信噪比的方法。其中,SG的阶数设置为1,平滑窗口大小设置为30,此后的数据处理均基于此预处理方法。由图3可以发现,曲线间间距变小,噪声和散射现象均得到改善。光谱曲线有4 处明显的吸收峰,分别在1000、1200、1480、1600 nm波长附近,这是因为天麻素、对羟基苯甲醇含有羟基和醚键等官能团。从图中可以看出,950 nm与1480 nm波长处的吸收带与碳水化合物O—H拉伸的二级倍频和一级倍频有关。1100~1250 nm波长附近吸收峰是天麻素C—O键伸缩振动引起。在1180~1250 nm波长处有明显的波峰,对应于天麻素中O—H的拉伸一级倍频,在1480~1620 nm波长处具有明显的吸收峰,与苯环骨架振动吸收有关。1450~1510 nm波长附近的吸收峰归因于C—H和C—C拉伸振动的组合

2 特征选择


2.1 基于CARS的天麻素的特征波长选择

在CARS特征选择过程中,蒙特卡洛采样次数设置为50,采用五折交叉验证法,天麻素和对羟基苯甲醇的特征选择过程如图4所示。在采样初期,样本变量的数目迅速减少,波长数量的变化趋势随着采样运行次数的增加逐渐减小(图4a)。图4b为RMSECV的变化趋势图,RMSECV先减小后增大。天麻素和对羟基苯甲醇的RMSECV分别在1~18 次和1~23 次采样中逐渐减小,不能表征天麻素和对羟基苯甲醇含量的信息被删除。在采样19 次和24 次后,随着一些信息被删除,RMSECV逐渐变大。在图4c中,蓝色位置为最佳采样,此时RMSECV最小,所选择的波长组合最佳。经过CARS的特征选择后,天麻素和对羟基苯甲醇分别选择了44 个和30 个特征波长。所选择的特征变量分布如图5所示。


2.2 基于IRIV的特征波长选择

本研究选用IRIV的交叉验证次数为5,最大主成分数为10。天麻素和对羟基苯甲醇的迭代过程中保留的变量数如图6所示。在IRIV的特征选择过程中,随着迭代次数的增加,保留的变量数逐渐减少,最后趋于稳定。天麻素光谱数据在第6次迭代后,通过删除无用变量和干扰变量,保留了49 个强信息变量和弱信息变量,之后为反向消除,通过比较每个变量消除后模型的RMSECV是否降低,决定是否删除该变量。对羟基苯甲醇的光谱数据在第7次迭代后,保留了37 个强信息变量和弱信息变量。最终天麻素和对羟基苯甲醇数据分别反向消除了19 个和13 个波长变量,分别得到了27 个波长变量和24 个波长变量,分别占全波长数目的11.8%和10.9%。

3 定量模型的建立与分析

将CARS、IRIV选择的特征变量作为LSSVR的输入,天麻素、对羟基苯甲醇的含量作为模型的输出,进行LSSVR定量模型的建立,建模结果如表2所示。对比表中特征选择算法,CARS、IRIV这两种特征选择方法可以将天麻素、对羟基苯甲醇的光谱信息进行筛选,保留了能够表征天麻素、对羟基苯甲醇的有用信息,简化了模型,比全波段的LSSVR模型性能更好。天麻素、对羟基苯甲醇的最佳特征选择算法均为CARS,CARS-LSSVR在天麻素、对羟基苯甲醇成分含量的预测中表现出更高的精度,天麻素和对羟基苯甲醇的R2p分别为0.8573和0.8643,RMSEP分别为0.0660和0.0643。
虽然特征选择后的精度有所提高,但是仍然可以进一步提升。本研究引入智能优化算法ARO对LSSVR模型参数进行优化,并与PSO、GWO的建模结果进行比较,如表3所示。3 种算法的最大迭代次数设置为100,种群规模大小设置为30,参数γσ2的范围设置为[0.01,1000]。

通过建模对比可以发现,引入优化算法后的预测结果高于优化前,说明经过ARO算法优化后LSSVR建立的模型能够提高模型的精度,ARO算法在寻优速度、寻优能力上优于PSO、GWO,ARO的预测效果最好。天麻素、对羟基苯甲醇的最佳预测模型为CARS-AROLSSVR,其分别为0.9696和0.9577,RMSEP分别为0.0140和0.0200,CARS-ARO-LSSVR模型的预测如图7所示。

结论

本研究提出了一种基于近红外光谱的快速检测方法,建立了天麻中天麻素和对羟基苯甲醇含量的检测模型,用于对天麻中有效成分含量的预测。分别采用CARS、IRIV算法对SG-SNV预处理后的光谱数据进行特征波长提取,建立近红外光谱与天麻素、对羟基苯甲醇含量的LSSVR模型,同时采用ARO算法进行模型参数优化,其中天麻素、对羟基苯甲醇的最佳预测模型为CARS-ARO-LSSVR,其R2p分别为0.9696和0.9577,RMSEP分别为0.0140和0.0200。综上,近红外光谱结合CARS-ARO-LSSVR对天麻中有效成分含量的预测可行,本研究可为天麻快速检测装置的研发提供部分理论依据,同时也为其他中药材的快速检测研究提供一定理论参考。
本文《基于近红外光谱技术结合ARO-LSSVR天麻中有效成分含量快速检测》来源于《食品科学》2023年45卷第4207-213页,作者:李珊珊,张付杰,李丽霞,张 浩,段星桅,史 磊,崔秀明,李小青DOI:10.7506/spkx1002-6630-20230831-244点击下方阅读原文即可查看文章相关信息。

实习编辑;云南师范大学生命科学学院 母朵银;责任编辑:张睿梅。点击下方阅读原文即可查看全文。图片来源于文章原文及摄图网。

近期研究热点


《食品科学》:中国农业科学院毕金峰研究员等:桃酶促褐变机理与调控技术研究进展
《食品科学》:东北农业大学张微副研究员等:CRISPR/Cas-等温扩增技术在食源性病原菌检测中的研究进展
《食品科学》:贵州大学黄永光研究员等:酱酒1、2轮次窖池不同醅层微生态结构与酸性化合物组成解析及其相关性预测
《食品科学》:湖北文理学院郭壮教授等:基于纯培养和超高深宏基因组测序技术分析茅台镇两企业高温大曲微生物多样性差异
《食品科学》:东北农业大学迟玉杰、迟媛教授等:超声协同蒸汽处理对壳鸡蛋表面大肠杆菌的杀菌机理及动力学分析
《食品科学》:浙江海洋大学房传栋博士等:不同添加物结合真空渗透处理对冻藏虾仁肌原纤维蛋白稳定性的影响

为进一步促进动物源食品科学的发展,带动产业的技术创新,更好的保障人类身体健康和提高生活品质,北京食品科学研究院和中国食品杂志社将与陕西师范大学、新疆农业大学、浙江海洋大学、甘肃农业大学、大连民族大学、西北大学于20241014-15陕西西安共同举办“2024年动物源食品科学与人类健康国际研讨会”。

长按或微信扫码了解详情
为加强企业主导的产学研深度融合,促进食品科研成果转化和服务地方经济产业,由全国糖酒会主办,北京食品科学研究院、中国食品杂志社和中粮会展(北京)有限公司承办的食品科技成果交流会将于2024年10月29-31日糖酒会期间在深圳国际会展中心举办,以当前食品科技发展趋势和食品产业发展的重点科技需求为导向,针对食品产业发展面临的重大科技问题,交流和借鉴国外经验,为广大食品科研工作者和生产者提供新的思路,指明发展方向。

长按或微信扫码进行注册

会议招商招展
 联系人:红;话:010-83152138;手机:13522179918(微信同号)

食品科学杂志
传播食品科学知识,促进食品科技交流,弘扬中国传统饮食文化,倡导健康安全饮食习惯。
 最新文章