● 背景介绍 ●
多重表面增强拉曼散射(SERS)作为一种指纹光谱技术,具有高灵敏度、分析速度快、丰富的指纹信息,可同时分析多种物质,不受干扰。然而,从复杂样品的大量光谱数据中提取引人注目的特征存在挑战。仅仅依靠人工目视检查是不够的,需要先进的数据处理方法。作为一种重要的深度学习架构,卷积神经网络(CNN)可以自动发现样品浓度模式,无需手动预处理,这解决了人工特征提取效率低下和分类精度低的缺点。CNN中的正则化过程有效地缓解了深度学习中常见的过拟合问题。
本文开发了一种基于多路复用SERS指纹图谱和1D-CNN模型的农产品识别和认证策略(方案1)。选择三种类型的纳米颗粒来调节样品中化学物质的吸附。每个纳米粒(NP)都与特定的分析物相互作用,产生互补的光谱信息。随后,通过将基于不同NP的SERS光谱序列化组合成“SERS超级指纹图谱”,构建了各种农产品的综合光谱图谱。这种协同组合能够捕获更广泛的化学特征,并增强具有细微成分差异的样品的区分。然后,构建一维CNN模型提取超指纹信息,并与支持向量机(SVM)、随机森林(RF)、线性判别分析(LDA)和k最近邻(KNN)方法进行对比。使用具有不同类别、来源和等级的烤烟以及来自不同来源的绿茶和紫米样品来证明该方法的功效。此外,基于模拟掺假农产品,评估了该模型识别农产品掺假的能力。证实了基于一维CNN模型的多重SERS方法在农产品鉴定和认证方面的潜力。
烤烟的品种识别
Figure 1. (A) Spectra of different varieties of flue-cured tobaccos obtained using AgC NPs as SERS substrate. PCA (B) and t-SNE (C) diagrams of 1120 SERS spectra of different flue-cured tobaccos cultivars. (D) The accuracy of different algorithms with ten runs. (E) Loss curves and accuracy curves of 1D-CNN model based on SERS spectra of different varieties of flue-cured tobaccos. (F) Final accuracy and cross-entropy loss of training and validation sets with ten repeating trainings. (G) Confusion matrix results based on the test data of the 1D-CNN model, with the numbers in parentheses represent the number of spectra for each sample. (H) Confusion matrix results of the output from CNN for unknown samples of different varieties of flue-cured tobaccos, with the numbers in parentheses represent the number of parallel samples.
烤烟的地理原产地识别
烤烟的化学成分在不同地区会表现出差异,主要受各种地理特征的影响,如海拔高度、温度波动、日照持续时间和种植地点的降雨量。可以使用 SERS 捕获此信息。本部分以AgC NPs为SERS底物(图2A1)分析了不同地产地同等级的Yunyan87烤烟样品(图2B),并采用1D-CNN模型对数据进行了进一步处理(图2C)。
随后,将来自三个SERS衬底的光谱数据交叉组合并水平连接,形成不同的复合光谱。具体的组合方法如图2D所示,旨在从不同来源提取烟草的特定特征。然后使用1D-CNN模型对这些组合的光谱数据进行分析,相应的识别精度可见图2D。很明显,当将三种不同基质的SERS光谱连接成一个“超级指纹”时,1D-CNN模型可以全面捕获烤烟样品的光谱信息,从而产生最佳的识别结果。图2F中的混淆矩阵清楚地表明,多重SERS指纹图谱在测试阶段(98.0%)对来自10个不同来源的烤烟实现了高度准确的识别结果,均优于其他算法。此外,十次重复运行的结果也证明了1D-CNN 模型在识别烤烟来源方面的可靠性(图 2E)。此外,该模型还获得了来自不同来源的未知样品的SERS光谱并进行了区分(图2G)。结果证实,利用3个纳米颗粒作为SERS底物的多重SERS方法能够可靠地识别烤烟的地理来源。
Figure 2. Spectra of flue-cured tobaccos of different geographic origins obtained using AgC NPs (A1), Ag7Au3 NPs (A2), and AgA NPs (A3) as SERS substrates. (B) Schematic representation of the geographic locations of flue-cured tobacco samples. (C) Confusion matrix results of test data obtained with AgC NPs. (D) The accuracy with different combinations of SERS substrates. A, B, and C represent AgC NPs, Ag7Au3 NPs, and AgA NPs, respectively. (E) Final accuracy and cross-entropy loss of training and validation sets with ten repeating trainings. (F) Confusion matrix results of obtaining test data of various geographic locations of flue-cured tobacco samples. (G) Confusion matrix results of the output from CNN for unknown samples of different geographic locations of flue-cured tobaccos, with the numbers in parentheses representing the number of parallel samples.
烤烟的等级认可
在图 3A1–A3 中,显示了来自不同等级样品的光谱指纹,使用了 AgC NP、Ag7Au3 和 AgA NPs 作为 SERS 底物。根据文献,烤烟中的尼古丁含量随着成熟度的提高而降低,而绿原酸、芦丁、东莨菪碱的含量则呈现相反的趋势。烤烟成分含量的变化反映在SERS光谱中。在这项工作中,G1-G3样品的成熟度逐渐降低。
Figure 3. Spectra of different grades of flue-cured tobaccos obtained using AgC NPs (A1), Ag7Au3 NPs (A2), and AgA NPs (A3) as SERS substrates. (B) Final accuracy and cross-entropy loss of training and validation sets with ten repeating trainings. (C) Confusion matrix results based on the test data with 1D-CNN model. (D) Confusion matrix results of the output from CNN for unknown samples of different grades of flue-cured tobaccos.
通过混淆矩阵(图3C)评估1D-CNN模型的性能,在测试期间始终显示三个等级的高准确率(99.0%)。此外,图3B中的重复性实验,证实了1D-CNN模型的高识别性能。值得注意的是,该模型准确地识别了不同等级的未知样品,如图3D所示。这些发现强调了多重SERS分析在研究烤烟级鉴定中的实用性。
Figure 4. Spectra of green tea of
different origins obtained using AgC NPs (A1), Ag7Au3 NPs (A2), and AgA NPs
(A3) as SERS substrates. (B) Final accuracy and cross-entropy loss of training
and validation sets with ten repeating trainings. (C) Confusion matrix results
of test data of green tea based on the 1D-CNN model. (D) Confusion matrix
results of the output from CNN for unknown samples of different geographic
origins of green tea. Spectra of purple rice of different origins obtained
using AgC NPs (E1), Ag7Au3 NPs (E2), and AgA NPs (E3) as SERS substrates. (F)
Final accuracy and cross-entropy loss of training and validation sets with ten
repeating trainings. (G) Confusion matrix results of test data for purple rice
based on the 1D-CNN model. (H) Confusion matrix results of the output for
unknown samples of different geographic origins of purple rice.
为了进一步验证多重SERS策略在农产品鉴定应用中的适用性,本节选择不同产地的紫米作为研究对象。紫米富含花青素,包括花青素、芍药素和槲皮素。不同产地的紫米SERS光谱中特定特征峰的相对强度表现出变化。如图4G中的混淆矩阵结果所示,1D-CNN模型对不同来源的紫米样品的识别准确率为98.7%,优于其他算法。1D-CNN模型具有较高的可靠性(图4F)和识别未知样品的强大能力(图4H),表明该模型在农产品识别方面具有巨大的潜力。
● 总结 ●
本研究成功地展示了一种可以根据农产品的品种、原产地和质量对农产品进行快速、精确的区分和认证。该方法将多重SERS指纹图谱与一维CNN建模相结合,成功区分了不同品种、产地和等级的烤烟,以及来自不同地理区域的茶叶和紫米样品。本研究构建了“SERS超级指纹”,从而可以更全面地获取农产品的特征信息。随后,使用1D-CNN 模型,在产品识别方面取得了卓越的准确率,始终超过97.7%,优于传统的机器学习算法。值得注意的是,1D-CNN模型还能有效检测样品中的掺假,准确率为94.8%。识别过程只需 35 分钟即可完成。SERS指纹识别与1D-CNN建模的集成为识别、认证和追踪农产品提供了强大的解决方案。
编辑:郭梦帅
责任编辑:魏芳
文章引用:https://doi.org/10.1021/acs.analchem.4c00064
文章信息:Xueqing Wang, Fan Li, Lan Wei, Yun Huang, Xiang Wen, Dongmei Wang, Guiguang Cheng, Ruijuan Zhao, Yechun Lin, Hui Yang, and Meikun Fan.Rapid and Precise Differentiation and Authentication of Agricultural Products via Deep Learning-Assisted Multiplex SERS Fingerprinting.[J]Analytical Chemistry 2024 96 (11), 4682-4692.
● 关于我们
中国农业科学院油料作物研究所油料品质化学与营养创新团队脂质分析实验室致力于突破脂质组分析所面临的生物基质复杂、脂质及其代谢产物种类繁多且结构复杂、定性和定量分析困难等共性关键技术瓶颈,建立高效,高通量的脂质组分析平台,并将该平台广泛应用于:(1)不同生物种质资源中脂质组成;(2)应用于食品安全与质量控制;(3)脂质的生物功能与营养学评价;(4)开发新的功能脂质。