使用表面增强拉曼光谱结合偏最小二乘回归和人工神经网络对大肠杆菌、金黄色葡萄球菌和鼠伤寒沙门氏菌进行同时定量分析

文摘   健康   2024-07-21 00:00   江苏  

深度学习辣汤小组文献阅读学习之一百五十八篇

 2024/2/22 

DeepLearning 深度学习辣汤小组

Abstract

2023年,来自天津中医药大学的Haixia Wang等人,提出了一种结合偏最小二乘回归 (PLSR) 和人工神经网络 (ANN) 的无标记拉曼光谱技术,用于同时对大肠杆菌、金黄色葡萄球菌和鼠伤寒沙门氏菌进行定量分析,并在期刊SPECTROCHIM ACTA A(IF:4.3,化学2区)上发表题为“Simultaneous quantitative analysis of Escherichia coli, Staphylococcus aureus and Salmonella typhimurium using surface-enhanced Raman spectroscopy coupled with partial least squares regression and artificial neural networks”的文章。

DOI

https://doi.org/10.1016/j.saa.2023.122510


左右滑动查看文章




一、研究背景



细菌污染是全球日益严重的公共卫生威胁。大多数传染病是由食源性病原体引起的,如大肠杆菌(E. coli)、金黄色葡萄球菌(S. aureus)、鼠伤寒沙门氏菌(S. typhimurium)等。开发快速、准确、低成本的方法检测这些致病菌是临床和食品药品质量控制的迫切需要。经典的细胞计数法灵敏度高,被广泛用于病原菌的检测,但其富集、电镀、鉴定和确认等操作需要的时间长,往往需要数天才能完成。目前,基于不同光学技术的智能传感方法在病原菌的快速检测中受到广泛关注,如荧光法、比色法等。在这些检测技术中,表面增强拉曼光谱(SERS)方法因其高灵敏度和便携性在快速准确检测病原菌方面更受欢迎。

机器学习(ML)作为实现人工智能的最具创新性的技术之一,由于其在拉曼数据分析和处理方面的巨大潜力,已被用于多种细菌的鉴定和检测。因此,本研究提出了一种结合偏最小二乘回归(PLSR,partial least squares regression)和人工神经网络(ANN,artificial neural networks)算法的SERS方法,用于同时定量分析混合样品中的三种致病菌。



二、数据集



本研究使用的大肠杆菌(E. coli, 10372)、金黄色葡萄球菌(S. aureus, 10473)和鼠伤寒沙门氏菌(S. typhimurium, 21483)均来源于中国工业文化收藏中心。采用常规平板计数法测定3种致病菌浓度,控制在5 × 107 CFU/mL。

除制备上述单菌样品外,还制备了金黄色葡萄球菌、大肠杆菌和鼠伤寒沙门氏菌不同比例组成的66种混合细菌样品。各组混合菌样总量维持在1 mL,终菌浓度维持在5 × 107 CFU/mL。细菌初始浓度和终菌浓度维持在5 × 107 CFU/mL。将细菌与Au@Ag@SiO2纳米复合材料溶液(1:1)混合,用于拉曼光谱采集,随机采集3种细菌混合样品的50个拉曼光谱,获得3300个光谱(50 × 66 = 3300)用于分析。随机抽取80%用于训练集,剩余作为训练集。



三、研究方法



如图1 (A)所示,直接在金箔基片表面的细菌和Au@Ag@SiO2纳米颗粒复合材料上获得三种细菌和混合细菌的SERS光谱,众所周知,拉曼位移是单个分子独有的,因此不同的拉曼光谱信号对应不同的分子结构,光谱特征代表了与细菌大分子含量相关的生化特征,如730cm-1处的峰来自嘌呤和嘧啶代谢物,但有些特征峰是单个细菌特有的,如大肠杆菌的1693 cm-1和1130 cm-1的特征峰,以及鼠伤寒沙门氏菌的790 cm-1的特征峰,有利于在混合样品中进行准确分析。利用金黄色葡萄球菌对SERS平台的重现性进行评价。Au@Ag@SiO2-S的15个随机SERS谱。在金箔衬底上测量的金黄色络合物如图2 (B)所示。在730 cm-1峰处的相对标准偏差(RSD)值为6.557%,表明SERS平台具有较高的再现性和良好的信号活性。

PLSR模型定量分析的光谱处理流程图如图2A所示,采用Row Center (RC)、Savitzky-Golay (SG)、Standard Normal Variate (SNV)、multiplative Scatter Correction (MSC)和First Deviation (1stD) 5种预处理方法和7重交叉验证,对PLSR建模方法进行最优、有效的验证,分别建立金黄色葡萄球菌、大肠杆菌和鼠伤寒沙门氏菌浓度的稳健PLSR预测模型,使用指标RMSEC、RMSEP、R2 c和R2 p评价模型性能。

同时,建立了一种前馈人工神经网络模型,将SERS光谱映射为三种致病菌的比例,其中校准集与PLSR模型相同。使用贝叶斯先验优化进行超参数调优,因为它可以减少人工神经网络模型的试验次数和时间。



四、结果与结论



本研究中,将细菌与Au@Ag@SiO2纳米颗粒结合形成的复合物,提高了细菌的拉曼强度。在PLSR模型中,为了减少不相关信息,提高计算速度,采用了投影变量重要度(VIP)、连续投影算法(SPA)和竞争自适应重加权采样(CARS)三种不同的算法对波段进行特征选择,如表1所示,采用CARS波段筛选法获得了较好的大肠杆菌和鼠伤寒沙门氏菌PLSR预测模型。大肠杆菌预测集的相关系数R2 p为0.8825,RMSEP为0.0951,鼠伤寒沙门氏菌预测集的相关系数R2 p为0.9087,RMSEP为0.0834。但对于金黄色葡萄球菌,使用三种波段筛选方法的SERS-PLSR模型的性能一般,三种细菌的最佳PLSR预测模型如图2B所示。

选择正确的超参数(即隐藏层、学习率、激活函数等)对于深度学习来说是非常重要的,表2概述了要调优的超参数及其各自的值范围。为了研究超参数对人工神经网络模型中RMSEP值的影响,绘制了隐藏层和学习率对节点数和时代数的三张热图,旨在为每种细菌找到最优的超参数(原文图4)。色度越深,人工神经网络模型的RMSE值越小,预测的准确性越好。结果表明,与SERS-PLSR模型相比,人工神经网络模型具有较低的均方根误差值和较高的相关系数值, 说明人工智能算法具有抗干扰和非线性对话的能力,能够很好地处理复杂的拉曼光谱信息,构建鲁棒且敏感的预测模型。

综上所述,本文方法为混合致病菌的分析提供了一个新的、有效的通用平台。在未来,它可以扩展到同时分析多种复杂的食源性病原体,甚至病毒或真菌样品。




图1:三种细菌的拉曼光谱



图2:定量分析PLSR模型的光谱处理流程图(A),三种细菌的最佳PLSR预测模型(B)



表1:不同波段筛选方法下PLSR预测模型的性能评价



表2:三种细菌人工神经网络模型的超参数范围及优化值




Pepper soup transformed by: Yang Na



  //  

深度学习辣汤AI小组由徐州医科大学以及徐州医科大学附属医院一群热爱人工智能的小伙伴们组成,欢迎大家跟我们交流学习!

扫码关注我们

欢迎加入我们!

成员微信号:cy2011mcu

添加好友时请备注:

您的 单位-科室-姓名-研究方向

深度学习辣汤小组
AI学习日志,阅读相关文献,分享学习感悟,交流学习技巧,记录自我成长!
 最新文章