【一百六十二篇】SERS指纹图谱结合机器学习分析用于快速鉴定结核分枝杆菌感染和耐药性

文摘   健康   2024-07-20 02:00   江苏  

深度学习辣汤小组文献阅读学习之一百六十二篇

 2024/4/19 

DeepLearning 深度学习辣汤小组

SERS指纹图谱结合机器学习分析用于快速鉴定结核分枝杆菌感染和耐药性

Abstract

2022年,来自广东省人民医院检验科的Wang, Liang等人使用监督式深度学习算法来分析手持式拉曼光谱仪生成的不同结核分枝杆菌(Mtb)光谱,很好地区分肺内和肺外结核以及具有不同耐药谱的 Mtb 菌株,并在期刊Comput Struct Biotechnol J(IF=5.99,一区)上发表题为“Machine learning analysis of SERS fingerprinting for the rapid determination of Mycobacterium tuberculosis infection and drug resistance”的文章。

DOI

https://doi.org/10.1016/j.csbj.2022.09.031


左右滑动查看文章



一、研究背景



黑色素瘤是由异常黑色素细胞过度增殖引起的高转移、高复发的恶性肿瘤。它常见于皮肤和粘膜,也可能发生在非皮肤区域,如眼睛、胃肠道和鼻咽部。据报道,在过去十年中,每年的黑色素瘤病例增加了近50%。据统计,约50%的黑色素瘤存在BRAF基因突变,其中以V600E突变最为常见,占85%以上。黑色素瘤对常规化疗不敏感,用靶向抑制剂治疗是有效的。Vemurafenib (Vem)是一种高效的BRAF激酶抑制剂,对BRAFV600E具有高特异性。然而,大多数患者在使用Vem约6个月后出现明显的耐药性,导致黑色素瘤复发和转移。药物治疗引起的黑色素瘤细胞耐药已成为治疗黑色素瘤的一个难题。

到目前为止,鉴定结核分枝杆菌感染的技术,包括分子方法、免疫学检测、直接培养等方法要么检测精度不够,要么检测周期长,迫切需要新的方法和技术进步,以实现更快速,更便宜,更准确的结果,击败这种高度传染性疾病。本研究中,该团队使用手持式拉曼光谱仪检测所有Mtb菌株和临床痰样本并生成SERS光谱,然后使用多种机器学习算法进行分析。



二、数据集



本研究收集了4份涂阳和4份涂阴的痰样本,136株Mtb菌株。其中,47株对利福平(RFP, R)-和异烟肼(INH, H)敏感(R-,H-),9株对RFP敏感(R+,H-),20株对RFP敏感(R-,H+),47株对RFP-和INH耐药(R+,H+)。肺外结核分析纳入了11株Mtb菌株(RFP+,INH+)。结核分枝杆菌阴性和结核分枝杆菌阳性痰样本均从徐州医科大学附属传染病医院收集,并通过涂片显微镜检查确认。所有结核分枝杆菌均从结核患者处理后的肺(痰液和支气管肺泡灌洗液)和肺外(尿、脓、腹膜积水)标本中分离得到,然后在徐州医科大学附属传染病医院医学实验室进行培养。



三、研究方法



SERS光谱经过归一化、平滑和去噪后,采用CNN(卷积神经网络)、GRU(门递归单元)、LSTM(长短期记忆)和MLP(多层感知器)四种深度学习算法模型,以及随机森林(RF)和支持向量机(SVM)两种经典机器学习算法对SERS谱进行计算分析。在机器学习分析过程中,将光谱数据按6:2:2的比例分为训练集、验证集和测试集。从三个方面分析SERS谱数据:1)痰液阳性和痰液阴性样本;2)肺和肺外结核分枝杆菌菌株;3)耐药和药敏结核分枝杆菌菌株。实验流程如图1所示,使用Accuracy、Precision、Recall、ROC曲线和F1-score等指标评价模型性能,此外,还绘制CNN深度学习算法分类的混淆矩阵。



四、结果与结论



在临床实验室中,痰是最常见的一种用于诊断肺部结核分枝杆菌感染的标本。如图2,将8个临床痰样本分成Mtb-positive组(n = 4)和Mtb-negative组(n = 4),每个样本测30个SERS光谱,然后组合在一起来计算平均SERS频谱。平均SERS谱图(图2B)显示,误差谱带较细(灰色),重现性较高,说明手持式拉曼光谱仪在临床样品检测中具有较好的适用性。六种监督机器学习算法在痰样本SERS谱分析中的能力见表1,所有的深度学习算法(ACCCNN = 95.67%, ACCMLP = 91.92%, ACCMLP = 91.92%,ACCLSTM = 94.25%, ACCGRU = 93.75%)的预测准确率优于经典机器学习算法(ACCSVM = 87.50%, ACCRF = 89.58%),其中CNN的预测准确率最高,达到95.67%。

本研究中利用SERS技术在计算方法的帮助下区分肺和肺外结核分枝杆菌菌株。其中肺结核分枝杆菌47株(R+/H +),肺外结核分枝杆菌11株(R+/H +)。每株结核分枝杆菌共采集了30个光谱,其中肺结核分枝杆菌1441个光谱,肺外结核分枝杆菌330个光谱。共有六种监督机器学习算法在区分肺和肺外结核菌株的SERS谱方面的能力,在五重交叉验证中,深度学习算法CNN表现最好,准确率为99.86%。绘制ROC曲线,并计算ROC曲线下面积(auc)(图3C)。结果表明,所有深度学习算法的性能都优于经典机器学习算法。此外,CNN模型还存在混淆矩阵,根据混淆矩阵,可以以100%的准确率正确预测肺和肺外的Mtb菌株(图3D)。

通过SERS分析共筛选出4组不同耐药谱的Mtb菌株,分别为R+/H+ (n = 47)、R+/H - (n = 9)、R-/H+ (n = 20)和R-/H- (n = 47)。其中,n表示样品数,每个样品共测量了30个光谱(图4A)。为了根据结核分枝杆菌菌株的抗生素耐药谱进行区分,通过有监督机器学习算法进行了进一步的计算分析,结果表明,所有测试的算法都可以准确预测不同类型的结核分枝杆菌菌株的抗生素耐药性(表2)。此外,CNN以最高的预测准确度(ACC = 99.59%)在所有其他算法中名列前茅,此外,根据图4C所示的ROC曲线和相应的auc,可以发现所有机器学习算法的性能都可以达到非常高的值。从CNN模型的混淆矩阵来看,四种Mtb菌株均能正确预测,准确率在99%及以上(图4D)。

本研究首次将SERS技术与机器学习算法相结合,对Mtb检测进行了系统研究,不仅成功地区分了临床痰样本中是否含有Mtb细胞,而且准确预测了不同感染部位和不同抗生素耐药谱的Mtb菌株。因此,研究支持手持式拉曼光谱仪在实际环境中具有很高的应用潜力,可以快速诊断结核分枝杆菌感染。




图1:基于sers诊断结核分枝杆菌菌株和临床痰样的示意图


图2:8个临床痰样本(Mtb-positive组和Mtb-negative组)的机器学习分析结果


表1:比较6种机器学习算法在分析痰液阳性和阴性样本产生的SERS光谱数据方面的能力


图3:肺(n = 47)和肺外(n = 11)结核分枝杆菌菌株的实验和计算分析


表2:比较六种机器学习算法在分析四组不同耐药Mtb菌株SERS谱数据方面的能力


图4:四组耐药与药敏结核分枝杆菌的实验与计算分析



Pepper soup transformed by: Yang Na



  //  

深度学习辣汤AI小组由徐州医科大学以及徐州医科大学附属医院一群热爱人工智能的小伙伴们组成,欢迎大家跟我们交流学习!

扫码关注我们

欢迎加入我们!

成员微信号:cy2011mcu

添加好友时请备注:

您的 单位-科室-姓名-研究方向



深度学习辣汤小组
AI学习日志,阅读相关文献,分享学习感悟,交流学习技巧,记录自我成长!
 最新文章