Hey!朋友们,诺奖的东风——机器学习的红利你吃上了吗?喂到嘴里的东西大家一定要抓住机会啊!今天阿星就雪中送炭,再为大家来一篇机器学习相关的文章~
话不多说,321直接上文章!
2024年11月4日,香港中文大学于君教授、黄炜燊教授、加州大学圣地亚哥分校的Rohit Loomba教授以及温州医科大学第一附属医院郑明华教授等人在Cell大子刊《Cell Metabolism》上发表了题为:A blood-based biomarker panel for non-invasive diagnosis of metabolic dysfunction-associated steatohepatitis 的研究论文。
于君,教授、博士研究生导师,香港科学院院士、欧洲科学院外籍院士。长期致力于消化系统肿瘤机制和防治研究,尤其是消化道肿瘤分子机制、肿瘤基因组学、肠道微生态和肿瘤、肿瘤分子标志物鉴定、肿瘤基因治疗和抗肿瘤药物开发等研究。先后承担国内外科研项目80余项,已发表SCI研究论文500余篇,影响因子30以上100余篇。
今天分享的这篇文章通过结合多种生物标志物和临床变量,开发了一个非侵入性的、高精度的诊断工具,用于识别和监测MASH患者,旨在减少对肝脏活检的依赖,并改善患者的临床管理;结合机器学习技术,如随机森林、支持向量机(SVM)和逻辑回归,提高了生物标志物选择和模型建立的精确性和有效性;开发的N3-MASH模型不仅在香港的发现队列中得到验证,还在美国和中国的独立队列中进行了验证,这种跨地区、跨种族的广泛验证增强了模型的普适性和可靠性。希望这篇文章对各位医生的科研思路能提供一个新的见解!(ps:仰望了大佬的科研成果,下来还是要脚踢实地的搞好自己的课题,今年你的文章发了吗?单位定的KPI完成了吗?科研路上有困难,可以呼叫你的得力帮手—阿星,生信星团队可提供思路设计、生信分析、课题设计和标书评估、修改服务,有需要的朋友欢迎联系!)
定制生信分析
云服务器租赁
(加微信备注99领取试用)
题目:用于代谢功能障碍相关脂肪性肝炎无创诊断的血液生物标志物组
发表时间:2024年11月
公众号回复“888”领取原文PDF,文献编号:241106
研究背景
非酒精性脂肪性肝病(NAFLD)及其严重形式代谢功能障碍相关性脂肪性肝炎(MASH)在全球范围内影响着25%至30%的人口,是慢性肝病的最常见原因。MASH的诊断依赖于肝脏活检,但由于其侵入性、成本高和观察者间变异性,限制了其在常规临床实践中的应用。因此,迫切需要开发具有高敏感性和特异性的非侵入性诊断方法,以减少对肝脏活检的依赖,并分层需要后续治疗的患者。
研究设计
(1)生物标志物组的建立与优化:首先建立了一个包含7个生物标志物的小组(N7-MASH),其中包括3个血清蛋白(CXCL10、CK-18和SQLE)、3个血液生化测试变量(糖化血红蛋白[HbA1c]、丙氨酸氨基转移酶[ALT]和天门冬氨酸氨基转移酶[AST])以及1个人体测量参数(种族特异性调整后的体重指数[BMI]);通过逻辑回归和随机森林分析,研究者们从23个协变量中筛选出最有影响力的生物标志物,建立了N7-MASH模型,并进一步优化为包含3个参数的N3-MASH模型(CK-18、CXCL10和BMI),以提高临床实用性。
(2)非侵入性诊断模型的开发:利用支持向量机(SVM)和逻辑回归算法,结合10折交叉验证,开发了用于诊断代谢功能障碍相关脂肪肝病(MASLD)和MASH的非侵入性诊断模型;
(3)独立队列的验证:在香港、圣地亚哥和温州的独立队列中验证了N3-MASH模型的诊断性能,确保了模型的普适性和可靠性;
(4)统计分析与模型评估:
① 使用接收者操作特征曲线(AUROC)分析评估生物标志物小组的诊断性能,包括敏感性、特异性、阳性预测值(PPV)和阴性预测值(NPV);
② 通过Mann-Whitney U检验、Kruskal-Wallis检验和Dunn检验来确定蛋白水平或临床变量的差异;
③ 使用Spearman相关系数来估计生物标志物与感兴趣因素之间的关联,同时使用多重回归分析来确定独立因素与生物标志物组的关联。
(5)临床应用:考虑了N3-MASH在实际临床应用中的潜力,包括其在不同种族群体中的适用性、与当前临床测试方法的兼容性,以及其在MASH诊断中的具体性;
(6)长期监测和治疗反应评估:评估了N3-MASH在监测MASH随时间改善的能力,这对于评估治疗效果具有重要意义。
研究主要结果
1.N3-MASH在发现和验证队列中诊断MASLD的性能
结果显示,N3-MASH在发现队列中区分MASLD患者和健康对照组的AUROC为0.954,表现出非常高的诊断准确性;且具有94.4%的特异性和83.9%的敏感性,表明该模型能够有效地区分MASLD患者和健康对照组。通过逻辑回归分析,确定了N3-MASH的截断值为0.720,有助于在临床实践中应用N3-MASH进行诊断。
在美国的独立验证队列中,N3-MASH维持了高的诊断准确性,AUROC为0.946,进一步证实了N3-MASH模型的稳健性和普适性。N3-MASH在不同种族和地区的验证队列中均显示出相似的高AUROC值,表明该模型在不同人群中具有一致的诊断性能。N3-MASH的性能优于单一生物标志物CK-18和CXCL10,表明多生物标志物小组在提高诊断准确性方面的优势。
2.N3-MASH在发现队列中诊断MASH的性能
结果显示AUROC值为0.823至0.828,表明N3-MASH在诊断MASH方面具有较高的准确性。在发现队列中,N3-MASH在MASH诊断中展现了90.0%的特异性和62.9%的敏感性,为其在临床应用中提供了重要的参考值。
确定了N3-MASH用于MASH诊断的上截断值为0.664和下截断值为0.373,使用N3-MASH的上截断值0.664,可以得到88.6%的PPV,意味着使用N3-MASH测试为阳性的患者有很高的概率实际患有MASH;使用N3-MASH的下截断值0.373,可以得到80.6%的NPV,意味着使用N3-MASH测试为阴性的患者有很高的概率不患有MASH。33%的患者N3-MASH值处于不确定区域(0.373–0.664),意味着N3-MASH的诊断结果在67%的患者中是临床可应用的。
3.在三个独立队列中验证N3-MASH对MASH的诊断效能
与发现队列一致,验证队列中,N3-MASH区分MASH和MASL患者方面的诊断性能得到维持,使用逻辑回归分析,圣地亚哥队列的AUROC为0.802,,温州队列的AUROC为0.805,香港队列的AUROC为0.823。使用SVM证实了N3-MASH在MASH诊断中的表现。当将所有验证队列的数据汇总时,N3-MASH的AUROC值在使用逻辑回归时为0.807,在使用SVM时为0.808,进一步证实了N3-MASH在MASH诊断中的稳健性能。
在汇总的验证队列中,N3-MASH在高截断值(0.664)时具有79.7%的特异性和64.4%的敏感性,以在低截断值(0.373)时具有87.9%的敏感性和47.5%的特异性。在高截断值时,N3-MASH具有90.7%的阳性预测值(PPV),在低截断值时具有56.0%的阴性预测值(NPV),有25.5%的患者N3-MASH值处于不确定区域(0.373–0.664),表明对于这部分患者,N3-MASH的诊断结果可能需要进一步的确认。
4.N3-MASH在评估MASH随时间变化方面的性能
为了评估N3-MASH随着时间的推移评估MASH的能力,分析了MASH患者的血清样本,这些患者在初次活检后至少6个月进行了第二次肝活检。结果显示,随着时间的推移,组织学有所改善的MASH患者的N3-MASH指数显着下降,N3-MASH可以识别MASH的改善,AUROC为0.857。表明N3-MASH在区分MASH改善和未改善的患者方面具有很高的准确性。
文章小结
(1)开发了一个包含CXCL10、CK-18和调整BMI的N3-MASH多生物标志物组,用于非侵入性诊断MASH;
(2)N3-MASH不仅能用于MASH的诊断,还能监测MASH的改善情况,这对于评估治疗效果和管理患者具有重要意义;
(3)通过从N7-MASH优化到N3-MASH,展示了如何通过减少生物标志物数量来提高模型的临床实用性,同时保持诊断性能。
机器学习扛大旗发文是真的豪横呀,0实验纯生信就是要这么做,朋友们好好学学吧!想趁着诺奖这波东风,在机器学习上吃一波红利,就得赶紧动手了!头脑风暴时候,但思路卡壳?没关系,你来提供idea,我提供优质服务,主打就是一个满意!感兴趣的伙伴速速联系阿星吧!
阿星有话说
生信星持续为大家带来最新生信思路,更多创新性分析思路请点击下方链接。想复现这种思路或者定制更多创新性思路欢迎直接call阿星,生信星团队竭诚为您的科研助力!
往期精选