【模板】AI + 真实世界数据 + 临床预后因素 = 创新性研究

学术   2024-12-15 06:51   美国  

推广专业学术交流、促进诊疗流程改善


关键词:MG;MC;风险分类;可解释机器学习;数字精准医疗;International Journal of Medical Informatics

以机器学习为代表的人工智能,以快速应用于医学研究,并影响临床诊疗。这个过程中也产生了无数的新课题需求:通过规范严谨的研究来验证自己的科学假说。
很多朋友问:如何利用AI来推动自己的临床科研呢?今天分享一篇文章,您只要有临床数据库,就可以自己做这方面研究。

2024年11月12日,Sivan Bershan 研究者们在杂志 International Journal of Medical Informatics 上发表了题为 Data-driven explainable machine learning for personalized risk classification of myasthenic crisis 的研究论文【2】。本研究旨在探索使用可解释机器学习(ML)模型,通过分析真实世界临床数据,是否能够实现对MG患者MC风险的高精度分类,并为临床决策提供支持。

重症肌无力(MG)是一种由自身抗体介导的罕见慢性自身免疫性疾病,其特征是肌肉疲劳性无力,而肌无力危象(MC)作为MG的一种严重恶化状态,可能因呼吸衰竭而危及生命,需要重症监护和机械通气等侵入性治疗。尽管已知MC的风险因素包括胸腺瘤、肌肉特异性酪氨酸激酶(MuSK)抗体、感染等,但目前尚无法准确预测哪些MG患者会发展为MC,因为疾病严重程度和进展在不同患者间差异显著【1】。


  • 本研究通过使用可解释机器学习(ML)模型和真实世界临床数据,证明了对MG患者进行MC风险分类的可行性和概念验证。

  • 研究表明,使用Lasso回归和随机森林模型可以基于简单的或复合的特征对MG患者进行高风险或低风险的分类。


(如需原文,请加微信healsana获取,备注20241112IJMI

主要研究内容和结果

1. 人口统计学和临床特征

本研究纳入了51名重症肌无力患者,其中13名至少经历过一次肌无力危象,包括9名患者有过一次MC和4名患者经历过两次或以上的MC,其余38名为对照组。MC组的中位年龄为70.5岁,非MC组的中位年龄为65.5岁。在所有患者中,38名为乙酰胆碱受体(AChR)抗体阳性,其余13名为抗体阴性。有1名患者的AChR和肌肉特异性酪氨酸激酶(MuSK)抗体均为阳性,由于缺乏其他对照,该患者被与AChR单阳性患者进行匹配。


2. 机器学习模型性能

在本研究中,Lasso回归模型和随机森林模型被用来区分肌无力危象(MC)和非MC患者群体。Lasso回归模型的平均AUC(Area Under the Curve)为68.8%,标准差为8.1%,而随机森林模型的平均AUC为76.7%,标准差为4%。研究重点在于正确识别MC高风险患者,因此调整了分类阈值以尽量减少假阴性(即错误地将高风险患者分类为低风险)。在Lasso回归模型中,当阈值设为0.1时,35名患者被认定为高风险,其中10名正确分类,但有25个假阳性和3个假阴性;阈值提高到0.3时,13名患者被分类为高风险,其中7名为真阳性,而有6名假阴性;阈值提高到0.8时,50名患者被分类为低风险,只有1名患者被分类为高风险,而有12名MC患者被错误地分类为假阴性。相比之下,随机森林模型在阈值为0.1时,48名患者(94%)被认定为高风险,其中13名正确分类,没有假阴性;阈值提高到0.3时,29名患者(57%)被认定为高风险,其中9名为真阳性,有4名假阴性;阈值提高到0.8时,没有患者被认定为高风险。

总体而言,随机森林模型在控制噪声和AUC结果方面表现更佳,提供了更强的预测性能。


图1. Lasso回归和随机森林预测的独立于阈值的预测结果

图2. Lasso回归模型和随机森林模型的分类结果的混淆矩阵


3. 预测因子重要性和结果稳定性
在本研究中,预测因子的重要性和结果的稳定性在不同患者间有所差异,尤其是在Lasso回归模型中,而随机森林模型的稳定性较高。这表明,为了提高Lasso回归的准确性,需要为每位患者提供更多的特征数据。在多次预测中,有五名实际经历过MC的患者被多次预测为低风险。通过比较Lasso回归模型和随机森林模型,研究发现增加患者数量和每位患者的数据点(特征)可以提高预测准确性,并减少患者在不同运行中切换风险组的情况。Lasso回归中最重要的特征是淋巴细胞的平均趋势和患者在整个住院期间通过医院单位的路径,而随机森林模型中最重要的特征是肌酐测量的相对最小趋势。两个机器学习模型都将肌酐的不同形式识别为分类的高度相关特征,这可能表明多病共存在MC风险分类中可能起到作用。


图3. 根据100次预测的平均系数显示的特征重要性


编者按:

临床意义

本研究通过可解释机器学习模型于真实世界的临床数据,为重症肌无力患者的肌无力危象风险分类提供了一种新的精准医疗方法,它不仅能够辅助医生提前识别高风险患者,从而采取预防性治疗措施,避免危及生命的病情恶化还能通过解释模型预测结果,增强临床决策的透明度和可信度


科研上,

这项工作启发了未来研究应考虑多中心、多国数据收集,纳入更多患者和更丰富的个体化数据点,以及探索基于注意力机制的机器学习模型,以进一步提升预测模型的准确性和泛化能力。

期待更多类似高质量研究,给患者带来更优的临床诊疗策略。

原文链接:

【1】M. Kuhn, K. Johnson. Applied Predictive Modeling. Springer, New York, New York, NY (2013).

【2】https://doi.org/10.1016/j.ijmedinf.2024.105679


作者:Amber Wang,编辑:Jessica,微信号:Healsanq。助理:ChatGPT
“征战重症肌无力”与各位同仁一起,学习重症肌无力的研究进展,探索更优的诊疗策略。欢迎同仁投稿及分享。

点击👇,阅读更多重症肌无力研究解读

运营:美国Healsan咨询公司MG项目组,专注于临床科研及临床试验的服务公司,擅长于针对重症肌无力的临床科研设计及临床试验结果的报告撰写。
网址:https://healsan.com/


Hanson临床科研
美国的七位生物医学科学家主持。通过专家讲座,交流医学课题选题思路及SCI论文撰写规范;通过经典论文解读,分享临床科研技巧和突破性进展;通过大数据分析,解析生物医学发展趋势及行业动态。只提供以数据为基础的客观报告,及专业、独立的思考。
 最新文章