推广专业学术交流、促进诊疗流程改善
重症肌无力(MG)是一种由自身抗体介导的罕见慢性自身免疫性疾病,其特征是肌肉疲劳性无力,而肌无力危象(MC)作为MG的一种严重恶化状态,可能因呼吸衰竭而危及生命,需要重症监护和机械通气等侵入性治疗。尽管已知MC的风险因素包括胸腺瘤、肌肉特异性酪氨酸激酶(MuSK)抗体、感染等,但目前尚无法准确预测哪些MG患者会发展为MC,因为疾病严重程度和进展在不同患者间差异显著【1】。
2024年11月12日,Sivan Bershan 等研究者们在杂志 International Journal of Medical Informatics 上发表了题为 Data-driven explainable machine learning for personalized risk classification of myasthenic crisis 的研究论文【2】。本研究旨在探索使用可解释机器学习(ML)模型,通过分析真实世界临床数据,是否能够实现对MG患者MC风险的高精度分类,并为临床决策提供支持。
本研究通过使用可解释机器学习(ML)模型和真实世界临床数据,证明了对MG患者进行MC风险分类的可行性和概念验证。研究表明,使用Lasso回归和随机森林模型可以基于简单的或复合的特征对MG患者进行高风险或低风险的分类。
本研究纳入了51名重症肌无力患者,其中13名至少经历过一次肌无力危象,包括9名患者有过一次MC和4名患者经历过两次或以上的MC,其余38名为对照组。MC组的中位年龄为70.5岁,非MC组的中位年龄为65.5岁。在所有患者中,38名为乙酰胆碱受体(AChR)抗体阳性,其余13名为抗体阴性。有1名患者的AChR和肌肉特异性酪氨酸激酶(MuSK)抗体均为阳性,由于缺乏其他对照,该患者被与AChR单阳性患者进行匹配。
2. 机器学习模型性能
在本研究中,Lasso回归模型和随机森林模型被用来区分肌无力危象(MC)和非MC患者群体。Lasso回归模型的平均AUC(Area Under the Curve)为68.8%,标准差为8.1%,而随机森林模型的平均AUC为76.7%,标准差为4%。研究重点在于正确识别MC高风险患者,因此调整了分类阈值以尽量减少假阴性(即错误地将高风险患者分类为低风险)。在Lasso回归模型中,当阈值设为0.1时,35名患者被认定为高风险,其中10名正确分类,但有25个假阳性和3个假阴性;阈值提高到0.3时,13名患者被分类为高风险,其中7名为真阳性,而有6名假阴性;阈值提高到0.8时,50名患者被分类为低风险,只有1名患者被分类为高风险,而有12名MC患者被错误地分类为假阴性。相比之下,随机森林模型在阈值为0.1时,48名患者(94%)被认定为高风险,其中13名正确分类,没有假阴性;阈值提高到0.3时,29名患者(57%)被认定为高风险,其中9名为真阳性,有4名假阴性;阈值提高到0.8时,没有患者被认定为高风险。
总体而言,随机森林模型在控制噪声和AUC结果方面表现更佳,提供了更强的预测性能。
原文链接:
【1】M. Kuhn, K. Johnson. Applied Predictive Modeling. Springer, New York, New York, NY (2013).
【2】https://doi.org/10.1016/j.ijmedinf.2024.105679