推广专业学术交流、促进诊疗流程改善
重症肌无力(MG)是一种由自身抗体介导的罕见慢性自身免疫性疾病,其特征是肌肉疲劳性无力,而肌无力危象(MC)作为MG的一种严重恶化状态,可能因呼吸衰竭而危及生命,需要重症监护和机械通气等侵入性治疗。尽管已知MC的风险因素包括胸腺瘤、肌肉特异性酪氨酸激酶(MuSK)抗体、感染等,但目前尚无法准确预测哪些MG患者会发展为MC,因为疾病严重程度和进展在不同患者间差异显著【1】。
本研究通过使用可解释机器学习(ML)模型和真实世界临床数据,证明了对MG患者进行MC风险分类的可行性和概念验证。
研究表明,使用Lasso回归和随机森林模型可以基于简单的或复合的特征对MG患者进行高风险或低风险的分类。
本研究纳入了51名重症肌无力患者,其中13名至少经历过一次肌无力危象,包括9名患者有过一次MC和4名患者经历过两次或以上的MC,其余38名为对照组。MC组的中位年龄为70.5岁,非MC组的中位年龄为65.5岁。在所有患者中,38名为乙酰胆碱受体(AChR)抗体阳性,其余13名为抗体阴性。有1名患者的AChR和肌肉特异性酪氨酸激酶(MuSK)抗体均为阳性,由于缺乏其他对照,该患者被与AChR单阳性患者进行匹配。
2. 机器学习模型性能
在本研究中,Lasso回归模型和随机森林模型被用来区分肌无力危象(MC)和非MC患者群体。Lasso回归模型的平均AUC(Area Under the Curve)为68.8%,标准差为8.1%,而随机森林模型的平均AUC为76.7%,标准差为4%。研究重点在于正确识别MC高风险患者,因此调整了分类阈值以尽量减少假阴性(即错误地将高风险患者分类为低风险)。在Lasso回归模型中,当阈值设为0.1时,35名患者被认定为高风险,其中10名正确分类,但有25个假阳性和3个假阴性;阈值提高到0.3时,13名患者被分类为高风险,其中7名为真阳性,而有6名假阴性;阈值提高到0.8时,50名患者被分类为低风险,只有1名患者被分类为高风险,而有12名MC患者被错误地分类为假阴性。相比之下,随机森林模型在阈值为0.1时,48名患者(94%)被认定为高风险,其中13名正确分类,没有假阴性;阈值提高到0.3时,29名患者(57%)被认定为高风险,其中9名为真阳性,有4名假阴性;阈值提高到0.8时,没有患者被认定为高风险。
总体而言,随机森林模型在控制噪声和AUC结果方面表现更佳,提供了更强的预测性能。
编者按:
临床意义:
本研究通过可解释机器学习模型于真实世界的临床数据,为重症肌无力患者的肌无力危象风险分类提供了一种新的精准医疗方法,它不仅能够辅助医生提前识别高风险患者,从而采取预防性治疗措施,避免危及生命的病情恶化,还能通过解释模型预测结果,增强临床决策的透明度和可信度。
科研上,
这项工作启发了未来研究应考虑多中心、多国数据收集,纳入更多患者和更丰富的个体化数据点,以及探索基于注意力机制的机器学习模型,以进一步提升预测模型的准确性和泛化能力。
原文链接:
【1】M. Kuhn, K. Johnson. Applied Predictive Modeling. Springer, New York, New York, NY (2013).
【2】https://doi.org/10.1016/j.ijmedinf.2024.105679