Blood月读 | 宋志刚主任:从数据到决策,探索儿科ITP慢性化的机器学习预测模型

文摘   2024-12-05 16:10   上海  

Journal of Thrombosis and Haemostasis杂志上发表了一项题为“Machine learning models developed and internally validated for predicting chronicity in pediatric immune thrombocytopenia“1,旨在探索机器学习 (ML) 模型在预测儿童原发性免疫性血小板减少症慢性化的可能性。本文现将主要研究内容整理如下,以飨读者。

研究背景

原发性免疫性血小板减少症(ITP)是一种常见的免疫介导出血性疾病,特征为孤立的血小板减少(外周血血小板计数<100x10^9/L)且无其他潜在原因,增加出血风险。在亚洲,儿童ITP的年发病率约为每10万人8.4-14.3例。虽然大多数儿童ITP表现为自限性,但约20-30%的病例会进展为慢性疾病,影响生活质量。因此,迫切需要可靠的预后指标来指导治疗,减少对糖皮质激素和免疫球蛋白治疗的依赖,从而避免慢性化进展。

ITP的发病机制复杂,通常认为是环境因素在遗传易感性基础上触发,导致血小板抗原暴露、自身抗体产生及CD8+ T细胞介导的血小板快速清除。最近的研究显示,不同的免疫状态可能影响儿童和成人ITP的临床结果。机器学习(ML)室计算机科学和人工智能内的一个学科,它使计算机能够通过输入数据获得知识,从而生成预测或做出决策,已在多个医疗领域显示出预测疾病进展的潜力。本研究旨在开发和验证整合人口统计学和免疫学特征的ML模型,以预测儿童ITP的慢性化,为临床提供更精准的治疗指导。

研究方法

该研究于2018年6月至2021年12月在北京儿童医院进行,旨在建立确定儿童ITP慢性性的预测模型。采用了基于逻辑回归分类器、随机森林分类器、极限梯度增强(XGBoost)和支持向量机的四种机器学习模型。这些模型使用了16个变量,包括14个免疫学预测因子和2个人口统计学预测因子。性能评价标准包括预测准确度、精密度、召回率、F1评分和ROC曲线下面积(AUC)。

研究结果


基线特征

研究参与者的平均年龄为4.08岁(标准差=3.68)。在662名入选患者中,55.7%为男性,44.3%为女性。462名患者被分配到训练数据集,200名患者被分配到测试数据集,两组特征无显著差异。研究发现,发展为慢性ITP的患者(慢性组)平均年龄显著高于一年内达到缓解的患者(非慢性组)(6.82±4.40岁对比3.12±2.79岁,P < 0.001),这表明年龄可能是慢性ITP发展的一个重要因素。慢性组和非慢性组在多种免疫细胞比例上存在差异。此外,慢性组的CD3+ T、CD4+ T、Treg和CD3+CD8-T细胞比例较低,CD4+/CD8+比例也较低(P < 0.05),而CD8+ T、Th1、Th17和TCRαβ+ DNT细胞比例以及Th17/Treg比例相对于非慢性组有所增加(P < 0.05),这些免疫学特征可能和慢性ITP的病理机制有关。


机器学习性能比较和模型选择

本研究使用622名患者的数据集来训练和测试四种ML模型,以预测儿童ITP的慢性化。每种算法的性能展示在图2中,并通过混淆矩阵进行比较。


SPRING


图2

四种ML算法的ROC曲线显示在图3中。XGBoost展示了最高的AUC(0.849),其次是支持向量机(SVM)(0.843)。在准确性、精准度和召回率指标上,随机森林(RF)算法的准确性最高(80.40%),但精确度(73.53%)和召回率(47.60%)适中。逻辑回归(LR)算法的召回率最高(73.21%),但准确性(78.90%)和精确度(60.30%)较低。XGBoost的优越解释性是其相对于其他ML方法的一个优势。由于研究的主要目标是准确和敏感地识别有慢性风险的儿童ITP,研究者选择XGBoost作为首选算法。


SPRING


图3

分析临床变量的贡献和超参数优化

图4展示了XGBoost算法预测中特征的影响,确定了年龄、Th17、Th17/Treg比率、Th1和DNT/CD3+T细胞为五个最重要的特征。通过超参数优化,研究者确定了XGBoost模型中各种参数的最佳值,这些参数的选择有助于提高模型的性能和预测准确性。


SPRING


图4

机器学习模型应用

使用训练数据集构建的XGBoost算法预测儿童ITP慢性化的最终决策树模型包含6个层级、25个节点和13个终端节点(图5)。模型纳入了八个变量:年龄、Th17、Th17/Treg比率、CD3+ T、Treg、TCRγδ+ T、Th1和Th2。初始参数是年龄,第二层评估Th17细胞比例,第三层评估Th17/Treg比率、Treg和TCRγδ+ T细胞。

每个叶节点代表一定比例的患者发展为慢性阶段,发病率从0%到85.7%不等。假设起病年龄超过11岁,且Th17细胞比例20.550%和TCRγδ+ T细胞比例大于或等于20.915%,慢性化率最高(85.7%)。即使在6岁以下的儿童中,如果Th17细胞比例超过9.590%,发展为慢性的风险为80%;若低于9.590%,慢性化风险相对较低。


SPRING


图5

研究结论

这项研究代表了首次尝试利用一系列机器学习算法来预测ITP儿童的预后。开发的机器学习模型作为一种有价值的筛查工具,有助于识别那些更高风险发展到慢性阶段的患者,从而在疾病早期阶段帮助临床决策。这不仅有助于防止由于血小板水平波动引起的出血,还可以最小化药物相关的不良反应,最终提高患者的整体福祉。通过使用XGBoost算法,可以开发具有可接受的预测性能和高准确性的模型,以识别有慢性风险的患者。


研究述评

慢性ITP在儿科患者中虽罕见,但对患者长期健康影响深远,因其对标准治疗的抵抗性较大,常需替代治疗,因此,准确预测疾病慢性化对于实现个性化治疗和预防严重并发症至关重要。机器学习模型可以有效地辅助临床决策,通过早期识别可能发展为慢性病的儿童ITP患者,从而实现个性化的治疗策略。展望未来,这些模型的进一步验证和优化将是必要的,特别是在更广泛的地理和人口统计学背景下的外部验证。此外,这些模型的集成到临床实践中,可能需要开发更为用户友好的界面和系统,以确保它们可以被广泛且有效地使用。最终,这种技术的应用有望改善儿童ITP患者的管理和治疗结果,减少慢性病的发生率,并优化治疗资源的分配。


宋志刚 主任


海军安庆医院血液科行政副主任   副主任医师

安庆市血液学分会副主委

安徽省全科医学会血液分会委员

安徽省医学会血液分会委员

安徽省老年血液学会委员 

安徽省淋巴瘤专科联盟委员

安徽省浆细胞疾病专科联盟委员  


参考文献:

Ma J, Cui C, Tang Y, Hu Y, Dong S, Zhang J, Xie X, Meng J, Wang Z, Zhang W, Chen Z, Wu R. Machine learning models developed and internally validated for predicting chronicity in pediatric immune thrombocytopenia. J Thromb Haemost. 2024 Apr;22(4):1167-1178. doi: 10.1016/j.jtha.2023.12.006. Epub 2023 Dec 15. PMID: 38103736.

本文仅代表专家个人观点

智惠学苑
医疗专业人士在线学术交流平台,传递最新ITP(原发免疫性血小板减少症)、血液肿瘤、实体瘤等医学研究进展,分享前沿资讯。
 最新文章