本次给大家带来的解读是发表在LANCET子刊 《eClinicalMedicine》IF=9.6 上的一篇文章《Development and validation of a machine learning-based model to predict survival in patients with cirrhosis after transjugular intrahepatic portosystemic shunt》本研究旨在开发并验证一种基于机器学习 (ML) 的模型,以预测肝硬化患者经颈静脉肝内门体分流术 (TIPS) 后的生存率。
01背景介绍
经颈静脉肝内门体分流术 (TIPS) 是一种用于缓解门静脉高压及其并发症(如静脉曲张出血和难治性腹水)的微创手术方法。然而,并非所有患者都能从 TIPS 手术中获得生存益处,因此精确地识别适合进行该手术的患者非常重要。已开发了多种风险评分系统,如 Child-Turcotte-Pugh (CTP) 评分、终末期肝病模型 (MELD) 评分、钠 MELD 评分 (MELD-Na)、白蛋白-胆红素 (ALBI) 评分和弗赖堡 TIPS 后生存指数 (FIPS),旨在预测 TIPS 手术后的生存率。然而,这些传统的评分系统存在一些局限性,例如对主观参数的依赖、对非线性关系的捕捉能力有限,以及不能充分利用高维数据。机器学习 (ML) 算法,由于其强大的数据处理能力,以及对非线性关系和高维度数据的处理能力,在预测医学事件中显示出巨大的应用潜力。本研究旨在利用机器学习方法,特别是随机森林 (RF) 算法,结合血氨 (Amm) 因素,来构建一个更准确地预测 TIPS 手术后肝硬化患者生存率的模型,并与传统的评分系统进行比较。
02研究方法
研究人群: 这项回顾性队列研究纳入了 2014 年 1 月至 2020 年 8 月在南京鼓楼医院接受 TIPS 手术的 771 例连续性肝硬化患者。其中 101 例患者因不符合纳入标准被排除,194 例患者因基线血氨水平缺失、既往 TIPS 手术史、肝细胞癌或肝外恶性肿瘤病史、以及 1 年内失访而被排除。最终共纳入 400 例患者,用于 ML 模型的构建和分析。为了验证模型的泛化性,研究人员还纳入了来自温州医科大学附属第一医院和福建医科大学孟超肝胆医院的 346 例患者作为外部验证队列。这两个外部队列的数据收集时间为 2016 年 1 月至 2022 年 6 月。所有患者都获得了知情同意,并且研究符合机构审查委员会的指南。
数据收集: 研究人员从患者的电子病历中提取了基线临床信息和实验室数据,包括:年龄、性别、肝硬化病因、TIPS 手术指征、腹水(无、轻-中度和重度)、血钠 (Na)、血氨 (Amm)、总胆红素 (Tb)、白蛋白 (Alb)、肌酐 (Cr)、国际标准化比率 (INR) 以及 CTP、MELD、MELD-Na、ALBI 和 FIPS 评分。所有评分均在 TIPS 手术前 72 小时内获得。使用血钠与正常值上限 (Amm-ULN) 之比。所有患者均需在 TIPS 手术后 1、3、6 和 12 个月进行门诊随访,或按需随访。肝移植患者的随访在移植之日终止。主要临床结局是 TIPS 手术后 1 年的无移植生存率。
03分析方法
数据准备: 研究人员将 400 例患者随机分为训练集 (n = 280) 和测试集 (n = 120),比例为 7:3。使用训练集来构建和优化机器学习模型,而测试集用于内部验证。外部验证队列 (n = 346) 用于外部验证。
特征选择: 研究人员采用了 LASSO 回归作为特征选择步骤,以评估多个变量对生存率的相对重要性。LASSO 回归是一种正则化方法,通过收缩系数将不重要的变量排除在模型之外,它通过最小化目标变量和预测变量之间的偏差,同时惩罚非零系数的总和来进行特征选择。在本研究中,使用交叉验证 (10 折) 来确定最佳 lambda 值,以便选择与生存率密切相关的特征。选取的指标是基于之前文献中对预测TIPS术后患者生存率有显著影响的指标。选取 Na、Amm、Tb、Alb、年龄、Cr 和 ascites 作为预测指标。(图 2)
模型构建: 使用随机森林 (RF) 算法构建预测模型。RF 是一种集成学习方法,结合了多个决策树的预测结果,从而提高了模型的预测精度和稳健性。RF 模型中,每个决策树都基于随机采样的特征子集和训练样本进行训练。为了优化模型的超参数,使用 10 折交叉验证方法进行参数调整,调整参数包括树的数量、最大树深度和拆分节点所需的最小样本数。内部验证集用于评估模型的性能。(表 2)
模型评估:
区分度: 通过受试者工作特征曲线下面积 (AUC) 来评估模型的区分能力,AUC 越高,模型预测能力越好。
校准度: 使用校准曲线来评估模型预测概率的准确性。理想的校准曲线应接近对角线。
性能指标: 计算准确率 (accuracy)、精确率 (precision)、召回率 (recall) 和 F1 分数来评估模型的预测性能。
与其他评分系统进行比较:使用 Delong 检验比较 RF 模型与其他评分系统 (CTP、MELD、MELD-Na、ALBI 和 FIPS) 之间的 AUC 值,以评估 RF 模型的性能。(图 4A, 4B)
生存分析: 使用 Kaplan-Meier 曲线和对数秩检验来分析基于最佳切值的参数和不同风险组患者的生存率。(图 3)
统计分析: 使用 R 语言进行所有统计分析。正态分布数据用平均值 ± 标准差表示,非正态分布数据用中位数和四分位距表示。使用 Kolmogorov-Smirnov 检验评估数据的正态性。使用 t 检验或 Mann-Whitney U 检验比较连续变量的差异,使用卡方检验比较分类变量。设置 p < 0.05 为具有统计学意义。
04结果
患者特征:本研究共纳入了 400 例患者,其中男性 240 例 (60%),中位年龄为 59 岁(四分位数范围:50-66 岁)。最常见的肝硬化病因是病毒性肝炎 (46.0%)。373 例 (93.3%) 患者 TIPS 指征为静脉曲张出血二级预防,27 例 (6.8%) 为难治性腹水,同时 35 例(8.8%)为两者的混合指征。有 79 (19.8%) 例患者存在门静脉血栓,249 (62.3%) 例患者存在中重度腹水。(表 1)
根据 1 年生存情况,患者被分为生存组 (n = 346) 和死亡组 (n = 46)。与生存组相比,死亡组的患者年龄更大,血钠水平更低,血氨更高,总胆红素水平更高,白蛋白水平更低,肌酐值更高,且 CTP、MELD、MELD-Na、ALBI 和 FIPS 等评分也显著更高。(表 1)
LASSO 回归结果: LASSO 回归筛选出七个与 TIPS 后生存率相关的特征:血钠 (Na)、血氨 (Amm)、总胆红素 (Tb)、白蛋白 (Alb)、年龄、肌酐 (Cr) 和腹水。这些变量将被用于构建最终的 RF 模型。(图 2)
随机森林模型的性能: RF 模型在预测 1 年移植前生存率方面优于其他传统评分系统。测试集中,RF 模型的准确率为 0.84 (95% CI: 0.76, 0.91),精确率为 0.84 (95% CI: 0.77, 0.91),召回率为 0.99 (95% CI: 0.95, 1.00),F1 分数为 0.91 (95% CI: 0.81, 0.10)。在外部验证队列中,RF 模型的准确率为 0.88 (95% CI: 0.84, 0.91),精确率为 0.89 (95% CI: 0.85, 0.92),召回率为 0.99 (95% CI: 0.97, 1.00),F1 分数为 0.93 (95% CI: 0.85, 0.97)。(图 4A, 4B) RF 模型的校准曲线在测试集中的斜率为 0.875,截距为 0.446,外部验证集中的斜率为 0.778,截距为 -0.449,表明其具有良好的校准性能。(图 4C, 4D)
内部测试集 AUC: 0.82,外部验证集 AUC:0.70。
SHAP 值分析: 随机森林算法选定的 7 个特征中,Na,Amm,Tb,Alb,年龄,Cr 和 ascites 在训练组中均有显著影响,其中 Amm 的贡献排名第二。(图 3A)
截断点: Na 的最佳截断点是 136.25 mmol/L,Amm-ULN 的最佳截断点是 1.85,Tb 的最佳截断点是 18.85 µmol/L,Alb 的最佳截断点是 30.85 g/L,年龄的最佳截断点是 69.5 岁,Cr 的最佳截断点是 69.5 µmol/L。生存分析显示,根据最佳截断值划分组的生存率存在显著差异 (图 3B-H)。
05局限性
回顾性研究设计: 本研究采用了回顾性研究设计,这可能会引入选择偏倚和信息偏差,并影响结果的普遍性。未来的研究应使用前瞻性设计来验证这些结果。
样本量: 虽然研究纳入了 400 例患者,但对于机器学习模型来说,这仍然是一个相对较小的样本量。未来的研究应使用更大规模的患者队列来验证模型的性能和泛化能力。
数据异质性: 来自不同机构的患者数据可能存在异质性,例如 TIPS 手术技术、随访方案和合并症管理等方面的差异。虽然在内部和外部验证集中都验证了模型的性能,但应谨慎地将该模型推广到其他中心。
特定人群:由于该研究是在中国完成的,该模型需要在中国以外的其他人群中进一步评估。
随访时间: 由于本研究中定义的临床结局为 1 年生存率,因此该模型可能无法预测长期预后。未来的研究应该使用更长的随访时间来评估模型在长期预后方面的性能。
外部验证人群相对单一: 虽然我们在两个机构进行了外部验证,但这两个机构都地处中国,应该在其他机构,不同国家和地区的患者中进一步验证模型的泛化能力。
缺乏对死亡机制的深入研究: 该研究主要集中于建立一个准确的预测模型,并没有深入研究这些预测变量影响预后的潜在机制。未来的研究应该进一步探索这些机制,以指导靶向治疗策略的开发。
小编说明:
本研究成功开发并验证了一种基于随机森林算法的预测模型,该模型可以预测肝硬化患者 TIPS 手术后的生存率。该模型优于其他传统的评分系统,并纳入了之前未被考虑的血氨水平作为预测因子。SHAP 分析为机器模型预测和识别关键风险因素提供了有价值的见解。这些结果为临床实践提供了有力帮助,但仍需进一步的研究,以验证和改进该模型在其他人群和临床环境中的性能。此外,未来的研究还应探索这些风险因素影响预后的潜在机制,以便制定更具针对性的治疗策略。
结语
临床研究的根本使命是发现并解决生命科学领域亟待解决的临床问题,同时,为即将发生的临床难题提供备选解决方案。
打开极智分析—智能医学统计分析平台 https://www.xsmartanalysis.com/ 进行实操吧!
往期精彩回顾
【1】eClinicalMedicine (IF=9.6):模型可视化-15年数据构建预测模型评估女性CSEP术中出血的风险
【2】Nature子刊:蛋白组+代谢组=构建心肌病调控功能网络并提供在线应用程序
【3】Nature子刊:基于蛋白质的机器学习预后模型用于对儿童乳头状甲状腺癌患者进行分层
【4】CARDIOVASCULAR IMAGING(IF=12.8):基线分析+模型解释性+生成分析=NICM右心室功能障碍的预后意义
【5】《Eur J Heart Fail》IF=16.9,如何识别高危糖尿病心肌病表型?新开发和验证的机器学习的方法帮助解决!
扫二维码
关注我们
公众号|极智分析
知乎|极致分析
B站|极智分析