【话险危夷】从静脉体外膜肺氧合的机器学习中识别与神经系统结果相关的因素

健康   2025-01-06 06:03   上海  




摘要

在接受静脉-静脉体外膜氧合(VV-ECMO)支持的患者中,神经系统并发症很常见。我们使用机器学习(ML)算法来确定这些患者神经系统结果的预测因素。我们提取了 2016 年至 2022 年期间在一家三级医疗中心接受 VV-ECMO 支持的成人的所有人口统计学、临床和回路相关变量。主要结果是出院时的良好神经功能预后(GNO),定义为改良Rankin量表0-3分。在99名VV-ECMO患者(中位年龄=48岁;65%为男性)中,37%的患者出现了GNO。表现最好的 ML 模型的接收者操作特征曲线下面积为 0.87。特征重要性分析表明,下行趋势的气体/扫气/吹气流量、FiO2和泵速是预测 GNO 的最显著特征。总之,利用启动前和启动后的变量,ML 确定了最能预测神经系统结果的 ECMO 生理和肺部条件。

简介

使用静脉-静脉体外膜氧合(VV-ECMO)可提高部分严重呼吸衰竭患者的存活率。然而,VV-ECMO 也面临着许多挑战,包括增加发病率和死亡率的神经系统并发症。研究表明,神经系统损伤的发生率为 4-13%,包括脑死亡、脑内出血(ICH)、缺血性中风和癫痫发作。虽然已经发现了一些导致 VV-ECMO 神经系统并发症的危险因素,如 ECMO 前心脏骤停和高胆红素血症、围手术期 PaCO2 快速变化和凝血酶原时间最低值,但我们仍然无法预测不良的神经系统结果。

目前已开发出多种预后模型来预测VV-ECMO 的存活率。然而,这些模型都有局限性。例如,研究表明,现有的 ECMO 专项评分和一般疾病严重程度评分对接受 ECMO 支持的 COVID-19 患者的预测能力有限。此外,使用传统统计方法得出的评分在评估 ECMO 结果方面的数据拟合能力有限。这些评分也只包含 ECMO 前的变量,没有考虑到 ECMO 启动后发生的主要生理变化。此外,目前可用的模型均未经过训练,无法预测VV-ECMO 的神经系统预后。

我们的研究旨在使用机器学习 (ML) 算法,在来自电子病历 (EMR) 的丰富颗粒流程数据上训练,以确定与VV-ECMO 中不良神经系统结果相关的“可修正”风险因素。

方法

研究人群

我们对 2016 年 6 月至 2022 年 4 月在约翰霍普金斯医院接受 VV-ECMO 支持的所有成人进行了回顾性评价。在我们机构,所有 VV-ECMO 患者都在心血管外科重症监护室接受治疗,在那里他们接受标准化的无创多模态神经系统监测。这项研究于 2019 年 10 月 22 日获得约翰霍普金斯大学医学院机构审查委员会 (IRB00216321) 的批准。

数据收集与预处理

前瞻性地记录了基线人口统计学、既往病史、ECMO 适应症、ECMO 并发症和神经系统结果。连续变量以中位数和四分位距(IQR)表示,分类变量以原始值和百分比表示。时间序列化验值、生命体征、ECMO 和呼吸机设置均从电子病历中进行回顾性查询。总共收集了 74 个独特的变量,包括 500 多万个数据点。时间序列数据使用插管前 24 小时、插管后 6、12、24 和 24 小时以及整个插管期间每个变量的中位数、最低点、最大值、标准偏差和斜率进行汇总。最大血管舒张剂剂量当量 (VDE) 分数是根据 Goradia 等人使用的公式计算得出的。所有数据预处理均使用 R 4.2.2 版(Vienna, Austria)进行。

治疗结果

主要结果定义为出院时的神经功能结果:改良 Rankin 量表(mRS)评分为0-3 分的患者被判定为 “神经功能结果良好”(GNO),mRS 评分为 4-6 分的患者被判定为 “神经功能结果不良”(PNO)。神经功能结果由两名独立的临床医生进行评估,并在出现分歧时进行裁决。

机器学习算法

我们评估了 4 种 ML 算法在预测神经系统结局方面的适用性: Random Forest 、 CatBoost 、 LightGBM 和 XGBoost。每个模型的超参数调整是使用贝叶斯优化对数据集中的每个算法进行随机划分为训练 (70%) 和测试 (30%) 的。然后使用留一法交叉验证 (LOOCV) 将每种算法应用于我们的整个队列,从中可以计算包括受试者工作特征 (ROC) 曲线下面积 (AUC) 和精确率召回 (PR) AUC 在内的指标。为评估数据缺失对模型性能的影响,进行了敏感性分析(补充表 1)。为了在提高判别能力和减少数据缺失之间取得平衡,我们删除了缺失率超过 20% 的变量。

其余缺失数据有 7.4% 的缺失率并补:连续变量通过均值插补填充,而二进制变量通过填充具有最短 Hamming 距离的参考患者模式进行插补。均值插补、迭代100 次的链式方程多重插补(MICE)以及所有 4 种 ML 算法处理缺失数据的固有功能之间在模型性能上没有显着差异(补充表 1)。因此,选择均值插补是为了便于计算。

在随机森林算法、XGBoost 算法和 LightGBM 算法中,当在构建树的过程中出现分裂并遇到缺失值时,算法会根据每个分裂中最能优化模型的选择来决定将缺失值分配到分裂的哪一边。CatBoost 算法将缺失值作为特征的最小值来处理。在树选择过程中,会自动考虑将缺失值与所有其他值分开的分割,最终选择成本函数最小的分割。

对于每种相关算法,我们都在训练数据集中使用合成少数群体过度采样技术(SMOTE)创建了具有 GNOs 的合成患者,以便为我们的模型提供一个更加平衡的数据集,同时确保在训练数据和测试数据之间不会出现患者泄漏(补充表 2)。由于 XGBoost 和基线GNO 性能优越,因此本研究选择 XGBoost 作为梯度提升决策树算法(图 1)。


机器学习流程

我们通过两种方法评估了XGBoost 模型的预测性能:一组模型在训练/测试子集上进行训练和测试,另一组则采用 LOOCV 方法。我们通过计算 AUC-ROC、AUC-PR 和 Brier 分数来评估它们的性能,这些分数基于它们对各自测试集的预测。

为了深入了解模型的决策过程并确定对预测神经系统结果最有影响力的变量,我们分析了特征重要性排序和Shapley加法解释(SHAP)值。在SHAP 汇总图中,特征值相对于其分布被描述为高(红色)或低(蓝色),图中的每个点代表一名患者的特征归因值,在x 轴上绘制为 SHAP 值。SHAP 值衡量预测影响,正值表示出院时获得良好神经功能结果的可能性较高。所有模型的训练、测试和分析均在 Python 中完成。

结果

患者特征

2016 年 6 月至 2022 年 4 月期间,共有 99 名患者在约翰霍普金斯医院接受了 VV-ECMO 治疗。总体而言,中位年龄为 48 岁,35.4% 为女性(表 1)。在 99 名患者中,37 名患者发生了 GNO(37.4%)。GNO和PNO患者的基线人口统计学和既往病史无明显差异。


然而,与 PNO 患者相比,GNO 患者的 ECMO 持续时间较短(268小时对 461 小时,P=0.014,表 2)。最后,12 名 GNO 患者(32.4%)在 ECMO 期间出现急性脑损伤(ABI),而 18 名 PNO 患者(29%)出现 ABI(P=0.9)。


模型性能

在剔除了 1,124 个(46.9%)缺失率超过 20% 的变量后,共有 1,275 个变量被纳入模型训练。表现最好的 ML 模型的受试者操作特征曲线下面积(AUC)为 0.87,LOOCV 的brier得分为 0.25(图 1)。模型的性能指标包括准确度 0.80、精确度 0.71、召回率0.81 和净现值 0.86(补充表 3)。

特征分析

结果预测中最重要的 20 个特征被绘制成 SHAP 分析图(图 2)。较低的血尿素氮、较高的最低收缩压以及较高的最低平均动脉压是预测 GNO 的前 10 个最重要变量。在ECMO 插管过程中,GNO 的 3 个最强预测因子是呈下降趋势的 FiO2、呈下降趋势的气体/扫气/混合器流量和呈下降趋势的泵速(转/分)。无论如何处理缺失数据,前 3 个预测因子都是一致的(补充图 1)。


讨论

我们建立了第一个用于识别VV-ECMO 后神经功能预后预测因素的 ML 模型框架。我们的模型具有较高的判别能力和适度的准确性,更重要的是,它识别出了对预测良好神经功能预后非常重要的 ECMO 回路组件和患者实验室数据。

现有的 VV-ECMO 不良预后模型仅限于 ECMO 前变量,只能预测死亡率,而且性能不稳定。我们的模型同时包含 ECMO 前和 ECMO 中的变量,以捕捉 ECMO 支持过程中可能影响神经系统预后的生理变化。我们的模型还包括本机构神经监测方案中的变量,该方案已被证明可改善 ABI 检测。

我们的 SHAP 分析发现,在 VV-ECMO 插管过程中,扫气、流速和混合器需求量的增加是最有可能导致 PNO 的变量。扫气和混合器流量的增加可能表明患者的功能明显下降,从而增加了神经系统并发症的风险。然而,ECMO 设置的快速变化也可能导致神经系统并发症。插管早期 PaCO2大幅下降是 VV-ECMO 神经系统并发症的独立风险因素,原因是 PaCO2 下降导致脑灌注减少,继而造成再灌注损伤。对扫气管理的仔细关注是一种潜在的可调节护理要素,可预防并发症的发生。

在我们的预测模型中,SHAP 分析还发现了其他重要特征,其中包括 ECMO 要求的增加,如 FiO2。在 VV-ECMO 中,ECMO 前低氧血症是出血性和缺血性中风的已知风险因素。因此,在 ECMO 插管过程中出现难治性低氧血症的患者同样会有较高的 ABI 发生率,从而导致 PNO。另外,难治性低氧血症也可能与包括神经系统状态在内的全身衰退有关。

另一个“可改变”的风险因素是扫描气体 FiO2,它通过向氧合器提供新鲜气体来增加 PaO2。重度高氧与 ECMO 的神经系统并发症有关。高氧对严重呼吸系统疾病的有害影响已得到充分证明,ABI 的机制包括炎症和活性氧的形成。考虑到神经系统结局中存在低碳酸血症和高氧的风险,应保守地增加 ECMO 设置以避免快速变化。可以采用扫描设置来避免高碳酸血症的快速降低,随着时间的推移缓慢增加。在监测呼气末 CO2 (ETCO2) 的同时,初始低扫频后逐渐增加,可以预防神经系统并发症。关于低氧血症,在纠正低氧血症时,从低 FiO2开始并随着时间的推移慢慢增加也可能是有益的。

这项研究有几个局限性。模型开发受到能够从 EMR 中提取的变量的限制,因此无法包含未记录在流程图中的数据。此外,鉴于数据的可用性,仅评估了出院时的神经系统状态,但是,还应探索 VV-ECMO 期间 ABI 的建模。也没有调查变量相互作用。此外,使用均值插补会带来模型性能高方差的风险,但是,鉴于 MICE 对于高维数据的计算成本很高,固有的算法功能也具有很高的可变性风险,并且所有方法都具有相似的模型性能,与 AUC-ROC 测量的模型性能相似,我们认为均值插补更适合我们的目的,因为它的简单性和在监督学习环境中的常见应用。最后,我们在具有成熟神经监测方案的机构中相对较小的样本量也无法推广到所有 VV-ECMO 人群。但是,我们希望将来使用 5 中心合作的 Improve ECMO 研究进行外部验证。

结论

我们建立了首个预测 VV-ECMO 插管后神经功能预后模型的框架。通过纳入插管前和插管后的变量,该框架确定了改变 PaO2 和 PaCO2 变化的 ECMO 回路组件,这些组件对神经功能障碍的风险评估最为重要,有助于改善患者的预后。


话险危夷·述评

该研究建立了首个用于预测VV-ECMO(静脉-静脉体外膜肺氧合)插管后神经功能预后的模型框架,这一成果无疑为ECMO治疗领域带来了重大的突破。该框架的创新之处在于,它不仅纳入了插管前的患者基础状况,还充分考虑了插管后的多种变量,使得预测更为全面和准确。

通过深入研究发现ECMO回路中影响PaO2(动脉血氧分压)和PaCO2(动脉血二氧化碳分压)变化的组件,对神经功能障碍的风险评估具有至关重要的作用。这些组件的识别和优化,有望为降低ECMO患者神经功能障碍的发生率提供新的思路和方法。

此模型的建立,不仅为临床医生提供了更为精准的治疗决策依据,还有助于改善患者的预后,提高ECMO治疗的成功率。我们期待这一框架能够在未来的临床实践中得到广泛应用,为更多ECMO患者带来福音。

原始文献

Leng A, Shou B, Liu O, Bachina P, Kalra A, Bush EL, Whitman GJR, Cho SM. Machine Learning from Veno-Venous Extracorporeal Membrane Oxygenation Identifies Factors Associated with Neurological Outcomes. Lung. 2024 Aug;202(4):465-470. doi: 10.1007/s00408-024-00708-z. Epub 2024 May 30. PMID: 38814448; PMCID: PMC11417431.

仅供医学专业人士参考





声明:古麻今醉公众号为舒医汇旗下,古麻今醉公众号所发表内容之知识产权为舒医汇及主办方、原作者等相关权利人所有。未经许可,禁止进行转载、摘编、复制、裁切、录制等。经许可授权使用,亦须注明来源。欢迎转发、分享。


古麻今醉网
古麻今醉网是舒医汇旗下麻醉学科的专属学术平台。云集国内外知名麻醉学专家,及时将麻醉学科的新动向、新知识、新技术进行传播,呈现我们麻醉医生的美------“志存高远,佑护生命”。
 最新文章