目的:尽管进行了多项随机对照试验(RCT),但感染性休克复苏的最佳方法仍不清楚。我们的目的是调查个体对复苏策略的反应中差异性是否可能导致先前随机对照试验中治疗效果的冲突。
设计:我们将澳大利亚脓毒症复苏评估 (ARISE) 和早期感染性休克方案化护理 (ProCESS) 试验的研究中心随机分为衍生组和验证组。我们训练机器学习模型来预测衍生队列中 90 天死亡率的个体绝对风险差异 (iARD),并在验证队列中测试治疗效果 (HTE) 的异质性,并在敏感性分析中交换这些队列。我们在组合数据集中拟合表现最佳的模型,以探索患者特征和早期目标导向治疗 (EGDT) 的各个组成部分的作用,以确定治疗反应。
地点:澳大利亚、新西兰、香港、芬兰、爱尔兰共和国和美国的 81 个站点。
患者:因严重脓毒症或感染性休克而到急诊科就诊的成年患者。
干预措施:EGDT 与常规护理。
测量和主要结果:局部线性随机森林模型在预测 iARD 方面表现最佳。在验证队列中,HTE 得到证实,iARD 预测与治疗之间的相互作用证明了这一点 (p < 0.001)。当根据预测的 iARD 对患者进行分组时,治疗反应从最低五分位数增加到最高五分位数(绝对风险差异 [95% CI],–8% [–19% 至 4%],相对风险降低,1.34 [0.89–2.01]五分之一中的 ] 表明 EGDT 的危害,并且 12% [1–23%] 和 0.64 [0.42–0.96]五分位数 5 表明有好处)。敏感性分析也显示出类似的结果。干预前白蛋白对 HTE 的贡献最大。对各个 EGDT 成分的分析尚无结论。
结论:两项多中心随机对照试验中,不同患者对 EGDT 的治疗反应各不相同,其中一些患者受益匪浅,而另一些患者则受到损害。患者特征(包括白蛋白)对于识别 HTE 最重要。
一、前言
超过50 项随机对照试验 (RCT) 测试了脓毒症的复苏策略,但最佳方法仍不确定。早期目标导向治疗 (EGDT),一种多成分、6 小时的干预措施,包括按方案给予液体、升压药、在一项具有里程碑意义的单中心试验中,与常规护理相比,正性肌力药物和血液制品的绝对死亡风险降低了 16%。然而,随后的三项多中心国际随机对照试验并未重现之前观察到的益处。目前,在临床实践中并未常规遵循EGDT 方案,但液体给药量和速率以及血管加压药的使用等几个组成部分仍然是复苏的基石。重要的是,每个组件的最佳交付方式仍然是持续争论和探究的根源。
人们越来越认识到,随机对照试验中估计的平均治疗效果(ATE) 可能无法反映每位患者所经历的不同的个体治疗效果 (ITE)。尽管使用传统统计方法对先前 EGDT 试验进行的个体患者数据荟萃分析 (IPDMA) 可能效力不足,但并未发现受益的亚组,但治疗效果 (HTE) 的异质性可能存在,并导致结果不一致。复苏的另一个复杂性是,与固定剂量干预中的 HTE 评估相比,不同患者的干预“剂量”(例如液体或升压药的量)存在很大差异。我们试图在 EGDT 的大型随机对照试验中探索 HTE,并确定可能解释 HTE 的患者特征或有关干预实施的特征。
二、方法
试验特征
我们对EGDT 的两项多中心随机对照试验进行了二次分析:澳大利亚脓毒症复苏评估 (ARISE) 和早期脓毒性休克方案化(ProCESS)。我们没有纳入脓毒症方案化管理 (ProMISe)试验的数据,因为它缺乏在初步分析中发现对预测治疗反应很重要的干预前变量。这两项试验在澳大利亚、新西兰、香港的 81 个地点(ARISE 中 51 个,ProCESS 中 30 个)将 2008 年至 2014 年间因感染性休克(定义为脓毒症和难治性低血压或乳酸升高)到急诊科就诊的成年人随机分配到 EGDT 或常规护理组香港、芬兰、爱尔兰共和国和美国。 ProCESS 还将患者随机分为接受方案复苏的第三组,我们排除了这一组,因为 ARISE 中没有类似的方案。
研究设计
这项研究有三个主要目标。首先,我们测试了这样的假设:对EGDT 的反应因开发而异并验证模型来预测个体治疗反应。其次,我们确定了预测个体治疗反应的患者特征。第三,EGDT 是一种多成分干预,我们确定是否有任何 HTE 可能是由于 EGDT 方案子成分的差异而造成的。
主要结果
我们选择90 天全因死亡率作为主要结局,与 ARISE 试验 和三项当代 EGDT 试验的 IPDMA一致。我们排除了缺少 90 天死亡率结果数据的受试者 (n = 6, 0.2%)。
选择用于建模的预测变量
我们使用27 个预测变量来模拟来自六个临床领域的个体治疗反应:人口统计、合并症、生命体征、疾病急性严重程度评估、临床实验室值、和感染部位。
三、统计分析
首先,我们通过将两项试验的研究中心随机分为两组(41 个用于推导,40 个用于验证)来构建推导和验证队列。我们使用这种方法而不是其他方法(例如,一项试验用于推导,一项试验用于验证、时间或地理分割),因为尽管做出了协调努力,但 ARISE 和 ProCESS 中不同地点的常规护理存在差异由于患者层面而非场所层面的差异,按场所划分可以更好地识别 HTE。我们训练了一个模型来预测个体推导集(队列 A)中的治疗反应,并使用验证集(队列 B)中的模型估计的个体治疗反应对 HTE 进行正式测试,这降低了模型精度,因为只有一半的数据集用于预测,但降低了过度拟合偏差的风险。我们将单个模型拟合到组合数据集中,以使用尽可能大的数据集来探索哪些患者特征和 EGDT 的子组成部分识别出 HTE。所有统计分析均使用 R 版本 4.3.0 进行。模型开发。在队列 A 中,我们比较了三种模型(两种基于效果和一种基于风险),以确定表现最佳的模型类型。基于效应的模型包括因果森林和基于局部线性随机森林 (LLRF)的 R 学习器,它们的计算效率很高,但各自具有不同的优势。
对于EGDT 中不太常用的子成分,我们比较了 EGDT 和常规护理组之间红细胞输注和多巴酚丁胺使用的差异,并按组合队列中 iARD 的五分位数分层。
四、结果
我们纳入了来自ARISE 的 1588 名患者(796 名随机分配至常规护理,792 名随机分配至 EGDT;入组率为 99%)和来自 ProCESS 的 892 名患者(455 名随机分配至常规护理,437 名随机分配至 EGDT;入组率为 99%)。将 81 个中心随机分为 A 组和 B 组后,我们确认患者总体和治疗组的基线特征分布相似。
表1 A 组和 B 组的基线患者特征
推导集中的模型开发
在比较用于按队列A 中 EGDT 效果从最低到最高的顺序对患者进行排名的三种候选模型时,LLRF R-Learner 具有最高的判别性能指标(AUTOC、AUQINI 和调整后的 AUQINI),并且交叉验证最低R 损失与因果森林和基于风险的模型相比,表明预测性能优越。因果森林和 LLRF 模型在敏感性分析中均表现良好,其中一项试验用于推导,另一项试验用于测试 HTE。因此,我们选择 LLRF 模型进行其余分析。
异质效应的模型验证和假设检验
在队列B 的验证分析中,我们观察到 iARD 预测和治疗之间存在显着的交互作用(系数,1.8;95% CI,0.76–2.8;p < 0.001),支持 HTE。在 B 组患者中,EGDT 与常规治疗相比,总体绝对风险差异为 2%(95% CI,–5% 至 4%),RRR 为 1.00(95% CI,0.8–1.2)。当使用源自队列 A 的模型对队列 B 中的患者从获益可能性从最低到最高进行排序时,两者预测的和观察到的治疗效果差异很大。五分位数 1 中的平均预测 iARD 为 –6%,观察到的 90 天死亡率在 EGDT 中为 31%,在常规护理组中为 23%,这意味着观察到的 ARD 为 –8%(95% CI,–19% 至4%)和RRR1.34(95% CI,0.89-2.01)表明 EGDT 死亡率增加。相比之下,在五分位数 5 中,平均预测 iARD 为 7%,观察到的 EGDT 死亡率为 21%,常规护理组为 33%,因此观察到的 ARD 为 12%(95% CI,1-23%), RRR 为 0.64(95% CI,0.42-0.96),表明 EGDT 降低了死亡率(图 1)。对于具有相似 iARD 预测的患者,治疗组的死亡率图显示,iARD 接近 0 的患者在每个治疗组中的风险相对较低,而两个方向上 iARD 更极端的患者的基线死亡风险越来越高(图 2)。在逆转推导和验证队列的敏感性分析中观察到类似的结果(图 3 和 4),与预测的 iARD 相互作用显着治疗结果一致(系数,1.3;95) % CI,0.4–2.1;p = 0.001)。值得注意的是,当队列 B 用于验证时,iARD 的全谱范围广泛,范围为 –13.7% 至 13.9%;当队列 A 用于验证时,iARD 范围为 –28.5% 至 16.5%。尽管并非所有分析都达到统计显着性,但使用替代方法处理缺失数据值的敏感性分析结果也一致。通过预测的 iARD 相互作用进行的治疗在使用 ProCESS 进行推导和 ARISE 进行验证的敏感性分析中仍然显着 (p = 0.003),反之亦然 (p = 0.003)。对于队列 A 中导出的模型,队列 B 中计算的判别性能指标非常出色;队列 A 中计算的指标对于队列 B 中得出的模型同样强大。
图1. 在按预测个体 ARD (iARD) 分层的五分位数患者中,观察到早期目标导向治疗 (EGDT) 与常规治疗的绝对风险差异 (ARD) 为 95% CI。五分位数代表队列 B 中的患者,根据队列 A 中派生的局部线性随机森林 R 学习者模型的预测治疗反应进行分层。与常规护理(EGDT 的危害)相比,阴性 ARD 代表 EGDT 的死亡率较高,阳性 ARD 代表 EGDT 的死亡率较低EGDT 与常规护理相比(EGDT 的益处)。五分位数 1 (Q1) 代表预测 iARD 最低的患者(预计从 EGDT 获益最少),五分位数 5 (Q5) 代表预测 iARD 最高的患者(预计从 EGDT 获益最多)。与常规护理相比,EGDT 组 90 天死亡率的相对风险也以 95% CI 提供。 Q2 = 五分之一 2,Q3 = 五分之一 3,Q4 = 五分之一 4。
图2. 检查队列 B 中的预测个体绝对风险差异 (iARD)。队列 B 中的预测 iARD 是根据队列 A 中导出的局部线性随机森林 R 学习器模型确定的。(A) 中提供了 iARD 预测的直方图。 (B) 中提供了预测的 iARD 与每个治疗组中观察到的平滑死亡率的关系图。 (C) 中提供了 iARD 预测与观察到的死亡率差异的关系图。 (B) 和 (C) 中的曲线是使用基于随机森林的平滑函数(使用队列 B 患者预测和 90 天死亡率状态)生成的。与常规护理 (UC) 相比,iARD 阴性预测代表早期目标导向治疗 (EGDT) 的死亡风险较高(可能造成伤害),而阳性预测代表 EGDT 的死亡风险较低。 (C) 中的虚线代表队列 B 中 iARD 预测的完美校准截距和斜率;虚线表示随机生成的预测的校准。
评估导致HTE 的患者特征
循环白蛋白水平最能预测SHAP 中的治疗反应、决策树分析,并且当 iARD 五分位数的基线特征比较(表2)。例如,白蛋白水平较低的年轻患者更有可能受到 EGDT 的伤害,而白蛋白水平正常的老年患者更有可能受益。 SHAP 分析表明协变量和预测治疗反应之间的关系很复杂。例如,当白蛋白值低于 3 g/dL 时,白蛋白水平与治疗反应呈急剧增加的线性关系,而当白蛋白值大于或等于 3 g/dL 时,白蛋白水平与治疗反应呈恒定(平坦)贡献,而年龄则显示出线性关系。温度、心率和循环葡萄糖值也是治疗反应的重要预测因素,这些变量与治疗反应之间存在 U 形或 S 形关系。其余变量也对治疗反应有贡献,尽管个体贡献有所不同。
值得注意的是,两名患者可能有相似的iARD 预测,但由于协变量模式不同。例如,合并队列中的两名患者收到的 iARD 预测低于 –14%,表明EGDT 的危害。 SHAP 分析显示,该模型几乎完全基于一名患者的低白蛋白水平生成伤害预测,但对另一名患者的伤害预测是主要基于低白蛋白、年龄和葡萄糖的贡献。在使用一项推导试验和另一项验证试验的敏感性分析中注意到变量重要性的一些差异,但白蛋白仍然是最重要的变量,并且前十个变量在分析中大多一致。
在调查iARD 五分位数个体合并症差异的探索性分析中,我们确定,预计会受到 EGDT 伤害的五分之一患者中,肝硬化最为常见,而预计会从 EGDT 中受益最多的五分之一患者中,心力衰竭最为常见。
表2.根据组合样本中推导的模型,对所有患者(队列 A 和 B)的预测个体绝对风险差异五分位数的基线特征进行比较
评估EGDT 对 HTE 的贡献
关于干预措施的部署方式是否影响HTE 的探索性分析尚无定论。对于液体和升压药的使用,正如预期的那样,限制性液体管理组中的部位在 EGDT 组和常规护理组之间的液体给药方面存在较高差异,而自由派团体网站中的患者在升压药的使用方面存在较高差异。然而,这些地点的 HTE 强度并没有变化。同样,对于红细胞输注和多巴酚丁胺使用,常规护理组和 EGDT 组之间没有观察到差异。
五、讨论
在对两项测试复苏策略的多中心国际试验进行的二次分析中,我们发现EGDT 的 ITE 与常规护理相比存在很大差异。尽管两项试验都没有表现出具有统计显着性的 ATE,但这些试验中的 iARD 范围包括与最初 EGDT 试验类似的益处,但也包括具有同等程度危害的 iARD。白蛋白水平最具预测性预计白蛋白值较低的年轻人受到 EGDT 危害最大的治疗反应。探索性分析表明,EGDT 可能会伤害肝硬化患者,但有益于心力衰竭患者,但是,由于试验之间的合并症评估存在差异,这些结果只是假设的生成,并强调在未来调查 iARD 与复苏的研究中需要考虑合并症。
当EGDT 的 ARISE、ProCESS和 PROMISe试验没有复制原始 Rivers 试验中所证明的益处时,对这些不一致的结果出现了不同的意见,包括常规护理实践的转变时间和缺乏功效。我们的研究结果表明,EGDT 可能确实有效,但仅对一部分患者有效,试验结果的差异可能反映了 EGDT 有益和有害的患者入组情况的差异。
重要的是,类似的HTE 可能存在于其他脓毒症复苏试验中。因此,我们的结果对未来复苏试验的设计具有影响,与当代试验相比,该试验的规模应该大得多,以便允许将患者随机分配到多个组中的几个干预组,以考虑每个复苏组成部分的潜在 HTE。几项调查这一概念的研究使用基线协变量识别了亚型,并证明了亚型中的差异治疗效果。与最近对 ITE的研究一致,我们当前的方法是不同的并且具有优势。首先,当确定亚型成员资格的变量与确定治疗反应的变量不同或当亚型内个体治疗反应不同时,识别 ITE 可能比亚型划分更有利。其次,我们研究中的 iARD 值提供了个体层面的益处或危害的估计,并可能允许个性化治疗。第三,SHAP等现代模型解释工具使研究人员能够了解预测变量在治疗反应中的贡献,这对于个体患者来说可能有所不同。
尽管更丰富的协变量集(例如器官支持和干预实施的详细测量)可能提供了更深入的见解。一些可能指导脓毒症复苏的生理变量,如升压药剂量和中心静脉血氧饱和度,尚未普遍获得。作为有助于响应的变量复苏与复苏的关系仍不清楚,未来的HTE 研究应努力在预测变量之间取得平衡,既包括已经与治疗反应具有合理因果关系的变量,也包括因果关系不那么明确但可能存在的其他变量。我们承认,当仅使用一半的可用数据推导出模型时,变量重要性排名顺序存在一些细微差异;然而,有五个变量始终是最重要的,我们使用整个队列来确定变量重要性的方法将为参加未来前瞻性试验的患者提供最精确的估计。我们的预测变量的缺失也可能影响 ITE 估计的精度,但我们的结果在多项敏感性分析中都是稳健的。需要进行前瞻性研究来推进精准医学方法并完善基于 ITE 的方法,但像我们这样的回顾性分析有助于深入了解变量和模型设计,并有助于避免将患者随机分配到可能受到伤害的治疗组。
总之,我们的结果表明,参加EGDT 试验的患者对复苏的个体反应有所不同。未来的研究应寻求了解潜在的机制,未来的试验设计应纳入学习 HTE 和定制复苏策略的方法。
话险危夷·述评
2001年,Rivers 等报道了在重度脓毒症和感染性休克的早期 血流动力学复苏中, 早期目标导向治疗 (EGDT) 可以显著降低患者的死亡率, 随后也有多个非随机对照研究结果表 明EGDT 有助于提高存活率。虽然将EGDT 已被纳入拯救脓毒症患者运动指南 (SSCG), 后来其运用适应范围逐渐宽泛, EGDT也可以用于治疗非感染性休克,如心源性休克、出血性休克等。甚至治疗严重创伤患者,特别是那些伴有低血压的患者。但作为感染性休克中前 6 小时复苏策略的特异性方案,自从提出就饱受争议。关于早期目标导向治疗 (EGDT)与常规组之间的对比的研究也层出不穷,本研究中显示不同患者对 EGDT 的治疗反应各不相同,其中一些患者受益匪浅,而另一些患者则受到损害,EGDT 可能会伤害肝硬化患者,但有益于心力衰竭患者。随着近年重症超声广泛运用,为临床指导液体复苏提供了了更多手段。脓毒症是一种高异质性综合征,具有大量的临床和生物学特征, 可能形成不同的潜在表型。随着精准医 学研究的出现,使基因组等组学技术在分子学水 平取得极大进步,这也为脓毒症的精准治疗策略 提供了可能。为脓毒症和感染性休克的治疗方法提供个性化选择。
编译:郭仁楠、王静静
审校:王璐 点评:刘艳
原始文献
Shah, FA, Talisa, VB, Chang, CH, et al. Heterogeneity in the Effect of Early Goal-Directed Therapy for Septic Shock: A Secondary Analysis of Two Multicenter International Trials. CRIT CARE MED. 2024; doi: 10.1097/CCM.0000000000006463
(仅供医学专业人士参考)
声明:古麻今醉公众号为舒医汇旗下,古麻今醉公众号所发表内容之知识产权为舒医汇及主办方、原作者等相关权利人所有。未经许可,禁止进行转载、摘编、复制、裁切、录制等。经许可授权使用,亦须注明来源。欢迎转发、分享。