思路选对,事半功倍!用MIMIC-IV数据库构建预测模型照样能发一区(IF=8.5)

文摘   科学   2024-07-01 18:07   浙江  

近年来,预测模型在护理领域可以算是热门选题。无论是申请课题,还是硕士论文,预测模型统统都能驾驭。先前我们就发现过两篇由中国学者发表在SCI二区的预测模型的文章,有意思的是两篇文章都属于同一个研究团队!
往期回顾:

赞啊!连发两篇SCI二区,中国学者用中国免费数据库发表两篇预测模型,只有结局不同

今天分享的这篇文章,同样是中国学者写的,用MIMIC-IV数据库构建了预测模型,照样发了一区!

2024年6月20日,中南大学的学者用MIMIC-IV数据库,在期刊Cardiovascular Diabetology(医学一区top,IF=8.5)发表题为:“Comparative study on the predictive value ofTG/HDL-C, TyG and TyG-BMI indices for 5-yearmortality in critically ill patients with chronic heartfailure: a retrospective study ”研究论文由于TyG(胰岛素-葡萄糖)、TyG 体重指数(TyG-BMI)甘油三酯-密度脂蛋白胆固醇比值 (TG/HDL-C)胰岛素抵抗(IR)的替代指标,因此本研究旨在比较这些指标对慢性心力衰竭 (CHF)危重患者 5 年死亡率的预测价值。

本公号回复“ 原文”即可获得文献PDF等资料,如果进一步需要全流程指导临床预测模型的分析与指导,请联系郑老师团队,微信号:zz566665
慢性心力衰竭(CHF)是各种心脏病发展的最终阶段,可谓是“人类心脏病最后的战场”。据报道,我国每5例因病死亡病例中就有2例死于心血管病,而心衰则是心血管相关死亡的重要原因。此外,心衰的5年生存率与恶性肿瘤相近。如果不进行有效防治,心衰发病5年内约50%患者会死亡。

主要研究结果

1.研究设计

本研究是一项回顾性队列研究,采用了MIMIC III 和 IV的数据,最终纳入1329 名被诊断为慢性心力衰竭 (CHF)的符合条件患者,纳入标准包括:

(1)年龄≥18岁;

(2)入住ICU24 h;

(3)有体重、身高、TG、HDL、空腹血糖和N端脑钠肽原体(NT-proBNP)水平等数据;

(4)具有完整的入院数据。
  • 根据 TyG 指数的四分位数将患者分为四组:T1 (TyG ≤ 9.03, N = 333), T2 (TyG > 9.03, ≤ 9.45;N = 333)、T3 (> 9.45,≤ 9.85;N = 333)和T4(> 9.85;N = 330)。

  • 根据 TyG-BMI 指数的四分位数将患者分为四组:T1:≤225.06;T2:225.06–261.65;T3:261.65–305.03;T4:>305.03)。

  • 根据TG/HDL比值的四分位数将患者分为四组(四分位数T1:≤1.85;T2:1.85–3.11;T3:3.11–4.88;T4:>4.88)。

主要结局是5年死亡率。

次要结局是住院死亡率和360天死亡率。
2.基线数据 

研究团队最终纳入1329名符合条件的患者,将其分为两组:幸存者组(997例,75%)和非幸存组(332例,25%)。

  • 究结果表明,非幸存者往往比幸存者年长。此外,心房颤动、糖尿病、慢性肾病和呼吸衰竭患者的 5 年死亡率更高。

  • 同时,非幸存者表现出显着更高的 ALT、AST、RBC、CK、Scr、葡萄糖、HbA1C、NT-proBNP、钾、钠、BUN、WBC 和 TG 水平。
  • 与幸存者相比,非幸存者在48小时内接受ACEI/ARBs、抗血小板药物或β受体的患者比例显著降低。
 3.TyG 指数与死亡风险之间的关联

当将 TyG 指数视为连续变量时,使用Cox 比例风险分析,研究结果表明 5 年死亡率风险与TyG 指数之间存在显著关联。

  • 在按照TyG指数四分位数将患者四组后,研究团队发现TyG指数最高四分位数(T4)与5年死亡风险显著相关。

  • 同时,研究团队在TyG指数与住院死亡率和360天死亡率之间也存在类似的关联。
模型1:年龄、房颤、糖尿病、CKD、高血压、呼吸衰竭。
模型2:年龄、AF、糖尿病、CKD、高血压、呼吸衰竭、ALT、AST、RBC、CK、肌酐、HbA1c、Hb、NT-proBNP、钾、钠、BUN、WBC、ACEI/ARB、抗血小板药物、β-受体。

值得注意的是,研究团队发现趋势的P值(0.083)在调整后的模型 2 中并不显著,这表明 TyG 指数与死亡率之间存在非线性关系。

因此,采用限制三次样条(RCSs)分析进一步研究了这种关联。

  • 调整后的 RCS 图揭示了 TyG 指数与 5 年死亡率之间的非线性关联(非线性P= 0.001)。
在5年的随访中,报告了332例全因死亡病例。
下图显示了TyG指数组的死亡率(T1:61,18.3%;T2:81,24.3%;T3:68,20.4%;T4:122,37.0%),这些组之间的死亡率差异有统计学意义(p < 0.001)。

4.TyG-BMI 与死亡风险之间的关联

Cox比例风险分析表明,当TyG-BMI指数为连续变量时,TyG-BMI指数与5年死亡率之间同样存在显著关联。

  • 在按照TyG-BMI 指数将患者分组后,TyG-BMI 较高的患者往往 5 年死亡率更高;然而,但差异并不显著。
RCS 模型揭示了 TyG-BMI 与全因死亡率在 5 年内的非线性联系( 非线性P = 0.09)。

TyG-BMI 四分位数的 5 年死亡率发生率的 K-M 曲线如下图所示。

  • 研究结果显示,全因 5 年死亡的累积发生率随着 TyG-BMI 四分位数的增加而增加 P = 0.0045)。

5.TG/HDL-C 比值与死亡风险之间的关联

当TG/HDL-C指数为连续变量时,它与5年死亡率密切相关。在充分调整潜在混杂因素后,TG/HDL-C 比值最高四分位数的患者的 5 年死亡风险明显高于最低四分位数的患者。
RCS分析表明,TG/HDL-C比值与倒V型剂量的5年死亡风险相关(非线性P=0.046)。

根据 TG/HDL 比值的四分位数分组评估组间全因 5 年死亡率发生率的 K-M 生存分析曲线如下图所示。

  • 两组间死亡率差异有统计学意义(T1:21.6% vs. T2:20.9% vs. T3:23.4% vs. T4:34.1%,p = 0.00012)。
6.TyG、TyG-BMI 和 TG/HDL-C 的 ROC 曲线分析

结果显示,TyG指数在预测全因5年死亡率、360天死亡率和住院死亡率方面优于TyG-BMI和TG/HDL比值。

  • TyG指数预测5年死亡率、360天死亡率和住院死亡率的临界值为10.15。

根据结果,研究团队将患者分为两组(≥ 10.15 和 < 10.15),并进行 Cox 比例风险分析K-M 分析。

  • 结果表明,TyG指数≥10.15的患者死亡率显著高于TyG指数<10.15的患者
7.对TyG、TyG-BMI 和 TG/HDL-C 三个指标预测能力的验证

最后检测IR指数是否会进一步提高基本模型(包括年龄、AF、糖尿病、CKD、高血压、呼吸衰竭、ALT、AST、RBC、CK、肌酐、HbA1c、Hb、NT-proBNP、钾、钠、BUN、WBC、ACEI/ARB、抗血小板药物、β受体)的预测能力。

  • 不幸的是,结果显示,在充血性心力衰竭患者中,三个 IR 指数对基本风险模型没有显着的增量预测能力。

统计学方法


本文所涉及的统计学方法较为完整地重现了预测模型的方法与步骤,思路也较为清晰:

1.数据收集

  • 缺失值超过 10% 的变量被排除在外。

  • 缺失值在 5% 到 10% 之间的变量使用多重插值进行处理,以使用最合适的数据集填充缺失值。

  • 缺失值小于 5% 的变量被替换为该变量的平均值。

  • 使用winsorize方法对具有异常值的变量进行寻解,并将1%和99%作为临界点。

2.预测模型构建与评估

  • 使用 Kaplan-Meier (K-M) 曲线Cox 比例风险模型确定 TG/HDL-C 比值、TyG 指数和 TyG-BMI 与死亡风险之间的关系。

  • 使用方差膨胀因子 (VIF) 检查了多重共线性,以确保研究中的变量独立性

  • 开展亚组分析,探讨不同亚组连续TyG指数与5年死亡率的相关性。 

  • 采用限制三次样条(RCSs)分析进一步研究了3个指标与死亡率的剂量反应关系。

  • 然后进行ROC 曲线分析,以比较三个指标评估死亡率的预测能力、敏感性和特异性。

本公号回复“ 原文”即可获得文献PDF等资料,如果进一步需要全流程指导临床试验设计与分析,请联系郑老师团队,微信号:zz566665

后   记

本文使用的统计学方法主要分为两部分,第一部分是数据的收集,使用多重插补对缺失值进行处理;第二部分是模型的构建与评估,使用Kaplan-Meier (K-M) 曲线 Cox 比例风险模型得到每个预测因子对结果的影响,接着用方差膨胀因子 (VIF)、限制三次样条(RCSs)以及ROC曲线对模型进行评估。
目前,预测模型爆火,发表了多篇高分SCI文章。如果你也想法预测模型但是不知道如何开始,或者空有数据但是不知道怎么进行分析,欢迎加入郑老师统计服务团队开展的临床预测模型一对一指导课程!手把手指导,不怕零基础,1V1指导,发文更高效!


本公众提供各种科研服务了!

一、课程培训
2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS临床试验数据分析、重复测量资料分析、nhanes、孟德尔随机化等10余门课。如果您有需求,不妨点击查看:

发文后退款:2024-2025年科研统计课程介绍

二、数据分析服务
浙江中医药大学郑老师团队接单各项医学研究数据分析的服务,提供高质量统计分析报告。有兴趣了解一下详情:
课题、论文、毕业数据分析 
临床试验设计与分析 公共数据库挖掘与统计


公共数据库与孟德尔随机化
我们专门介绍公共数据库与孟德尔随机化,每周文献周报,呈现精品文献阅读
 最新文章