血小板计数作为脓毒症患者住院死亡的动态预测标记
翻译测试平台
测试后体会
是否收费:收费(免费版功能受限) 翻译准确性:尚可 背景扩展及解释功能:有 全文翻译:支持但有次数限制 购买形式:咸鱼包月服务 公式及图片解释功能:无
摘要
背景:
血小板在止血和炎症性疾病中起着关键作用。已有报道称,低血小板计数和活性与不良预后有关。本研究旨在探讨败血症患者血小板计数动态与住院死亡率之间的关系,并提供实时更新有关死亡风险的信息,以实现动态预测。
方法:
我们进行了一个跨队列、回顾性、观察性研究,涵盖了eICU合作研究数据库(eICU-CRD)和重症监护IV(MIMIC-IV)数据库中败血症患者数据。采用联合潜在类模型(JLCM)来识别败血症患者血小板计数随时间变化的异质性轨迹。我们通过每个轨迹中的分段Cox危险模型评估不同轨迹模式与28天住院死亡率之间的关联。我们通过在预定义时间点计算的接收器操作特征曲线下面积、一致性指数(C指数)、准确性、敏感性和特异性评估了我们动态预测模型的性能。
结果:
确定了四个血小板计数轨迹亚组,对应于不同的住院死亡风险。在早期阶段,包括血小板计数并没有显著提高预测准确性。然而,我们的模型表现出优于静态生存模型的性能随时间的变化。
结论
对于重症监护病房的脓毒症患者来说,血小板计数的快速下降是一个重要的预后因素,连续的血小板测量与预后相关。
AI补充
联合潜在类别模型(Joint Latent Class Model,简称JLCM)是一种统计模型,用于识别和描述数据中的不同潜在子群体。这种模型特别适用于存在异质性(即不同个体或对象在某些特征上表现出不同行为或模式)的情况,可以帮助研究者揭示数据中的复杂结构。
JLCM的核心思想是将数据中的个体根据某些特征划分为不同的潜在类别,每个类别内部的个体在这些特征上具有相似的行为或模式,而不同类别之间则表现出明显的差异。这种模型结合了潜在类别分析(Latent Class Analysis,LCA)和混合效应模型(Mixed Effects Model)的优点,能够同时处理分类变量和连续变量,以及它们之间的相互作用。
在JLCM中,通常包括以下几个步骤:
子群体识别:使用潜在类别分析来识别数据中的不同子群体。这通常涉及到选择最佳的类别数量,这可以通过信息准则(如AIC、BIC)和熵(Entropy)等统计量来确定。
轨迹建模:对于每个潜在类别,建立一个混合效应模型来描述个体在连续变量上的变化轨迹。这些轨迹可以帮助我们理解不同子群体在时间序列上的行为模式。
模型评估和比较:通过比较不同模型的性能(如C-index、AUC值等),来评估模型的预测能力和区分度。
个体预测:将模型应用于个体数据,进行动态预测。这意味着模型可以根据个体在特定时间点的数据来预测其未来的状态或结果。
在上述文献摘要中,JLCM被用来识别具有不同血小板轨迹的子群体,并评估这些轨迹与患者的生存概率之间的关系。通过这种模型,研究者能够识别出具有不同临床特征和预后的患者群体,从而为临床决策提供更精确的信息。
背景
败血症是一种由感染引起的生命威胁性疾病,由于宿主反应失调,导致全身性炎症、组织损伤和器官功能衰竭。它也是重症监护病房(ICU)入院和死亡的主要原因之一。血小板在凝血、炎症和免疫反应中起着关键作用,所有这些都与败血症的发生、发展和预后有关。先前的研究显示,ICU住院期间血小板计数降低与败血症患者死亡风险增加相关,而ICU入院后血小板计数动态轨迹模式与死亡之间的关联已受到广泛研究。败血症患者往往表现出血小板异常激活和过度消耗,随后导致血小板减少,从而增加出血风险。多项研究结果描述了败血症患者血小板计数早期变化的预后价值 。然而,从日常临床实践中收集的血小板计数反复测量轨迹与败血症患者预后之间的关系尚不清楚。 本研究旨在利用联合潜在类模型(JLCM)识别异质性血小板计数轨迹,该模型整合了潜在类混合模型和生存模型,并探索血小板动态与不利预后之间的关系。
方法
研究设计和人群
这项研究是一个基于eICU合作研究数据库(eICU-CRD)v2.0和医学信息集成治疗中心IV(MIMIC-IV)v2.0数据库数据的多队列、回顾性、观察性研究,可在PhysioNet(认证号:49953233)获取。我们提取了在ICU入院前24小时或后48小时被诊断为脓毒症的患者,与一项先前研究一致,排除了符合以下任何标准的患者:(1)重复ICU入院;(2)年龄<18岁;(3)ICU住院时间<24小时;(4)缺乏基线.血小板计数;以及(5)入住ICU后28天内小于2次的血小板计数测量。最终,在我们的分析中包括来自eICU-CRD的11,016名ICU脓毒症患者和来自MIMICIV的7,796名患者。来自eICU-CRD的患者被包括在发现集中,而来自MIMIC-IV的脓毒症患者被包括在验证集中。
实验室测量和临床特征
进入ICU后连续28天测量的血小板计数数据来自两个数据库。我们提取了包括人口统计学信息、实验室检测、生命征象、合并症和ICU住院期间的干预在内的变量。
结果
结果是在住院28天内的存活状态和相应的存活时间。存活时间被定义为从ICU入院到研究结束时的死亡或失访,以先发生者为准。在28天内出院或28天后仍存活的患者被视为被删失。
统计分析步骤
1:亚群体的识别
JLCM
用于识别eICU-CRD
中具有异质性血小板轨迹的亚群体。对于纵向模型,拟合了一个潜在类混合模型。我们使用了一个具有基线危险功能的参数生存模型,该基线危险函数遵循特定类的Weibull
分布。基线血小板、急性生理评分III和
Charlson共病指数(CCI)被包括为协变量。最佳类别数由
Akaike信息准则(AIC)、贝叶斯信息准则(BIC)、样本调整
BIC(SABIC)和熵`确定。R软件包lcmm用于建模。
轨迹可视化
我们比较了四类中的实验室测量和临床特征。相应的轨迹模式以及Kaplan-Meier(KM)曲线。此外,我们使用分段Cox回归模型估计了时间相关的风险比(HR);生成时间间隔的分割点是通过搜索最高对数似然值来确定的。
模型评估和比较
JLCM可以在随访的给定天数(地标时间)动态地估计生存概率,直至此后的任何时间点,因此该模型可用于动态预测。我们将从第一步开发的模型与使用相同的协变量(包括APSIII、CCI和基线血小板计数)的weibull生存模型进行比较。从ICU入院的第一天到第14天之间的每一天被定义为一个地标时间点。在地标时间点仍然存活的患者中,来自地标时间点到第28天的预测概率分别来自两个模型。在地标时间点之前经历结果的患者被排除在该特定.
我们使用时间相关的接收者操作特性曲线下面积(AUC),一致性指数(C指数),准确度,敏感度和特异度在不同的标志时间来评估动态预测模型的性能。通过2000次bootstrap获得AUC和C指数的95%置信区间,通过在每个标志时间2000次的排列测试进行比较。
个体预测
对于个体动态预测,该模型在两名患者中应用。此外,我们在个体预测设置下将Weibull生存模型与我们的模型进行了比较。对于连续变量,使用Kolmogorov-Smirnov检验来检验正态性。正态分布的连续变量用均值和标准偏差(SD)表示。组间比较使用t检验或方差分析进行。对于非正态分布的数据,使用中位数和四分位数范围;根据组数使用Mann-Whitney检验和Kruskal-Wallis检验进行组间比较。双侧P值<0.05被认为具有统计学意义。数据使用PostgreSQL14提取,所有统计分析都使用R(版本4.1.2)进行。统计方法的详细描述在补充方法文件中提供。
结果
我们分析了来自eICUCRD的总共11,016例脓毒症患者,其中19.4%(2,138例患者)在出院前死亡。对于MIMIC-IV,7796例患者符合排除标准,而19.3%(1,507例患者)在住院期间死亡。图1说明了患者排除过程,表1总结了基线特征。
使用JLCM鉴定亚群体。在表2中显示了拟合优度模型的度量标准,包括JLCM的最大对数似然、AIC、SABIC和熵,而类别的最佳数量从1到6预先确定。随着类别数量的增加,我们观察到最大对数似然、AIC和SABIC持续减小。一个包含四个类别的模型展现出最高的熵,因此被认为是最适合的模型,最大对数似然为-356,005.9,AIC为712,079.8,SABIC为712,220.2。每个类别的平均后验概率在表S2中呈现(请参阅在线补充材料),而每个类别在阈值以上的后验概率在表S3中呈现(请参阅在线补充材料)。
我们还展示了在不同时间段内四个类别的血小板测量值的变化,以及基于这些测量值的预测生存概率。我们调整了四组的基线APSIII和CCI,以确保一致性。我们发现随着模型中包含更多的血小板测量值,四个类别的预测概率开始出现分歧。在大约1周的血小板测量后,预测的生存概率曲线的情况与实际的生存曲线一致(图3)。
基于分段Cox模型的时间相关HR
KM曲线显示在eICU-CRD和MIMIC-IV中四个类别之间不同的死亡风险(见在线补充资料图S1a,b)。交叉生存曲线表明潜在的违反比例危险(P < 0.001)。我们利用分段Cox回归来考虑时间变化的系数。我们比较了不同时间分割点的模型,然后选择具有最高对数似然的模型,并确定了第3天的最佳分割点(图S2,见在线补充资料)。
分段Cox模型的结果显示,第3类的危险比最高,为13.86(95%CI:7.42-25.92)。头3天。从第3天到第28天,4群的风险最高(HR:6.09,95%CI:4.68–7.92),与其他三个群相比(表3)。这一结果与里程碑KM曲线的结果一致(图2a)。3群的患者在ICU入院的头3天经历了血小板计数急剧下降。基线血小板较低的患者的计数很快就低于正常范围。从第3天开始,3群患者的血小板计数开始上升,并保持在150×109/L以上的稳定水平,而4班的血小板计数保持在稍低于150×109/L的稳定水平。在验证集中观察到类似的结果(图2c)。
四个类别的临床特征
在两个数据集中,四个潜在类别的基线特征比较见于表S6和S7(请参阅在线补充材料)。在分段Cox模型中,我们发现类别3和类别4在早期和后期阶段的风险最高。值得注意的是,尽管两组患者在ICU入院后显示出血小板计数下降的趋势,但下降幅度有所不同。我们比较了ICU入院后两组患者出现血小板减少和严重血小板减少的时间,并发现类别4患者比类别3患者更晚出现上述状况,并在第3天后死亡风险更高。
亚组分析
我们按人口统计学、生命支持方式和合并症进行了一系列分层分析。在这两个数据库中,脓毒症患者的轨迹分级与 28 天死亡率之间的关联在不同的分层中都得到了验证(图 S3 和 S4,见在线补充材料)。在发现集中,我们观察到分级与血小板输注之间存在显著的交互作用,分级 3 的交互作用 PInteraction = 0.035,分级 4 的交互作用 PInteraction = 0.001。在验证集中,仅在 2 类中观察到这种相互作用,PInteraction = 0.013。
模型评估和比较
在训练集中,动态预测模型在第 1 天的地标时间获得了 0.713(95% CI:0.702-0.725)的 C 指数,而 Weibull 模型获得了 0.714(95% CI:0.702-0.726)的 C 指数。两个模型的外部验证结果相似,动态预测模型在第 1 天的 C 指数为 0.739(95% CI:0.726-0.751),而 Weibull 模型的 C 指数为 0.741(95% CI:0.727-0.754)。
在 14 个地标时间点上,两个模型的 C 指数值均在 0.70 左右,与时间相关的 AUC 值均在 0.60 左右。然而,随着地标时间的增加,这些数值逐渐下降。值得注意的是,与 Weibull 模型相比,动态预测模型的 AUC 值和 C-index 值随时间的下降速度较慢。这一结果表明,当预测开始时间与变量测量时间(如基线)之间存在时间差时,动态预测模型的分辨能力优于 Weibull 模型(图 S5 和 S6,见在线补充材料)。
我们计算了两个模型在 14 个标志性时间点的其他性能指标,包括准确性、灵敏度和特异性。结果显示,动态预测模型具有更好的准确性和特异性(图 S7-S9,见在线补充材料)。
个体动态预测
我们从 MIMIC-IV 中抽取了两名患者,评估了动态预测模型和 Weibull 生存模型的个体生存概率预测性能。从入住重症监护室后 48 小时到 14 天,每 3 天计算一次生存概率(图 4)。病例 1 是一名 55 岁的男性,在重症监护室住了 28 天而没有死亡。他入院时 APS III 值为 160,CCI 值为 3,基线血小板计数为 136×109 /l。他的血小板计数在最初 48 小时内相对稳定,之后开始急剧上升。由于该患者的基线 APS III 较高,因此这两个模型在 48 小时内的 28 天生存概率都较低。然而,在加入更多的血小板测量指标后,动态预测模型能够提高存活概率。
病例 2 是一名 66 岁的女性,入住重症监护室 18 天后死亡。她的 APS III 评分为 86 分,CCI 为 13 分,基线血小板计数为 132×109 /l。她的血小板轨迹在最初 48 小时内有所波动,之后稳步下降,在第 8 天左右稳定在较低水平。由于基线 CCI 较高,这两个模型在 48 小时的标志时间内返回的 28 天存活概率都较低。动态预测模型考虑到了纵向血小板计数,因此比 Weibull 模型提供了更准确的预测。
敏感性分析
由于 eICU-CRD 中有关血液培养的数据有限,我们无法严格按照 Sepsis-3[18] 提取患者。为确保两个数据库中患者选择标准的一致性,我们使用相同的国际疾病分类(ICD)代码从两个数据集中提取数据。我们还从 MIMIC-IV 数据库中提取了符合败血症-3 标准的人群进行敏感性分析,结果仍然相似(表 S8 和 S9,图 S10-S12,见在线补充材料)。
最新课程-基于R语言的动态预测模型课程-胖子老师独自授课
开课目的及前言
预测模型作为真实世界研究的重要组成部分,其研究被广泛开展。但是,传统的预测模型利用基线数据对最终的生存结果进行预测,这种模型无法纳入患者在后续随访中可能会动态变化的重要数据(比如肿瘤标记物的动态变化)。 以上情况在统计学中会产生估计偏差情况,也是不符合临床实际的。近年来发展起来的动态预测模型方法,利用患者的多次随访数据,结合患者的基线数据,对最终患者的额生存结果(或类似的time to event事件)进行估计。其发文量呈现快速增长趋势。
在临床实际中,医生会根据患者的动态变化指标做出进一步诊断及治疗的判断。动态预测模型结合患者的纵向数据与最终的生存结果,对于最终结果进行更加准备的预测。由于当前R语言在医学统计工作中占据重要地位,但很多临床大夫、护士因为时间工作关系很难将R语言与临床科研相结合,故开设R语言动态预测模型课程,旨在快速让学员掌握统计工作中常用到的R语言,助力临床科研工作。天企助力(天津)生产力促进有限公司特举办“基于R语言的动态预测模型课程培训班”。
预测模型类文章目前总结起来发展经历了以下三个阶段:
基于传统流行病学的列线图模型(本质都是cox回归及glm回归),简单的统计学分析模型,是模型依赖的方法,临床上实际情况很难满足其前提假设,实际效果不好。
基于机器学习/深度学习的预测模型的构建(在数据上提高了维度,在算法上引入了机器学习),虽然算法上引入了机器学习模型,处理数据更加灵活,模型的假设也更少。但是在使用的数据上还是患者的一次基线数据进行预测,与临床实际不符。
基于纵向数据的动态预测模型(基于纵向多次随访数据,模型应用联合模型等动态预测模型方法),应用患者的多次随访数据对最终的生存结果进行预测,从数据和方法上都更类似于临床实际。
考虑到动态预测模型有以下特点,因此必然是后续高分文章的必备方法:
数据上必须有同一个患者的多次随访数据,相对于既往横断面一次基线数据,数据的收集难度更大,而且动态预测模型需拟合纵向的线性混合模型,因此需要的数据量较大。这就提示我们如果能收集到如上数据更加容易发高分文章。
应用方法学动态预测模型需首先掌握普通生存分析及普通预测模型的方法,并且还需要熟悉纵向数据分析的广义线性混合模型,再次基础上还需要掌握tidyverse语法基础来将自己的数据转换为满足函数要求的纵向数据,另外对于联合模型,模型的结合形式及变量选择也均需要从临床背景及统计学方法考虑。
近期高分文章举例
授课老师
灵活胖子-独自
双一流学校肿瘤学博士毕业,目前就职于国内五大肿瘤中心之一。科研方向为真实世界研究,生物信息学分析及人工智能研究。目前以第一或共同第一作者身份发表SCI论文10余篇,累计IF50+。目前与国内多个院校及医院有科研合作。联合翻译小组同学,在国内第一次将jmbayes2及dynamicLM全文翻译为中文并在公众号发表。
课程目录及安排
授课形式及时间
授课形式:远程在线实时直播授课。
授课时间:2024年12月开课,总课时不少于30小时,每周进行3-5小时的授课,有充分时间学习,预计6-8周完成所有授课内容。
答疑支持:建立课程专属微信群,1年内课程内容免费答疑。
视频回看:3年内免费无限次回看。
课程售价及售后保证
课程售价:总价3000元,报名可先交300元预定即可,开课后2周内交齐即可
对公转账等手续务必提前联系助教
承办公司:天企助力(天津)生产力促进有限公司
奖励政策:学员应用所学内容发表IF 10+文章可退还学费(具体要求及流程需要咨询助教)