SCI分享!利用增长混合模型对患者报告结局数据进行纵向分析

文摘   科学   2024-06-03 20:51   湖南  
由于微信推送机制的变化,建议大家将公众号标记为星标,如此才能及时收到我们的更新,同时也希望大家能帮忙点点赞和转发,你们的支持是我们前进的重要动力来源,谢谢!
护理统计随笔平台的内容现在已经非常丰富,很多方面都有涉及到,如果你觉得你没有看到往期的相关文章,不妨打开公众号的菜单页,在各级目录中查找你想要的内容。

一、写在前面

各位好友,真的是好久不见。

本期是一次对sci文献的分享,该文献展示了如何对一份患者自我报告结局纵向数据进行分析,里面用到了增长混合模型(Growth mixture model,GMM)。

可能有些朋友对此比较陌生,但必对当下护理领域时髦的潜变量增长模型(LGM)或潜类别增长模型(LCGM)有所了解吧?GMM就是潜变量增长模型与潜在类别模型的结合体,而潜类别增长模型则是GMM的特例,当假定GMM群组内个体无异质性时,GMM变为潜类别增长模型。言下之意就是GMM是一种更通用的变化轨迹或组轨迹分析模型。下面,我们跟着文献一起学习吧~

二、文献分享

本次分享的文献是《Growth mixture models: a case example of the longitudinal analysis of patient‐reported outcomes data captured by a clinical registry》,发表在《BMC Med Res Methodol》杂志,第一作者来自不列颠哥伦比亚大学护理学院。

1、研究背景:

在许多纵向患者报告结果 (PRO) 数据分析中,一个假设是只有一个人群遵循单一的健康轨迹。增长混合建模(GMM)可以识别和评估患者健康结果的多个未观察到的轨迹。该文描述了对心房颤动 (AF) 门诊患者临床登记处捕获的纵向 PRO 数据进行 GMM 分析的过程。

2、研究方法:

该文描述了建模方法和一些需要特别注意的方法学问题,包括 (a) 确定时间指标;(b) 指定 GMM; (c) 包括已确定的潜在类别(具有不同轨迹的患者群体或亚型)成员的预测因子。提供了对 2008 年至 2016 年间收集的 PRO 数据(患者对心房颤动对生命质量的影响 (AFEQT) 问卷的反应)的纵向分析。

3、研究结果:

在确定时间指标时,需要多个过程来确保“时间”考虑到所采取的措施数量和这些措施之间的间隔的可变性,同时考虑测量发生的频率和时间。在指定 GMM 时,收敛问题(导致模型估计不可靠的常见问题)需要约束参数探索技术。为了识别潜在类的预测变量,选择了 3 步(逐步)方法,使得添加预测变量不会改变类成员本身。

4、研究结论:

GMM 可以成为一种有价值的工具,用于对以前在实际应用中未观察到的多个独特的 PRO 轨迹进行分类。然而,它们的使用需要模型构建基础过程的高度透明度,因为它们可以直接影响结果,从而影响其解释。

5、更多细节

(1)主要结局指标:

PRO的主要指标是心房颤动对生活质量的影响(AFEQT)问卷得分,该问卷由20个项目组成,评估四个领域:症状(4项)、日常活动(8项)、治疗问题(6项)和治疗满意度(2项)。

(2)GMM模型图(3个时间点、连续变量):

(3)确定时间指标:

准备纵向分析的第一步是使用各种图形技术,包括流程图、时间序列和平滑曲线图,以获得 PRO 数据收集的概况。

流程图

 重复测量时间间隔图(随机抽取40例),明显时间间隔不等,无法用传统分析方法

按随访次数划分的 AFEQT 问卷分数平滑曲线图(阴影部分是置信区间)

趋势混合图(下图是问卷的数量随时间变化图;上图是AFEQT得分随时间变化图)

从上面的系列图形可以看到:PRO问卷评分的变化可能受到临床相关过程的影响,当患者遵循特定的治疗方案时,以及与时间相关的过程,当病情较重的患者可能被诊所跟踪了更长的时间。因此,时间指标必须考虑个体变化的观察时间,这是指以不同的时间间隔而不是均匀间隔的时间间隔。

(4)拟合增长混合物模型

该文做了一些检查,拟合了一系列模型。为了在 GMM 规范之前确定最佳基线模型,该文使用4个时间点进行了几个单组 LCGA。这些模型包括仅截距模型、线性模型和二次模型。仅截距模型表示 AFEQT 问卷分数的初始(基线)水平,而线性模型包括 AFEQT 问卷分数的线性变化(即斜率)。对于二次模型,在线性模型中添加了一个额外的潜在变量,以估计非线性模式。各模型的拟合指标如下:

LCGA模型的BIC和SABIC表明,二次模型比仅截距模型或线性模型更好地拟合数据,但在2个潜类别的GMM中表现一般,作者认为可能是样本量不足导致的。

对于GMM而言,样本量其实没有什么所谓的“最好的计算方法,该文认为:“充分”的样本量很难确定,因为它取决于模型的规范、变量的分布、缺失数据的数量以及变量之间关系的强度。一般来说,大样本量(≥500)通常被认为最适合复杂的混合模型(注意,这里是说单个时间点的样本量)。

此外,该文仅拟合了3个时间点的数据,所以选择的是线性增长模型。

(5)纳入预测变量

一旦确定了最终的GMM,就可以检查解释亚组已确定轨迹(潜在类别)变异性的预测因子。有两种通用方法:一步法(联合模型估计)方法和三步法(逐步估计法)。前者肯定很好(一步到位),但加入预测变量会影响模型分类结果,后者是学者们(包括mplus开发者)更推荐的方法。

为了应用三步法,该文使用了Mplus 8.3版本中的R3STEP方法进行了双变量和多变量逻辑回归分析。


ok,本期的文献分享到此结束,关于增长混合模型的实操,我们预计会在近期分享,敬请期待


参考文献:

Kwon JY, Sawatzky R, Baumbusch J, Lauck S, Ratner PA. Growth mixture models: a case example of the longitudinal analysis of patient-reported outcomes data captured by a clinical registry. BMC Med Res Methodol. 2021 Apr 21;21(1):79. doi: 10.1186/s12874-021-01276-z. PMID: 33882863; PMCID: PMC8058975.

封面与正文图片均来源于上述参考文献,仅供学习分享使用,不做任何商业用途,如有侵权,请联系我们删除,谢谢。

小提醒如果你在科研学习中遇到了疑问,恰好也想跟网友们交流,可以加入我们建立的“护理科研交流群”。这是一个完全自由、开放、免费、没有套路的纯交流群。入群方式:私信发送关键词“加群”。

护理统计随笔
未来是精准护理的时代,护理研究的发展不仅在于基于证据的理论创新及实践,更在于大数据和人工智能。这里是一个从0到1的学习平台,关注我们,不但可以夯实科研基础,更可以开阔研究视野,让你的护理科研之路走得更远、更广。
 最新文章