一、写在前面
各位好友,真的是好久不见。
本期是一次对sci文献的分享,该文献展示了如何对一份患者自我报告结局纵向数据进行分析,里面用到了增长混合模型(Growth mixture model,GMM)。
可能有些朋友对此比较陌生,但想必对当下护理领域时髦的潜变量增长模型(LGM)或潜类别增长模型(LCGM)有所了解吧?GMM就是潜变量增长模型与潜在类别模型的结合体,而潜类别增长模型则是GMM的特例,当假定GMM群组内个体无异质性时,GMM变为潜类别增长模型。言下之意就是GMM是一种更通用的变化轨迹或群组轨迹分析模型。下面,我们跟着文献一起学习吧~
二、文献分享
本次分享的文献是《Growth mixture models: a case example of the longitudinal analysis of patient‐reported outcomes data captured by a clinical registry》,发表在《BMC Med Res Methodol》杂志,第一作者来自不列颠哥伦比亚大学护理学院。
1、研究背景:
在许多纵向患者报告结果 (PRO) 数据分析中,一个假设是只有一个人群遵循单一的健康轨迹。增长混合建模(GMM)可以识别和评估患者健康结果的多个未观察到的轨迹。该文描述了对心房颤动 (AF) 门诊患者临床登记处捕获的纵向 PRO 数据进行 GMM 分析的过程。
2、研究方法:
该文描述了建模方法和一些需要特别注意的方法学问题,包括 (a) 确定时间指标;(b) 指定 GMM; (c) 包括已确定的潜在类别(具有不同轨迹的患者群体或亚型)成员的预测因子。提供了对 2008 年至 2016 年间收集的 PRO 数据(患者对心房颤动对生命质量的影响 (AFEQT) 问卷的反应)的纵向分析。
3、研究结果:
在确定时间指标时,需要多个过程来确保“时间”考虑到所采取的措施数量和这些措施之间的间隔的可变性,同时考虑测量发生的频率和时间。在指定 GMM 时,收敛问题(导致模型估计不可靠的常见问题)需要约束参数探索技术。为了识别潜在类的预测变量,选择了 3 步(逐步)方法,使得添加预测变量不会改变类成员本身。
4、研究结论:
GMM 可以成为一种有价值的工具,用于对以前在实际应用中未观察到的多个独特的 PRO 轨迹进行分类。然而,它们的使用需要模型构建基础过程的高度透明度,因为它们可以直接影响结果,从而影响其解释。
5、更多细节
(1)主要结局指标:
PRO的主要指标是心房颤动对生活质量的影响(AFEQT)问卷得分,该问卷由20个项目组成,评估四个领域:症状(4项)、日常活动(8项)、治疗问题(6项)和治疗满意度(2项)。
(2)GMM模型图(3个时间点、连续变量):
(3)确定时间指标:
准备纵向分析的第一步是使用各种图形技术,包括流程图、时间序列和平滑曲线图,以获得 PRO 数据收集的概况。
流程图
重复测量时间间隔图(随机抽取40例),明显时间间隔不等,无法用传统分析方法
按随访次数划分的 AFEQT 问卷分数平滑曲线图(阴影部分是置信区间)
趋势混合图(下图是问卷的数量随时间变化图;上图是AFEQT得分随时间变化图)
从上面的系列图形可以看到:PRO问卷评分的变化可能受到临床相关过程的影响,当患者遵循特定的治疗方案时,以及与时间相关的过程,当病情较重的患者可能被诊所跟踪了更长的时间。因此,时间指标必须考虑个体变化的观察时间,这是指以不同的时间间隔而不是均匀间隔的时间间隔。
(4)拟合增长混合物模型
该文做了一些检查,拟合了一系列模型。为了在 GMM 规范之前确定最佳基线模型,该文使用4个时间点进行了几个单组 LCGA。这些模型包括仅截距模型、线性模型和二次模型。仅截距模型表示 AFEQT 问卷分数的初始(基线)水平,而线性模型包括 AFEQT 问卷分数的线性变化(即斜率)。对于二次模型,在线性模型中添加了一个额外的潜在变量,以估计非线性模式。各模型的拟合指标如下:
LCGA模型的BIC和SABIC表明,二次模型比仅截距模型或线性模型更好地拟合数据,但在2个潜类别的GMM中表现一般,作者认为可能是样本量不足导致的。
对于GMM而言,样本量其实没有什么所谓的“最好的计算方法”,该文认为:“充分”的样本量很难确定,因为它取决于模型的规范、变量的分布、缺失数据的数量以及变量之间关系的强度。一般来说,大样本量(≥500)通常被认为最适合复杂的混合模型(注意,这里是说单个时间点的样本量)。
此外,该文仅拟合了3个时间点的数据,所以选择的是线性增长模型。
(5)纳入预测变量
一旦确定了最终的GMM,就可以检查解释亚组已确定轨迹(潜在类别)变异性的预测因子。有两种通用方法:一步法(联合模型估计)方法和三步法(逐步估计法)。前者肯定很好(一步到位),但加入预测变量会影响模型分类结果,后者是学者们(包括mplus开发者)更推荐的方法。
为了应用三步法,该文使用了Mplus 8.3版本中的R3STEP方法进行了双变量和多变量逻辑回归分析。
ok,本期的文献分享到此结束,关于增长混合模型的实操,我们预计会在近期分享,敬请期待!
参考文献:
Kwon JY, Sawatzky R, Baumbusch J, Lauck S, Ratner PA. Growth mixture models: a case example of the longitudinal analysis of patient-reported outcomes data captured by a clinical registry. BMC Med Res Methodol. 2021 Apr 21;21(1):79. doi: 10.1186/s12874-021-01276-z. PMID: 33882863; PMCID: PMC8058975.
封面与正文图片均来源于上述参考文献,仅供学习分享使用,不做任何商业用途,如有侵权,请联系我们删除,谢谢。
小提醒:如果你在科研学习中遇到了疑问,恰好也想跟网友们交流,可以加入我们建立的“护理科研交流群”。这是一个完全自由、开放、免费、没有套路的纯交流群。入群方式:私信发送关键词“加群”。