SCI分享！利用增长混合模型对患者报告结局数据进行纵向分析

文摘科学 2024-06-03 20:51 湖南

由于微信推送机制的变化，建议大家将公众号标记为星标，如此才能及时收到我们的更新，同时也希望大家能帮忙点点赞和转发，你们的支持是我们前进的重要动力来源，谢谢！

护理统计随笔平台的内容现在已经非常丰富，很多方面都有涉及到，如果你觉得你没有看到往期的相关文章，不妨打开公众号的菜单页，在各级目录中查找你想要的内容。

一、写在前面

各位好友，真的是好久不见。

本期是一次对sci文献的分享，该文献展示了如何对一份患者自我报告结局纵向数据进行分析，里面用到了增长混合模型（Growth mixture model，GMM）。

可能有些朋友对此比较陌生，但想必对当下护理领域时髦的潜变量增长模型（LGM）或潜类别增长模型（LCGM）有所了解吧？GMM就是潜变量增长模型与潜在类别模型的结合体，而潜类别增长模型则是GMM的特例，当假定GMM群组内个体无异质性时，GMM变为潜类别增长模型。言下之意就是GMM是一种更通用的变化轨迹或群组轨迹分析模型。下面，我们跟着文献一起学习吧~

二、文献分享

本次分享的文献是《Growth mixture models: a case example of the longitudinal analysis of patient‐reported outcomes data captured by a clinical registry》，发表在《BMC Med Res Methodol》杂志，第一作者来自不列颠哥伦比亚大学护理学院。

1、研究背景：

在许多纵向患者报告结果（PRO）数据分析中，一个假设是只有一个人群遵循单一的健康轨迹。增长混合建模（GMM）可以识别和评估患者健康结果的多个未观察到的轨迹。该文描述了对心房颤动（AF）门诊患者临床登记处捕获的纵向 PRO 数据进行 GMM 分析的过程。

2、研究方法：

该文描述了建模方法和一些需要特别注意的方法学问题，包括（a）确定时间指标；（b）指定 GMM；（c）包括已确定的潜在类别（具有不同轨迹的患者群体或亚型）成员的预测因子。提供了对 2008 年至 2016 年间收集的 PRO 数据（患者对心房颤动对生命质量的影响（AFEQT）问卷的反应）的纵向分析。

3、研究结果：

在确定时间指标时，需要多个过程来确保“时间”考虑到所采取的措施数量和这些措施之间的间隔的可变性，同时考虑测量发生的频率和时间。在指定 GMM 时，收敛问题（导致模型估计不可靠的常见问题）需要约束参数探索技术。为了识别潜在类的预测变量，选择了 3 步（逐步）方法，使得添加预测变量不会改变类成员本身。

4、研究结论：

GMM 可以成为一种有价值的工具，用于对以前在实际应用中未观察到的多个独特的 PRO 轨迹进行分类。然而，它们的使用需要模型构建基础过程的高度透明度，因为它们可以直接影响结果，从而影响其解释。

5、更多细节

（1）主要结局指标：

PRO的主要指标是心房颤动对生活质量的影响（AFEQT）问卷得分，该问卷由20个项目组成，评估四个领域：症状（4项）、日常活动（8项）、治疗问题（6项）和治疗满意度（2项）。

（2）GMM模型图（3个时间点、连续变量）：

（3）确定时间指标：

准备纵向分析的第一步是使用各种图形技术，包括流程图、时间序列和平滑曲线图，以获得 PRO 数据收集的概况。

流程图

重复测量时间间隔图（随机抽取40例），明显时间间隔不等，无法用传统分析方法

按随访次数划分的 AFEQT 问卷分数平滑曲线图（阴影部分是置信区间）

趋势混合图（下图是问卷的数量随时间变化图；上图是AFEQT得分随时间变化图）

从上面的系列图形可以看到：PRO问卷评分的变化可能受到临床相关过程的影响，当患者遵循特定的治疗方案时，以及与时间相关的过程，当病情较重的患者可能被诊所跟踪了更长的时间。因此，时间指标必须考虑个体变化的观察时间，这是指以不同的时间间隔而不是均匀间隔的时间间隔。

（4）拟合增长混合物模型

该文做了一些检查，拟合了一系列模型。为了在 GMM 规范之前确定最佳基线模型，该文使用4个时间点进行了几个单组 LCGA。这些模型包括仅截距模型、线性模型和二次模型。仅截距模型表示 AFEQT 问卷分数的初始（基线）水平，而线性模型包括 AFEQT 问卷分数的线性变化（即斜率）。对于二次模型，在线性模型中添加了一个额外的潜在变量，以估计非线性模式。各模型的拟合指标如下：

LCGA模型的BIC和SABIC表明，二次模型比仅截距模型或线性模型更好地拟合数据，但在2个潜类别的GMM中表现一般，作者认为可能是样本量不足导致的。

对于GMM而言，样本量其实没有什么所谓的“最好的计算方法”，该文认为：“充分”的样本量很难确定，因为它取决于模型的规范、变量的分布、缺失数据的数量以及变量之间关系的强度。一般来说，大样本量（≥500）通常被认为最适合复杂的混合模型（注意，这里是说单个时间点的样本量）。

此外，该文仅拟合了3个时间点的数据，所以选择的是线性增长模型。

（5）纳入预测变量

一旦确定了最终的GMM，就可以检查解释亚组已确定轨迹（潜在类别）变异性的预测因子。有两种通用方法：一步法（联合模型估计）方法和三步法（逐步估计法）。前者肯定很好（一步到位），但加入预测变量会影响模型分类结果，后者是学者们（包括mplus开发者）更推荐的方法。

为了应用三步法，该文使用了Mplus 8.3版本中的R3STEP方法进行了双变量和多变量逻辑回归分析。

ok，本期的文献分享到此结束，关于增长混合模型的实操，我们预计会在近期分享，敬请期待！

参考文献：

Kwon JY, Sawatzky R, Baumbusch J, Lauck S, Ratner PA. Growth mixture models: a case example of the longitudinal analysis of patient-reported outcomes data captured by a clinical registry. BMC Med Res Methodol. 2021 Apr 21;21(1):79. doi: 10.1186/s12874-021-01276-z. PMID: 33882863; PMCID: PMC8058975.

封面与正文图片均来源于上述参考文献，仅供学习分享使用，不做任何商业用途，如有侵权，请联系我们删除，谢谢。

小提醒：如果你在科研学习中遇到了疑问，恰好也想跟网友们交流，可以加入我们建立的“护理科研交流群”。这是一个完全自由、开放、免费、没有套路的纯交流群。入群方式：私信发送关键词“加群”。

护理统计随笔

专注护理科研设计和统计分析。别人不会告诉你的干货，可以来这里找！

最新文章

护理科研选题的全新视角：离散选择实验

比随机森林强! 利用catboost做临床预测模型

顶刊都在用！基于LightGBM的临床预测模型实现方法

附详细的实操步骤：临床预测模型Meta分析（老歌新唱）

xgboost + shap可加性解释（R版本）：优秀的机器学习解决方案

还在做系统评价吗？证据图谱可以学起来了

还在纠结要不要做质性研究吗？Q方法了解下

轻松+愉快！在线版meta分析工具

这篇发在核心期刊的体位相关meta分析到底有何特色？

实操来了！轻松搞定预测模型类别不平衡问题

小白快速成长秘诀：看文献不要只看结果，要学会从中提炼未曾注意的细节！

我们正式开通一对一辅导、论文审稿与数据分析服务

预测模型小白入门：不平衡数据与处理方法

我们正式开通一对一辅导、论文审稿与数据分析服务

预测模型研究中，机器学习到底是怎么一回事？（小白入门版）

最后一波！我们组织的Meta分析小班课明日开课，请速度上车！

想学症状群轨迹分析的同学看过来！

我们自己组织的小班课来啦！Meta分析特训小班课！

护理北核！轻松搞定潜在剖面分析！（小白入门版）

我们自己组织的小班课来啦！Meta分析特训小班课！

纵向数据+风险预测模型？这种思路很有意思

论文审稿/数据分析，专业团队助你一臂之力

Meta分析难题：如何对图形数据进行提取？

小白优选！Meta分析特训班，欢迎零基础同学报名！

训练营来啦！Meta分析特训班，欢迎报名！

吐血整理!最新版护理类SCI期刊的影响因子来了！

有了这个工具，做meta分析速度起飞！

全体护理人员终于盼到了！报考在职研究生，专科起报！双证毕业！

风险预测模型：开发七个步骤和用于验证的 ABCD

论文审稿/数据分析，专业团队助你一臂之力

小白系列：方案构建及应用竟然如此简单？对中华护理杂志文献的解读

小白系列：如何撰写随机对照试验护理论文——基于中华护理杂志文献

小白系列：通过拆读中华护理杂志的文献，带你入门网络分析！

Meta杀手锏！Meta分析之数据转化（一）

SCI分享！利用增长混合模型对患者报告结局数据进行纵向分析

国内护理系统评价的报告质量分析

主客体互倚模型看这篇就够了！附完整流程

一种非常棒的研究思路，推荐给大家

潜变量增长模型——基于Mplus软件的实现方法

研究生第10节课：医学研究中常见的综述类型

纵向研究之变化轨迹：R语言实现

各有千秋！利用三种主流统计软件建立线性混合效应模型

利用NHANES数据库发SCI？这个方法太火了（一）

非常不错的思路，纵向研究变化轨迹还可以这样分析？

Meta分析的统计异质性检验，你真的能解读清楚吗？

又见轨迹研究？潜类别增长模型分析步骤

一区TOP征稿：Prediction Models and Clinical Outcomes

还在手动做描述统计和单因素分析？这个方法不错

2区SCI！使用贝叶斯核机回归进行NHANES数据库分析

PROSPERO注册平台快速注册小秘籍

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉