又见轨迹研究？潜类别增长模型分析步骤

文摘 2024-05-11 21:39 湖南

由于微信推送机制的变化，建议大家将公众号标记为星标，如此才能及时收到我们的更新，同时也希望大家能帮忙点点赞和转发，你们的支持是我们前进的重要动力来源，谢谢！

护理统计随笔平台的内容现在已经非常丰富，很多方面都有涉及到，如果你觉得你没有看到往期的相关文章，不妨打开公众号的菜单页，在各级目录中查找你想要的内容。

一、更新

其实，这期的内容笔者在几个月以前就推送过，现在为什么会重复发布呢？倒也不是为了水推文，实在是架不住当前对轨迹研究的火热！

从SCI文章再到我们国内护理学TOP 1期刊——中华护理杂志，现在是动不动就发几篇轨迹研究论文（见下图），说不心动是假的，而且这种研究题材确实是很适合我们护理人研究。当然了，心理学领域的老师和朋友也是比较喜欢这类研究。从这点来看，两个专业其实就很有缘分了，哈哈。

SCI期刊的没有时间去截图，但相比对这方面感兴趣的老师应该是比较清楚的，我们也经常会看到某些公众号在推送关于这方面的新研究，笔者也总能看到某某研究团队又用轨迹分析方法发了顶刊或者顶刊的子刊，等等。

轨迹研究是啥呢？就本期的主题而言，是指对某些变量的纵向分析，你想，重复测量多次，是不是能画出该变量均值的变化轨迹呢？均值层面的重复测量数据可以用我们常用的统计方法来做，比如：

重复测量方差分析（均值）；

广义估计方程（均值或个体）；

混合效应模型（均值或个体）；

这几种方法估计大家已经很熟悉了，且也是纵向数据分析领域的主流方法。当然，我们这里所谈的轨迹并不是这样做的。上述统计模型虽然都很棒，但是并没有融入群组的思想。

也就是说，其实我们所研究的变量（举个例子：心理弹性评分）总体之间是有异质性的，但是研究全部的个体又会非常的零散，有些个体的心理弹性评分随时间的发展趋势并不总是没有共性的（换言之，某些个体的发展趋势可能是相同的，而另一些可能也是，故形成了群组，或者说类别）。

所以，一些潜变量建模方法就被提出来了。这就是今晚的主角，潜类别增长模型（ Latent Class GrowthAnalysis,LCGA）或者叫组轨迹模型（Group-based trajectory modelling, GBTM），这里就回答了我们一些群友的问题：“潜类别增长模型与组轨迹模型有区别吗？” ——翻译不同。

下面是以前发布的内容，分享给还没有读过这篇文章的老师和朋友，时间仓促，就不精修了，对轨迹分析有兴趣朋友可以读一读。后面，我们还会更新类似的内容。

二、Mplus实操

笔者从statmodel拿到了一份面板数据，于是以Mplus软件为工具，跟大家分享无条件（即无协变量）潜类别增长模型的具体建模步骤。

先看下数据，500行，6列，前四列是要研究的指标，属于计量资料（即连续型变量），每列代表1个时间点的测量值，具体信息未知（仅供练习，无实际意义），第五列是协变量x，本次分析时不会使用它，第六列同样不会使用。

因此，只需要知道该数据的样本量是500，测量次数是4次，指标为计量资料即可。

具体代码（可直接复制）：

TITLE:  LCGA简单示例       DATA:  FILE IS ex8.1.dat; VARIABLE:           NAMES ARE y1-y4 x;    USEVARIABLES ARE y1 y2 y3 y4;    CLASSES = c(2);
ANALYSIS:    TYPE = MIXTURE;    STARTS = 100 10;    Processor= 2;         LRTBOOTSTRAP=200;!获得更准确的LRT估计MODEL:    %OVERALL%  i s | y1@0 y2@1 y3@2 y4@3;  i@0 s@0;!设定增长因子方差为0OUTPUT:  TECH11 TECH14;plot:    Type is Plot3;    Series = y1 y2 y3 y4(*);    Savedata: SAVE=CPROB;    FILE IS testLCGA.txt;

下面笔者对这些指令做了逐行解释：

1、标题，可有可无；

TITLE:  LCGA简单示例

2、指定数据文件

本例数据文件名为ex8.1.dat。

DATA:  FILE IS ex8.1.dat;

3、指定变量：

NAMES ARE 用来对数据文档中的每列数据取个变量名，用于后续分析。

USEVARIABLESARE 用来指定本次分析使用了哪些变量。

CLASSES = c(2) 用于做潜在类别分析；（2）表示分2类；后面还需要按照1~6个类别依次做分析，以确定最佳模型。

VARIABLE:           NAMES ARE y1-y4 x;    USEVARIABLES ARE y1 y2 y3 y4;    CLASSES = c(2);

4、指定分析类型：

TYPE = MIXTURE 用于指定本次分析的类型，LCGA属于混合模型，因此选择MIXTURE。

STARTS的作用：避免局部最大化解,增加随机起始值数;

Processor= 2：混合模型计算量略大，指定使用多个处理器（cpu），节省等待时间。

LRTBOOTSTRAP=200：是为了获得更准确的LRT估计

ANALYSIS:    TYPE = MIXTURE;    STARTS = 100 10;    Processor= 2;         LRTBOOTSTRAP=200;!获得更准确的LRT估计

5、指定模型细节：

i是截距因子，s是斜率因子，y1 y2 y3 y4分别是结局变量在四个时间点的测量值，也是我们要研究的对象

本例中@用于设置变量的时间分值（即增长因子的负荷），将y1-y4依次设置为0,1，2,3，代表含有4次测量的线性增长模型。

i@0 s@0 表示设定增长因子方差为0，因为LCGA的假设之一就是同类别下个体是同质的，即变化轨迹相同。

MODEL:    %OVERALL%  i s | y1@0 y2@1 y3@2 y4@3;  i@0 s@0;!设定增长因子方差为0

6、选择输出模板

LCGA一般选择TECH11 TECH14，与潜在类别模型的选择一致。

OUTPUT:  TECH11 TECH14;

7、画图并保存结果

略，复制粘贴即可（注意把y1 y2 y3 y4改为自己的变量名）

plot:    Type is Plot3;    Series = y1 y2 y3 y4(*);    Savedata: SAVE=CPROB;  !保存后验概率    FILE IS testLCGA.txt;  !保存为文件testLCGA.txt

执行上述全部代码，需要等待30s或者1分钟，软件会直接输出结果，下一步就是对结果进行解读。

三、Mplus分析结果

结果与潜在类别模型的输出结果是很相似的，这点从输出的设置就可以看出来。分析思路依旧是先根据信息指数和多种检验结果确定最优拟合模型，即选取最适合的潜类别个数，再通过截距因子和斜率因子对具体的结果做专业解读。

1、确定最优模型

最优拟合模型确定方法笔者在往期的文章中介绍过，本次仅对上述指标的所在位置做一简单介绍，其余信息请阅读往期内容：Mplus细节教程：快速上手潜在剖面分析

这里再附上之前分享过的论文，帮助大家对拟合指标有更清晰的认知（请看1.4部分）。

黄珂瑶,丁思妍,周海琴,等. 肺移植患者衰弱变化轨迹及影响因素研究[J]. 中华护理杂志,2023,58(9):1088-1095.

那么这些结果在哪里获取？看图。拟合指数：

模型估计的潜类别概率：

信息熵（entropy）和类别比例（即分类结果）

LMR检验结果

BLRT检验结果（更推荐）

注意，以上仅为假设有两个潜在类别的情况下的检验结果，实际上我们需要依次假设有1~6个类别，然后获取对应的检验结果，并根据结果确定最优模型。一般需要制作表，并在文章中汇报，类似下面这样的。

图片来自《潜变量建模与Mplus 应用·进阶篇》

推荐绘制一张类似于因子分析中的碎石图的BIC值变化图，方便查看拐点，可能更直观一些。下图x轴为类别数，y轴为BIC值。

图片来自《潜变量建模与Mplus 应用·进阶篇》

2、变化轨迹的分析

先获取截距与斜率因子：

3、绘图

做分析时已经添加了绘图指令，所以直接能得到mplus绘制的图。通过下面的步骤打开。

直接获取带有类别的变化轨迹图（很简陋，可以用别的工具画）。

3、专业解读

假设上述的2类别模型是最佳模型，可以考虑这样解读：

类别组1（红色线）共233人(占比xx%)，截距和斜率的均值分别为0.821(p<0.01)和0.421(p<0.01),该组的起始值低且呈缓慢上升的趋势,将其命名为“xx组”。

类别组 2(蓝色线)共yy人(占比yy%)，截距和斜率的均值分别为 2.916 (p<0.01)，0.981(p<0.01)，该组的起始值高且呈上升的趋势（上升速度更快），将其命名为“yy组”。

当然，这只是最简单的解读方式，因为没有真正去筛选最优模型，且没有设置协变量，这里可以参考上期解读的那篇论文（部分截图），看看实际场合中是如何对结果进行专业解读的。

黄珂瑶,丁思妍,周海琴,等. 肺移植患者衰弱变化轨迹及影响因素研究[J]. 中华护理杂志,2023,58(9):1088-1095.

以上均为笔者一家一言，可能有理解不当甚至解读错误的情况，欢迎批评指正。另外，我们申请了护理科研交流群，欢迎大家进群交流。（入群方式：私信后台，发送任何内容都可以获取二维码）。

本期分享就到，后续会考虑分享其他工具（R）的实现步骤，这里我们下期见。

参考资料：

部分内容参考自王孟成毕向阳主编的《潜变量建模与Mplus 应用·进阶篇》

黄珂瑶,丁思妍,周海琴,等. 肺移植患者衰弱变化轨迹及影响因素研究[J]. 中华护理杂志,2023,58(9):1088-1095. DOI:10.3761/j.issn.0254-1769.2023.09.010.

封面截图自《中华护理杂志》

护理统计随笔

专注护理科研设计和统计分析。别人不会告诉你的干货，可以来这里找！

最新文章

护理科研选题的全新视角：离散选择实验

比随机森林强! 利用catboost做临床预测模型

顶刊都在用！基于LightGBM的临床预测模型实现方法

附详细的实操步骤：临床预测模型Meta分析（老歌新唱）

xgboost + shap可加性解释（R版本）：优秀的机器学习解决方案

还在做系统评价吗？证据图谱可以学起来了

还在纠结要不要做质性研究吗？Q方法了解下

轻松+愉快！在线版meta分析工具

这篇发在核心期刊的体位相关meta分析到底有何特色？

实操来了！轻松搞定预测模型类别不平衡问题

小白快速成长秘诀：看文献不要只看结果，要学会从中提炼未曾注意的细节！

我们正式开通一对一辅导、论文审稿与数据分析服务

预测模型小白入门：不平衡数据与处理方法

我们正式开通一对一辅导、论文审稿与数据分析服务

预测模型研究中，机器学习到底是怎么一回事？（小白入门版）

最后一波！我们组织的Meta分析小班课明日开课，请速度上车！

想学症状群轨迹分析的同学看过来！

我们自己组织的小班课来啦！Meta分析特训小班课！

护理北核！轻松搞定潜在剖面分析！（小白入门版）

我们自己组织的小班课来啦！Meta分析特训小班课！

纵向数据+风险预测模型？这种思路很有意思

论文审稿/数据分析，专业团队助你一臂之力

Meta分析难题：如何对图形数据进行提取？

小白优选！Meta分析特训班，欢迎零基础同学报名！

训练营来啦！Meta分析特训班，欢迎报名！

吐血整理!最新版护理类SCI期刊的影响因子来了！

有了这个工具，做meta分析速度起飞！

全体护理人员终于盼到了！报考在职研究生，专科起报！双证毕业！

风险预测模型：开发七个步骤和用于验证的 ABCD

论文审稿/数据分析，专业团队助你一臂之力

小白系列：方案构建及应用竟然如此简单？对中华护理杂志文献的解读

小白系列：如何撰写随机对照试验护理论文——基于中华护理杂志文献

小白系列：通过拆读中华护理杂志的文献，带你入门网络分析！

Meta杀手锏！Meta分析之数据转化（一）

SCI分享！利用增长混合模型对患者报告结局数据进行纵向分析

国内护理系统评价的报告质量分析

主客体互倚模型看这篇就够了！附完整流程

一种非常棒的研究思路，推荐给大家

潜变量增长模型——基于Mplus软件的实现方法

研究生第10节课：医学研究中常见的综述类型

纵向研究之变化轨迹：R语言实现

各有千秋！利用三种主流统计软件建立线性混合效应模型

利用NHANES数据库发SCI？这个方法太火了（一）

非常不错的思路，纵向研究变化轨迹还可以这样分析？

Meta分析的统计异质性检验，你真的能解读清楚吗？

又见轨迹研究？潜类别增长模型分析步骤

一区TOP征稿：Prediction Models and Clinical Outcomes

还在手动做描述统计和单因素分析？这个方法不错

2区SCI！使用贝叶斯核机回归进行NHANES数据库分析

PROSPERO注册平台快速注册小秘籍

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉