SCI期刊的没有时间去截图,但相比对这方面感兴趣的老师应该是比较清楚的,我们也经常会看到某些公众号在推送关于这方面的新研究,笔者也总能看到某某研究团队又用轨迹分析方法发了顶刊或者顶刊的子刊,等等。
轨迹研究是啥呢?就本期的主题而言,是指对某些变量的纵向分析,你想,重复测量多次,是不是能画出该变量均值的变化轨迹呢?均值层面的重复测量数据可以用我们常用的统计方法来做,比如:
重复测量方差分析(均值);
广义估计方程(均值或个体);
混合效应模型(均值或个体);
这几种方法估计大家已经很熟悉了,且也是纵向数据分析领域的主流方法。当然,我们这里所谈的轨迹并不是这样做的。上述统计模型虽然都很棒,但是并没有融入群组的思想。
也就是说,其实我们所研究的变量(举个例子:心理弹性评分)总体之间是有异质性的,但是研究全部的个体又会非常的零散,有些个体的心理弹性评分随时间的发展趋势并不总是没有共性的(换言之,某些个体的发展趋势可能是相同的,而另一些可能也是,故形成了群组,或者说类别)。
所以,一些潜变量建模方法就被提出来了。这就是今晚的主角,潜类别增长模型( Latent Class GrowthAnalysis,LCGA)或者叫组轨迹模型(Group-based trajectory modelling, GBTM),这里就回答了我们一些群友的问题:“潜类别增长模型与组轨迹模型有区别吗?” ——翻译不同。
下面是以前发布的内容,分享给还没有读过这篇文章的老师和朋友,时间仓促,就不精修了,对轨迹分析有兴趣朋友可以读一读。后面,我们还会更新类似的内容。
具体代码(可直接复制):
TITLE: LCGA简单示例
DATA: FILE IS ex8.1.dat;
VARIABLE:
NAMES ARE y1-y4 x;
USEVARIABLES ARE y1 y2 y3 y4;
CLASSES = c(2);
ANALYSIS:
TYPE = MIXTURE;
STARTS = 100 10;
Processor= 2;
LRTBOOTSTRAP=200;!获得更准确的LRT估计
MODEL:
%OVERALL%
i s | y1@0 y2@1 y3@2 y4@3;
i@0 s@0;!设定增长因子方差为0
OUTPUT: TECH11 TECH14;
plot:
Type is Plot3;
Series = y1 y2 y3 y4(*);
Savedata: SAVE=CPROB;
FILE IS testLCGA.txt;
下面笔者对这些指令做了逐行解释:
1、标题,可有可无;
TITLE: LCGA简单示例
2、指定数据文件
本例数据文件名为ex8.1.dat。
DATA: FILE IS ex8.1.dat;
3、指定变量:
NAMES ARE 用来对数据文档中的每列数据取个变量名,用于后续分析。
USEVARIABLESARE 用来指定本次分析使用了哪些变量。
CLASSES = c(2) 用于做潜在类别分析;(2)表示分2类;后面还需要按照1~6个类别依次做分析,以确定最佳模型。
VARIABLE:
NAMES ARE y1-y4 x;
USEVARIABLES ARE y1 y2 y3 y4;
CLASSES = c(2);
4、指定分析类型:
TYPE = MIXTURE 用于指定本次分析的类型,LCGA属于混合模型,因此选择MIXTURE。
STARTS的作用:避免局部最大化解,增加随机起始值数;
Processor= 2:混合模型计算量略大,指定使用多个处理器(cpu),节省等待时间。
LRTBOOTSTRAP=200:是为了获得更准确的LRT估计
ANALYSIS:
TYPE = MIXTURE;
STARTS = 100 10;
Processor= 2;
LRTBOOTSTRAP=200;!获得更准确的LRT估计
5、指定模型细节:
i是截距因子,s是斜率因子,y1 y2 y3 y4分别是结局变量在四个时间点的测量值,也是我们要研究的对象
本例中@用于设置变量的时间分值(即增长因子的负荷),将y1-y4依次设置为0,1,2,3,代表含有4次测量的线性增长模型。
i@0 s@0 表示设定增长因子方差为0,因为LCGA的假设之一就是同类别下个体是同质的,即变化轨迹相同。
MODEL:
%OVERALL%
i s | y1@0 y2@1 y3@2 y4@3;
i@0 s@0;!设定增长因子方差为0
6、选择输出模板
LCGA一般选择TECH11 TECH14,与潜在类别模型的选择一致。
OUTPUT: TECH11 TECH14;
7、画图并保存结果
略,复制粘贴即可(注意把y1 y2 y3 y4改为自己的变量名)
plot:
Type is Plot3;
Series = y1 y2 y3 y4(*);
Savedata: SAVE=CPROB; !保存后验概率
FILE IS testLCGA.txt; !保存为文件testLCGA.txt
执行上述全部代码,需要等待30s或者1分钟,软件会直接输出结果,下一步就是对结果进行解读。
三、Mplus分析结果
结果与潜在类别模型的输出结果是很相似的,这点从输出的设置就可以看出来。分析思路依旧是先根据信息指数和多种检验结果确定最优拟合模型,即选取最适合的潜类别个数,再通过截距因子和斜率因子对具体的结果做专业解读。
1、确定最优模型
最优拟合模型确定方法笔者在往期的文章中介绍过,本次仅对上述指标的所在位置做一简单介绍,其余信息请阅读往期内容:Mplus细节教程:快速上手潜在剖面分析
这里再附上之前分享过的论文,帮助大家对拟合指标有更清晰的认知(请看1.4部分)。
黄珂瑶,丁思妍,周海琴,等. 肺移植患者衰弱变化轨迹及影响因素研究[J]. 中华护理杂志,2023,58(9):1088-1095.
那么这些结果在哪里获取?看图。拟合指数:
模型估计的潜类别概率:
信息熵(entropy)和类别比例(即分类结果)
LMR检验结果
BLRT检验结果(更推荐)
注意,以上仅为假设有两个潜在类别的情况下的检验结果,实际上我们需要依次假设有1~6个类别,然后获取对应的检验结果,并根据结果确定最优模型。一般需要制作表,并在文章中汇报,类似下面这样的。
图片来自《潜变量建模与Mplus 应用·进阶篇》
推荐绘制一张类似于因子分析中的碎石图的BIC值变化图,方便查看拐点,可能更直观一些。下图x轴为类别数,y轴为BIC值。
图片来自《潜变量建模与Mplus 应用·进阶篇》
2、变化轨迹的分析
先获取截距与斜率因子:
3、绘图
做分析时已经添加了绘图指令,所以直接能得到mplus绘制的图。通过下面的步骤打开。
直接获取带有类别的变化轨迹图(很简陋,可以用别的工具画)。
3、专业解读
假设上述的2类别模型是最佳模型,可以考虑这样解读:
类别组1(红色线)共233人(占比xx%),截距和斜率的均值分别为0.821(p<0.01)和0.421(p<0.01),该组的起始值低且呈缓慢上升的趋势,将其命名为“xx组”。
类别组 2(蓝色线)共yy人(占比yy%),截距和斜率的均值分别为 2.916 (p<0.01),0.981(p<0.01),该组的起始值高且呈上升的趋势(上升速度更快),将其命名为“yy组”。
当然,这只是最简单的解读方式,因为没有真正去筛选最优模型,且没有设置协变量,这里可以参考上期解读的那篇论文(部分截图),看看实际场合中是如何对结果进行专业解读的。
黄珂瑶,丁思妍,周海琴,等. 肺移植患者衰弱变化轨迹及影响因素研究[J]. 中华护理杂志,2023,58(9):1088-1095.
以上均为笔者一家一言,可能有理解不当甚至解读错误的情况,欢迎批评指正。另外,我们申请了护理科研交流群,欢迎大家进群交流。(入群方式:私信后台,发送任何内容都可以获取二维码)。
本期分享就到,后续会考虑分享其他工具(R)的实现步骤,这里我们下期见。
参考资料:
部分内容参考自王孟成 毕向阳主编的《潜变量建模与Mplus 应用·进阶篇》
黄珂瑶,丁思妍,周海琴,等. 肺移植患者衰弱变化轨迹及影响因素研究[J]. 中华护理杂志,2023,58(9):1088-1095. DOI:10.3761/j.issn.0254-1769.2023.09.010.
封面截图自《中华护理杂志》