又见轨迹研究?潜类别增长模型分析步骤

文摘   2024-05-11 21:39   湖南  
由于微信推送机制的变化,建议大家将公众号标记为星标,如此才能及时收到我们的更新,同时也希望大家能帮忙点点赞和转发,你们的支持是我们前进的重要动力来源,谢谢!
护理统计随笔平台的内容现在已经非常丰富,很多方面都有涉及到,如果你觉得你没有看到往期的相关文章,不妨打开公众号的菜单页,在各级目录中查找你想要的内容。

一、更新
其实,这期的内容笔者在几个月以前就推送过,现在为什么会重复发布呢?倒也不是为了水推文,实在是架不住当前对轨迹研究的火热!
从SCI文章再到我们国内护理学TOP 1期刊——中华护理杂志,现在是动不动就发几篇轨迹研究论文(见下图),说不心动是假的,而且这种研究题材确实是很适合我们护理人研究。当然了,心理学领域的老师和朋友也是比较喜欢这类研究。从这点来看,两个专业其实就很有缘分了,哈哈。

SCI期刊的没有时间去截图,但相比对这方面感兴趣的老师应该是比较清楚的,我们也经常会看到某些公众号在推送关于这方面的新研究,笔者也总能看到某某研究团队又用轨迹分析方法发了顶刊或者顶刊的子刊,等等。

轨迹研究是啥呢?就本期的主题而言,是指对某些变量的纵向分析,你想,重复测量多次,是不是能画出该变量均值的变化轨迹呢?均值层面的重复测量数据可以用我们常用的统计方法来做,比如:

重复测量方差分析(均值);

广义估计方程(均值或个体);

混合效应模型(均值或个体);

这几种方法估计大家已经很熟悉了,且也是纵向数据分析领域的主流方法。然,我们这里所谈的轨迹并不是这样做的。上述统计模型虽然都很棒,是并没有融入群组的思想。

也就是说,其实我们所研究的变量(举个例子:心理弹性评分总体之间是有异质性的,但是研究全部的个又会非常零散,有些个体的心理弹性评分随时间的发展趋势并不总是没有共性的(换言之,某些个体的发展趋势可能是相同的,而另一些可能也是,故形成了群组,或者说类别)。

所以,一些潜变量建模方法就被提出来了。这就是今晚的主角,潜类别增长模型( Latent Class GrowthAnalysis,LCGA)或者叫组轨迹模型Group-based trajectory modelling, GBTM),这里就回答了我们一些群友的问题:“潜类别增长模型与组轨迹模型有区别吗?” ——翻译不同。

下面是以前发布的内容,分享给还没有读过这篇文章的老师和朋友,时间仓促,就不精修了对轨迹分析有兴趣朋友可以读一读。后面,我们还会更新类似的内容。

二、Mplus实操
笔者从statmodel拿到了一份面板数据,于是以Mplus软件为工具,跟大家分享无条件(即无协变量)潜类别增长模型的具体建模步骤。
先看下数据,500行,6列,前四列是要研究的指标,属于计量资料(即连续型变量),每列代表1个时间点的测量值,具体信息未知(仅供练习,无实际意义),第五列是协变量x,本次分析时不会使用它,第六列同样不会使用。
因此,只需要知道该数据的样本量是500,测量次数是4次,指标为计量资料即可。

具体代码(可直接复制):

TITLE:  LCGA简单示例       DATA:  FILE IS ex8.1.dat; VARIABLE:           NAMES ARE y1-y4 x;    USEVARIABLES ARE y1 y2 y3 y4;    CLASSES = c(2);
ANALYSIS: TYPE = MIXTURE; STARTS = 100 10; Processor= 2; LRTBOOTSTRAP=200;!获得更准确的LRT估计MODEL: %OVERALL% i s | y1@0 y2@1 y3@2 y4@3; i@0 s@0;!设定增长因子方差为0OUTPUT: TECH11 TECH14;plot: Type is Plot3; Series = y1 y2 y3 y4(*); Savedata: SAVE=CPROB;    FILE IS testLCGA.txt;                                          

下面笔者对这些指令做了逐行解释

1、标题,可有可无;

TITLE:  LCGA简单示例   

2、指定数据文件

本例数据文件名为ex8.1.dat。

DATA:  FILE IS ex8.1.dat;

3、指定变量:

NAMES ARE 用来对数据文档中的每列数据取个变量名,用于后续分析。

USEVARIABLESARE 用来指定本次分析使用了哪些变量。

CLASSES = c(2) 用于做潜在类别分析;(2)表示分2类;后面还需要按照1~6个类别依次做分析,以确定最佳模型。

VARIABLE:           NAMES ARE y1-y4 x;    USEVARIABLES ARE y1 y2 y3 y4;    CLASSES = c(2);

4、指定分析类型:

TYPE = MIXTURE 用于指定本次分析的类型,LCGA属于混合模型,因此选择MIXTURE。

STARTS的作用:避免局部最大化解,增加随机起始值数;

Processor= 2:混合模型计算量略大,指定使用多个处理器(cpu),节省等待时间。

LRTBOOTSTRAP=200:是为了获得更准确的LRT估计

ANALYSIS:    TYPE = MIXTURE;    STARTS = 100 10;    Processor= 2;         LRTBOOTSTRAP=200;!获得更准确的LRT估计

5、指定模型细节:

i是截距因子,s是斜率因子,y1 y2 y3 y4分别是结局变量在四个时间点的测量值,也是我们要研究的对象

本例中@用于设置变量的时间分值(即增长因子的负荷),将y1-y4依次设置为0,1,2,3,代表含有4次测量的线性增长模型。

i@0 s@0 表示设定增长因子方差为0,因为LCGA的假设之一就是同类别下个体是同质的,即变化轨迹相同。

MODEL:    %OVERALL%  i s | y1@0 y2@1 y3@2 y4@3;  i@0 s@0;!设定增长因子方差为0

6、选择输出模板

LCGA一般选择TECH11 TECH14,与潜在类别模型的选择一致。

OUTPUT:  TECH11 TECH14;

7、画图并保存结果

略,复制粘贴即可(注意把y1 y2 y3 y4改为自己的变量名)

plot:    Type is Plot3;    Series = y1 y2 y3 y4(*);    Savedata: SAVE=CPROB;  !保存后验概率    FILE IS testLCGA.txt;  !保存为文件testLCGA.txt

执行上述全部代码,需要等待30s或者1分钟,软件会直接输出结果,下一步就是对结果进行解读。

三、Mplus分析结果

结果与潜在类别模型的输出结果是很相似的,这点从输出的设置就可以看出来。分析思路依旧是先根据信息指数和多种检验结果确定最优拟合模型,即选取最适合的潜类别个数,再通过截距因子和斜率因子对具体的结果做专业解读。

1、确定最优模型

最优拟合模型确定方法笔者在往期的文章中介绍过,本次仅对上述指标的所在位置做一简单介绍,其余信息请阅读往期内容:Mplus细节教程:快速上手潜在剖面分析

这里再附上之前分享过的论文,帮助大家对拟合指标有更清晰的认知(请看1.4部分)。

黄珂瑶,丁思妍,周海琴,等. 肺移植患者衰弱变化轨迹及影响因素研究[J]. 中华护理杂志,2023,58(9):1088-1095. 

那么这些结果在哪里获取?看图。拟合指数:

模型估计的潜类别概率:

信息熵(entropy)和类别比例(即分类结果)

LMR检验结果

BLRT检验结果(更推荐)

注意,以上仅为假设有两个潜在类别的情况下的检验结果,实际上我们需要依次假设有1~6个类别,然后获取对应的检验结果,并根据结果确定最优模型。一般需要制作表,并在文章中汇报,类似下面这样的。

图片来自《潜变量建模与Mplus 应用·进阶篇

推荐绘制一张类似于因子分析中的碎石图的BIC值变化图,方便查看拐点,可能更直观一些。下图x轴为类别数,y轴为BIC值。

图片来自《潜变量建模与Mplus 应用·进阶篇

2、变化轨迹的分析

先获取截距与斜率因子:

3、绘图

做分析时已经添加了绘图指令,所以直接能得到mplus绘制的图。通过下面的步骤打开。


直接获取带有类别的变化轨迹图(很简陋,可以用别的工具画)。

3、专业解读

假设上述的2类别模型是最佳模型,可以考虑这样解读:

类别组1(红色线)共233人(占比xx%),截距和斜率的均值分别为0.821(p<0.01)和0.421(p<0.01),该组的起始值低且呈缓慢上升的趋势,将其命名为“xx组”。

类别组 2(蓝色线)共yy人(占比yy%),截距和斜率的均值分别为 2.916 (p<0.01),0.981(p<0.01),该组的起始值高且呈上升的趋势(上升速度更快)将其命名为“yy组”。

当然,这只是最简单的解读方式,因为没有真正去筛选最优模型,且没有设置协变量,这里可以参考上期解读的那篇论文(部分截图),看看实际场合中是如何对结果进行专业解读的。

黄珂瑶,丁思妍,周海琴,等. 肺移植患者衰弱变化轨迹及影响因素研究[J]. 中华护理杂志,2023,58(9):1088-1095. 

以上均为笔者一家一言,可能有理解不当甚至解读错误的情况,欢迎批评指正。另外,我们申请了护理科研交流群,迎大家群交流。入群方式:私信后台,发送任何内容都可以获取二维码)。

本期分享就到,后续会考虑分享其他工具(R)的实现步骤,这里我们下期见。


参考资料:

部分内容参考自王孟成 毕向阳主编的潜变量建模与Mplus 应用·进阶篇

黄珂瑶,丁思妍,周海琴,等. 肺移植患者衰弱变化轨迹及影响因素研究[J]. 中华护理杂志,2023,58(9):1088-1095. DOI:10.3761/j.issn.0254-1769.2023.09.010. 

封面截图自《中华护理杂志》

护理统计随笔
未来是精准护理的时代,护理研究的发展不仅在于基于证据的理论创新及实践,更在于大数据和人工智能。这里是一个从0到1的学习平台,关注我们,不但可以夯实科研基础,更可以开阔研究视野,让你的护理科研之路走得更远、更广。
 最新文章