纵向研究之变化轨迹：R语言实现

文摘科学 2024-05-21 20:53 湖南

由于微信推送机制的变化，建议大家将公众号标记为星标，如此才能及时收到我们的更新，同时也希望大家能帮忙点点赞和转发，你们的支持是我们前进的重要动力来源，谢谢！

护理统计随笔平台的内容现在已经非常丰富，很多方面都有涉及到，如果你觉得你没有看到往期的相关文章，不妨打开公众号的菜单页，在各级目录中查找你想要的内容。

一、用R实现潜类别增长模型

之前我们分享了如何用Mplus软件做潜类别增长模型（ Latent Class GrowthAnalysis, LCGA）或组轨迹模型（Group-based trajectory modelling, GBTM），链接：又见轨迹研究？潜类别增长模型分析步骤。

有网友咨询：“能用R语言实现吗？”当然是可以的，我们对读者朋友的留言向来是很重视的，这期就来聊聊R语言版LCGA或GBTM的实现思路。

今天分享如何用R实现，方便起见，还是用与Mplus实操同一批数据，500行，6列，前四列（y1 y2 y3 y4）是要研究的主要指标，表示对变量y测量了4次，此变量属于连续型变量，具体信息未知（仅供练习，无实际意义），第五列是协变量x，本次分析时不会使用它，第六列同样不会使用。因此，本次演示的是没有协变量或预测变量的轨迹模型。

本期代码参考了下面这篇文章（建议阅读原文），笔者在此基础上做了不少的改动：

全部代码都在这里了（有代码解释），大家可以自行取用。

# 轨迹分析# LCGA
library(lcmm)library(tidyverse)# devtools::install_github("hlennon/LCTMtools")library(LCTMtools)
# help(LCTMtools)# 加载数据集data = read.table("ex8.1.dat",col.names = c(  "y1", "y2", "y3", "y4", 'x1','x2'))data %>% glimpse()data$id = seq(1,500,1)  #增加个体编号
# 预处理，宽型数据变长型数据newd = data %>% pivot_longer(  cols = y1:y4,  names_to = 'times',  values_to = 'y') %>%   select(times,y,id)
newd %>% glimpse()
# 建模set.seed(123)
# 先建立一个基础模型，必须要有的mod1 = hlme(y~times,     random=~times,     subject = 'id',     ng=1,     data=newd     )
# 依次拟合有2~7个潜在类别的增长模型(可以自己写个循环)# 速度比较慢mod2 = hlme(y~times,            random=~times,            subject = 'id',            mixture=~times,#当ng>1时需要设置            ng=2,            data=newd,            B=mod1)mod3 = hlme(y~times,            random=~times,            subject = 'id',            mixture=~times,#当ng>1时需要设置            ng=3,            data=newd,            B=mod1)
mod4 = hlme(y~times,            random=~times,            subject = 'id',            mixture=~times,#当ng>1时需要设置            ng=4,            data=newd,            B=mod1)mod5 = hlme(y~times,            random=~times,            subject = 'id',            mixture=~times,#当ng>1时需要设置            ng=5,            data=newd,            B=mod1,            nproc=6)
mod6 = hlme(y~times,            random=~times,            subject = 'id',            mixture=~times,#当ng>1时需要设置            ng=6,            data=newd,            B=mod1,            nproc=6)mod7 = hlme(y~times,            random=~times,            subject = 'id',            mixture=~times,#当ng>1时需要设置            ng=7,            data=newd,            B=mod1,            nproc=6)summary(mod1)summary(mod2)LCTMtoolkit(mod2)bic = rbind(mod1$BIC,mod2$BIC,mod3$BIC,mod4$BIC,mod5$BIC,mod6$BIC,mod6$BIC)bic

# 上面的方法比较笨，我们可以用循环来实现，下面是个简单的演示# 可供大家参考，就不运行了for (i in 2:7) {  modeli = hlme(y~times,       random=~times,       subject = 'id',       mixture=~times,       ng=i,       data=newd,       B=mod1,       nproc=6  )  print(modeli$BIC)}
# 上述代码很慢，所以我可能更倾向于用Mplus跑LCGA
# 查看各模型的评价指标LCTMtoolkit(mod3)LCTMtoolkit(mod4)LCTMtoolkit(mod5)LCTMtoolkit(mod6)LCTMtoolkit(mod7)
# 模型比较LCTMcompare(mod4, mod5)
# 个体分配概率mod2$pprob
# 各类别比例summarytable(mod2)
# 数据出结果不易，保存下save.image() # 下次要用，可以直接导入模型load('.RData')

二、注意要点及个人看法

Hannah Lennon等学者在BMJ Open杂志发布了他们所构建的潜在类轨迹建模的框架，包括构建和解释模型，也包括如何选择最佳模型，并给出了具体分析步骤及R语言实现方法，笔者此处的代码也是参考了他们的方法。笔者发现了该框架与我们之前学习的Mplus分析步骤有较大的不同。

部分步骤截图

几个注意事项：

1、上述代码运行速度太慢，笔者是电脑是8核处理器，但跑起来也花了5~10分钟时间，数据量大，且不做优化的话，可能要更长，听部分网友反馈说花了半小时都没出来结果。所以，建议保存做出来的结果，方便下次使用。

2、笔者看到了一些公众号或知乎的博主对lcmm下轨迹模型的选择步骤，清一色是根据最小BIC来确定最优模型，但是我们知道，在Mplus中，我们不但要比较AIC、BIC，还会比较信息熵、LMR、BLRT、类别比例等指标，但是这些指标在R的lcmm包中似乎不完整甚至完全是没有，所以不好说。

3、Hannah Lennon等学者给出了不一样的模型评价（或者说选择）体系和指标。这个可以通过该研究团队开发（似乎是）的LCTMtools包来做，笔者在上面的代码中有演示具体做法。

4、可视化方法与Mplus的不一样，他们这里是用predict+plot来实现的。

综合上述因素，个人不太推荐用R来做，相比来说，Mplus更简单明了且指标完整。

三、常用心理统计方法汇总

福利环节。

笔者已经在护理统计随笔公众号上，分享了众多心理统计方法的实现步骤，既有Mplus软件的，也有R语言的。在中介效应和调节分析模块，笔者还分享了简单实用的SPSS Process分析方法。

下面是笔者总结的一些常用建模方法（自行总结，不权威，仅供参考），以思维导图的形式呈现，两幅图是一样的，只是配色和风格不同，有兴趣的老师可以自取。

小提醒：笔者水平有限，上述内容如有不当之处，还望海涵。如果你在科研学习中遇到了疑问，恰好也想跟网友们交流，可以加入我们建立的“护理科研交流群”。这是一个完全自由、开放、免费、没有套路的纯交流群。加群方式：后台私信关键词“加群”。

参考文献：

Lennon H, Kelly S, Sperrin M, Buchan I, Cross AJ, Leitzmann M, Cook MB, Renehan AG. Framework to construct and interpret latent class trajectory modelling. BMJ Open. 2018 Jul 7;8(7):e020683. doi: 10.1136/bmjopen-2017-020683. PMID: 29982203; PMCID: PMC6042544.

正文图片来自上述参考文献，封面是笔者自己画的思维导图。本文仅供学习、分享使用，如有侵权，请联系我们删除，谢谢。

护理统计随笔

专注护理科研设计和统计分析。别人不会告诉你的干货，可以来这里找！

最新文章

护理科研选题的全新视角：离散选择实验

比随机森林强! 利用catboost做临床预测模型

顶刊都在用！基于LightGBM的临床预测模型实现方法

附详细的实操步骤：临床预测模型Meta分析（老歌新唱）

xgboost + shap可加性解释（R版本）：优秀的机器学习解决方案

还在做系统评价吗？证据图谱可以学起来了

还在纠结要不要做质性研究吗？Q方法了解下

轻松+愉快！在线版meta分析工具

这篇发在核心期刊的体位相关meta分析到底有何特色？

实操来了！轻松搞定预测模型类别不平衡问题

小白快速成长秘诀：看文献不要只看结果，要学会从中提炼未曾注意的细节！

我们正式开通一对一辅导、论文审稿与数据分析服务

预测模型小白入门：不平衡数据与处理方法

我们正式开通一对一辅导、论文审稿与数据分析服务

预测模型研究中，机器学习到底是怎么一回事？（小白入门版）

最后一波！我们组织的Meta分析小班课明日开课，请速度上车！

想学症状群轨迹分析的同学看过来！

我们自己组织的小班课来啦！Meta分析特训小班课！

护理北核！轻松搞定潜在剖面分析！（小白入门版）

我们自己组织的小班课来啦！Meta分析特训小班课！

纵向数据+风险预测模型？这种思路很有意思

论文审稿/数据分析，专业团队助你一臂之力

Meta分析难题：如何对图形数据进行提取？

小白优选！Meta分析特训班，欢迎零基础同学报名！

训练营来啦！Meta分析特训班，欢迎报名！

吐血整理!最新版护理类SCI期刊的影响因子来了！

有了这个工具，做meta分析速度起飞！

全体护理人员终于盼到了！报考在职研究生，专科起报！双证毕业！

风险预测模型：开发七个步骤和用于验证的 ABCD

论文审稿/数据分析，专业团队助你一臂之力

小白系列：方案构建及应用竟然如此简单？对中华护理杂志文献的解读

小白系列：如何撰写随机对照试验护理论文——基于中华护理杂志文献

小白系列：通过拆读中华护理杂志的文献，带你入门网络分析！

Meta杀手锏！Meta分析之数据转化（一）

SCI分享！利用增长混合模型对患者报告结局数据进行纵向分析

国内护理系统评价的报告质量分析

主客体互倚模型看这篇就够了！附完整流程

一种非常棒的研究思路，推荐给大家

潜变量增长模型——基于Mplus软件的实现方法

研究生第10节课：医学研究中常见的综述类型

纵向研究之变化轨迹：R语言实现

各有千秋！利用三种主流统计软件建立线性混合效应模型

利用NHANES数据库发SCI？这个方法太火了（一）

非常不错的思路，纵向研究变化轨迹还可以这样分析？

Meta分析的统计异质性检验，你真的能解读清楚吗？

又见轨迹研究？潜类别增长模型分析步骤

一区TOP征稿：Prediction Models and Clinical Outcomes

还在手动做描述统计和单因素分析？这个方法不错

2区SCI！使用贝叶斯核机回归进行NHANES数据库分析

PROSPERO注册平台快速注册小秘籍

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉