潜类别分析(Latent profile analysis,LCA),不仅能根据众多指标对疾病亚型进行自动归类。还可以对动态变化的指标进行自动归类。临床意义在于不同亚型的患者,接受治疗后疗效不同,有利于根据亚型指导临床治疗方案的选择。很有临床意义。
目的:对饮酒类型进行分类[1]
方法:采用问卷调查饮酒情况,随访5年。采用潜类别分析对饮酒的动态变化进行归类。
结果:得出饮酒者的五种概况用来表示饮酒的纵向过程:早期戒酒者,轻度/不饮酒者,逐步改善者,中度饮酒者和酗酒者。基线的重要因素包括ASI药物的严重程度,依赖性症状和婚姻状况。对于重度饮酒者来说,使用社交网络进行的重度饮酒和吸毒的规模明显更大。
上图展示了每个人饮酒量随时间变化的情况,每条线是一个人。这是7个人的示例。
上图展示潜类别分析自动得出的五种亚型(横坐标是随访时间,纵坐标是饮酒量),从不喝酒的(最下面一条虚线)起点低且一直低。重度饮酒的(最上面一条实线)起点高且一直高。另外3种有开始高,短期内戒酒的等各种情况。这一张图很厉害,清清楚楚。
潜类别分析(Latent class analysis,LCA)是假定观察对象来自不同的亚组(类),类别之间是互斥的,即每个人都属于一个且仅属于一个潜在类别。每个人来自哪一类本身是不知道的(unobserved),根据观察到的变量(observed)来确定每个人属于哪一类。如果观察到的变量都是分类型的,称为潜类别分析(Latent class analysis),当观察变量有连续型指标时,我们通常将其称为潜特征分析(Latent profile analysis)。
潜类别分析(Latent class analysis) 与聚类分析(Cluster analysis)类似,但使用的分类方法不同。LCA 被称为是一种自上而下(top-down approach)的方法,使用每个人观察到的数据分布的概率模型推导其所在的未观察到的类别,而不是使用某些选定的距离度量来查找聚类。
重复测量需要用纵向数据结构。
数据结构特点:
每个观察对象多行
测量次数可以不同,可以缺失(用NA记录)
基线指标相同
数据介绍:paquid 数据摘自 Paquid前瞻性队列研究(Letenneur,Commenges 等1994年),目的是调查脑部和功能性衰老。含500个研究对象(由ID标识)。重复测量指标包括:三种认知测试(MMSE,IST,BVRT),身体依赖性(HIER,4级因素)和抑郁症状(CESD),随访时间最长达20年。AGE为年龄,AGEDEM 为诊断为痴呆症年龄或最后一次就诊的年龄,DEM 为痴呆症诊断(0/1)。CEP 为受教育程度(CEP),MALE 为性别男,AGE.INIT 为进入队列年龄。
用易侕软件自带的练习数据创建分析项目,Analysis-exercise文件夹的paquid数据文件。点击数据分析-潜变量分析-潜类别混合效应模型。给出应变量、时间变量、研究对象编号后点击查看结果。
自动得出分型(Class1,2……),可以用默认的或者自己手动设定分型个数。
得出自动分类的图。输出结果跟前面SCI论文实例中的图表是一致的,具体结果和统计方法撰写可以参考上面的文献。在路径对应的文件夹中有图片。
图:Y随时间变化的分类情况
应变量是连续性的
可以增加分组变量,看不同组的亚型特点
可以做分组变量和时间的交互作用
可以手动设置类别数目
参考资料
[1] Delucchi K L, Matzger H, Weisner C. Dependent and problem drinking over 5 years: a latent class growth analysis[J]. Drug Alcohol Depend, 2004,74(3):235-244.DOI:10.1016/j.drugalcdep.2003.12.014.
[2]易侕软件帮助文件,https://www.empowerstats.net/analysis/menuHelp.php?ch=1&module=578.