应用SPSS软件实现二分类重复测量资料的GEE及GLMMs分析

学术   2024-12-28 10:50   陕西  

大家好,我是数据小兵。统计学/数据分析博主,正在努力地做好统计软件教学培训、统计答疑咨询与数据分析工作。「SPSS统计咨询」公众号作者,网易云课堂数据分析类课程讲师,《SPSSAU科研数据分析方法与应用》合著作者。
今天给大家推荐和分享一篇期刊论文,引用信息如下:
安胜利,张燕虹 & 陈征.(2012).应用SPSS软件实现二分类重复测量资料的GEE及GLMMs分析.南方医科大学学报(12),1777-1780.
摘选以下文字和图片:
由于广义估计方程(GEE)和广义线性混合效应模型(GLMMs)分析的适用条件广泛,可以针对非平衡设计资料、分类变量或缺失数值进行分析。所以,重复测量设计的分类变量资料多用GEE和GLMMs模型,常常通过SAS编程予以实现。本文结合实例,在SPSS 19.0软件上实现上述GEE和GLMMs模型的菜单操作。
1 GEE在SPSS统计软件中的实现
某研究者在维A酸软膏治疗银屑病的临床试验中,以44名静止期银屑病患者为对象,分别于治疗前、治疗后246和8周共5个时间点观测和记录患者的皮损面积,皮损面积分为“小”和“大”2类,研究目的是分析该药对银屑病的疗效。
小兵:仅包括被试内因素的重复测量数据,注意,在SPSS中应提前按“长型”数据格式录入。
变量“id”表示每个患者的编号
变量“week”表示每个患者重复观测的时间
变量“PASI为反应变量,表示每个患者的皮损面积,有2个水平即“O=小”;“1=大”。
小兵:SPSS的操作过程如下:
小兵:主要结果解释
表1为模型中各因素不同水平的检验结果。可见,不同时间点间有差异(P=0.005)。
表2给出了具体的回归系数值和一些检验统计量。本过程反应变量中以“0=小”作为基线,不同时间点的比较以“治疗后8周”为基线,“治疗前”、“治疗后2周”、“治疗后4周”、“治疗后6周”偏回归系数分别为1.190、0.960、0.750、0.554,并且都有统计学意义(P均<0.009),表明早期皮损较严重,随着治疗时间的延长,皮损有逐渐减小的倾向(系数均为正,且逐渐减小),至最后时间点治疗后8周皮损面积最小。
表3给出了该例的工作相关矩阵。此例选择了不确定型相关系数矩阵(Unstructured)作为相关矩阵,可见组内相关系数为0.581~0.939 ,但这不一定是最合适的作业相关矩阵。可以重新尝试定义其他相关矩阵形式,然后通过输出结果中的QIC统计量的大小来决定合适的相关矩阵。QIC的值越小模型越合适。此例不同相关矩阵的 QIC值结果笔者总结于表4。
可见,一阶相依型相关矩阵的QIC值最小,其次是不确定型。虽然GEE模型对相关结构的选择不敏感,但是给出正确的相关形式,能提高参数的估计效能。
小兵:相关矩阵这一块,表4这样的表格在实际分析中不需要写入论文,由研究者自行完成相关矩阵的对比和选择,在统计方法学表述时,一句话概况一下即可了。
2 GLMMs在SPss上的实现
GLMMs是广义线性模型与一般线性混合效应模型的扩展,是在广义线性固定效应模型的基础上引入随机效应,在随机效应满足正态分布的前提下,反应变量可以是任意分布。
某研究总结两种手术方法术后排斥反应情况。选取受体wistar-SD大鼠40只,随机分两组,对照组为直接穿透性角膜移植大鼠20只,实验组为经过三叉神经损伤或封闭术后,再进行穿透性角膜移植大鼠20只,观测角膜移植术后1、2、3、4、5、6、7、8、9、10、14、28 d共12个时间点的免疫排斥反应,评价标准为排斥与否。
小兵:第二个案例,是包括被试间因素、被试内因素,同样,需要提前按“长型”数据录入。
变量“id”表示每只大鼠的编号
变量“group”表示大鼠随机分组的情况,“1”为对照组,“2”为实验组
变量“day”表示术后每只大鼠术后的观测时间
变量“RI”表示角膜移植术后每只大鼠的免疫排斥与否,是二分类变量,“0”为不排斥,“1”为排斥。
小兵:SPSS的操作过程如下:
小兵:主要结果解释
本例先行尝试包含交互效应group*day的模型,因结果显示交互效应(F=0.000 ,P=1.000)无统计学意义故将交互效应排除后重新分析获得每个因素固定效应的检验结果见表5。
可见对照组与实验组的排斥反应有差异(F=35.332 ,P<0.001),术后不同时间点的排斥反应也有差异(F=6.402,P<0.001)。
表6显示的是各因素固定效应的参数估计结果。本过程选择因变量中的“0=不排斥”作为基线,“group”以实验组为基线,结果显示对照组的移植免疫排斥反应较严重(t=5.944,P<0.001 ,系数为正) ;“day”以术后28 d为基线,术后前3d的系数均无统计学意义(均为t=-0.025 ,P=0.980),从第4天开始移植免疫排斥反应均有统计学意义(P均<0.002),并且随着观察天数增加,移植排斥反应的临床表现越来越严重(系数均为负值提示最后时间点排斥反应最强,绝对值越来越小提示排斥反应强度越来越接近于最后时间点)。
需要说明的是,若有交互效应,则应分别讨论单独效应,即固定时间点,比较两组的排斥率差异(应用卡方检验);以及固定组别,对两组分别用GLMMs方法比较不同时间点之间的差异。
3 统计分析结果的表达
略,请看原文。
4 讨论
GEE和GLMMs 都可以处理有缺失值的资料,允许每个观察对象的观察次数不同,观察时间间隔亦可不同。Liang已经证明,只要缺失值不是太多,且为随机缺失,分析结果仍然是一致和稳健的。GEE分析时主要考虑了固定效应,对随机效应分析不够。若待分析资料样本量过少、需要对随机效应进行分析时,建议采用GLMMs方法。
除了本文介绍的二分类变量,GEE和GLMMs都能分析检测结果为等级变量的重复测量资料。但是GEE不能分析具有相关性的等级变量,而这恰恰是重复测量资料常常具有的性质,此时应用GLMMs分析方法可以使数据分析更加合理、准确。
GEE和GLMMs在SPSS 19.0统计软件上的菜单操作,相对于SAS、Stata等软件,简便易操作,不需要高深的编程技术,适合没有编程基础的非统计专业人员。
===
感谢 安胜利,张燕虹 & 陈征(2012)。
===
说明:本文未经期刊和作者授权发布,如有侵犯权利,请告知删除。本文仅用于学习。
===
如果大家对线性混合模型、对GEE广义估计方程模型有小疑惑、小问题,欢迎咨询。
SPSS统计分析视频教程,¥139价格已经开启,与其被导师催,不如自己靠这个139的视频课程拿下数据分析!
欢迎来:二维码地址如下:
左下角
↙点【阅读原文】加入课程

SPSS统计咨询
专注解决SPSS数据统计分析问题,答疑咨询V:qq2405064443。主理人数据小兵,长期从事统计教学和咨询工作,参编两本统计类图书。
 最新文章