二、一种新的变化轨迹研究方法
重复测量数据需要使用一些特殊的方法来处理,比如下面的统计方法就是我们比较常用的:重复测量方差分析(均值层面);广义估计方程(均值或个体层面);混合效应模型(LMM,均值或个体层面);广义混合效应模型(均值或个体层面)。
然而,我们做护理研究的最终目的,是要将成果应用于临床,用于提升人类健康的。所以,尽管上述模型可以很好地识别与因变量相关的预测因子(尤其是后面3种),但它们并不能直接显示在临床决策中该做什么。
比如说:如果预测变量是连续的,我们应该在哪里划定高风险与低风险的界限?当一些风险因素存在,而其他风险因素不存在时,我们应该如何将风险因素组合成一个单一的决策?
于是,最近几年有一些学者(Marjolein Fokkema等)提出了基于递归分区或决策树的纵向数据处理方法:广义线性混合模型树[Generalized linear mixed-model (GLMM) trees]。(见参考文献1)
他们认为与传统的GL(M)M相比,递归分区或决策树方法很好地显示了我们在决策中要做什么,而不是用数学公式描述预测变量和结果变量之间的关联。而且,决策树方法还有另外一些优点,比如说:它们的非参数性质决定了它们不需要线性关联或正态分布残差等假设(这点在我们绝大多数统计方法中都是需要的),并且允许有大量潜在的预测变量(高维特征),这些变量甚至可能超过观测值的数量。
三、广义线性混合模型树
GLMM trees方法的底层原理不是很容易理解,我们从原文献中翻译了部分相关内容,希望能让大家看得更明白一些,截图如下:
四、这类研究如何呈现和解释结果?
当然是决策树+混合效应模型的综合呈现与解释了。
它可以这样呈现:
图3:来自Rstudio软件输出
也可以这样:
图4:来自Marjolein Fokkema等学者的文献(见参考文献1)
还可以这样:
图5:来自Rstudio软件输出
当然,更可以这样:
图6:来源见参考文献2
当然了,想要获取更准确的解释,需要大家自己去精读原文,笔者认为这种思路是很不错的。
本期分享就到这里,后续会考虑(可能)分享软件实现步骤,我们下期见。
提醒:以上内容为笔者读文献的感悟和心得,这也与我们公众号平台的名字“护理统计随笔”相呼应。因此,上述内容可能有笔者理解不当甚至解读错误的情况,欢迎批评指正。另外,我们申请了护理科研交流群,欢迎大家进群交流。(入群方式:后台回复关键词“加群”)。
参考资料:
[1]Fokkema M, Edbrooke-Childs J, Wolpert M. Generalized linear mixed-model (GLMM) trees: A flexible decision-tree method for multilevel and longitudinal data. Psychother Res. 2021 Mar;31(3):313-325. doi: 10.1080/10503307.2020.1785037.
[2]臧一腾,陈思臻,陆贝尔,等.基于线性混合模型树在体质指数纵向轨迹中的应用[J].中国卫生统计,2024,41(01):41-44.
封面和部分正文图片来自参考文献。