中介效应模型实践篇

学术 2024-08-01 11:48 陕西

中介效应模型的三个模型

模型1：Y=cX+e1 c：总效应

模型2：M=aX+e2

模型3：Y=c’X+bM+e3 c'直接效应 a*b间接效应

上一节分享了中介效应的理论知识，但是在看了温忠麟老师的“中介效应分析：方法和模型发展”，这一节打算以此为依据，在不违反温忠麟老师的流程的前提下，总结出自己的一套中介效应检验流程和软件操作以及结果的解读

那么首先看如下图是温忠麟提出的新的中介效应检验流程图：

文中对此图的介绍如下：

(1)第一步, 检验(模型1：Y=cX+e1)的系数 c, 如果显著, 按中介效应立论, 否则按遮掩效应立论。但无论是否显著, 都进行后续检验。

(2)第二步, 依次检验方程(模型2：M=aX+e2)的系数 a 和(模型3：Y=c’X+bM+e3)的系数 b, 如果两个都显著, 则间接效应显著, 转到第四步; 如果至少有一个不显著, 进行第三步。

(3)第三步, 用 Bootstrap 法直接检验间接效应ab, H0 : ab = 0。如果显著, 则间接效应显著, 进行第四步; 否则间接效应不显著, 停止分析。

(4)第四步, 检验(模型3：Y=c’X+bM+e3)的系数 c, 如果不显著, 即直接效应不显著, 说明只有中介效应。如果显著, 即直接效应显著, 进行第五步。

(5)第五步, 比较 ab 和 c的符号, 如果同号, 属于部分中介效应, 报告中介效应占总效应的比例ab/c。如果异号, 属于遮掩效应, 报告间接效应与直接效应的比例的绝对值|ab/c|

实际上，温忠麟在文中总结，他提出的检验流程, 综合了依次检验法和 Bootstrap 法的优点, 推荐先尝试简单的依次检验 a 和 b, 如果不显著则用 Bootstrap 法直接检验系数乘积 ab 以提高检验力。用这个流程, 无论是考虑第一类错误率、检验力还是结果的解释性, 与单纯的 Bootstrap 法检验系数乘积相比, 只会更好不会更差。

那么，由于温忠麟老师这套流程其实是综合了遮掩效应，这个效应有兴趣的可以自己进一步研究，这里我想探讨中介效应，因此参考温忠麟老师这套流程的中介效应部分，作出了自己的流程图：

图3 中介模型自己的流程图

实际上，上面的流程图只是单独提取了温忠麟老师中介效应的部分，那么下面我来解释一下，这套流程图：

流程图有5步，但总结来看可以拆分为3大部分：1前提，检验间接效应，检验直接效应。

（1）1前提：即第一步检验系数c是否显著，显著继续进行，不显著终止分析。

（2）检验间接效应：分两种情况：

第一是： a和b均显著，那么直接说明存在间接效应

第二是： a和b至少有一个不显著，也就是a不显著或b不显著或a、b均不显著，那么需要采用Bootstrap法去进一步检验ab（ab即间接效应），若不显著，不存在间接效应，终止分析；若显著，存在间接效应。

（3）检验直接效应c，若不显著，则说明中介效应为完全中介效应；

若显著，则说明中介效应为部分中介效应；

那么，理论理清了，我们接着直接进行代码实现：

本次采用的数据集介绍：

变量	属于
treat：是否治疗；	X：2分类变量
job_seek：求职自我效能水平评分；	M：连续变量
depress2：治疗后抑郁症状得分	Y：连续变量
depress1：治疗前抑郁症状得分
sex：性别	分类变量
age：年龄	连续变量
occp：职业	分类变量
marital：婚姻	分类变量
nonwhite：种族	分类变量
educ：文化程度	分类变量

在这个研究中，X为treat，M为job_seek，Y为depress2

在代码实现中，我们需要进行4步

（1）建立模型1：Y=cX+e1

（2）建立模型2：M=aX+e2

（3）建立模型3：Y=c’X+bM+e3

（4）Bootstrap法检验,并计算出直接效应、间接效应、间接效应占比

R代码：

.libPaths()#查看R包位置.libPaths("D:/Program File/R/R-4.3.2/library")#定义包安装位置setwd("F:/01陕西省疾控/010心血管高危人群/result")#设置工作空间getwd()#加载工作空间           install.packages("mediation")##加载R包    #中介包library(mediation)#载入数据data<-jobs           # treat：是否治疗；   X：2分类变量# job_seek：求职自我效能水平评分；   M：连续变量# depress2：治疗后抑郁症状得分   Y：连续变量data$X<-data$treat#定义自变量data$M<-data$job_seek#定义中介变量data$Y<-data$depress2#定义因变量#（1）建立模型1：Y=cX+e1model1<- lm(Y ~ X + sex + age+occp+marital+nonwhite+educ, data=data)#（2）建立模型2：M=aX+e2model2<- lm(M ~ X + sex + age+occp+marital+nonwhite+educ, data=data)#（3）建立模型3：Y=c’X+bM+e3model3<- lm(Y ~X + M + sex + age+occp+marital+nonwhite+educ, data=data) summary(model1)summary(model2)    summary(model3)

上面其实就是逐步检验的结果：我们可以依次查看系数c、a、b的显著性来判断是否存在中介效应，再根据系数c’的显著性判断是完全中介还是部分中介

#中介效应分析

set.seed(1000)#设置随机种子result <-mediate(model2, model3, #填模型2和模型3                   treat="X",      #自变量                   mediator="M",   #中介变量                   sims=500,       #重复抽样500次                   robustSE = T)  summary(result) ### summary模型回归结果

#ACME :间接效应，即中介效应

#ADE ：直接效应

#Total Effect：总效应

#Prop. Mediated：中介效应占比

上述结果是Bootstraps的结果，我们也可以直接看这里的结果；

（1）看总效应c显著，才能进行下一步

（2）看间接效应是否显著；若间接效应显著，再进行下一步

（3）再看直接效应是否显著，直接效应显著，则为部分中介；直接不显著，则完全中介效应

plot(result1) ###绘制模型回归结果图

#敏感性分析

sens.out <- medsens(result,                     rho.by = 0.1,                     effect.type = "indirect",                         sims = 1000)summary(sens.out)

### Rho为灵敏度参数，Rho=0表示没有混杂效应

### Rho值越大表示混杂效应越强，此时对应的中介效应结果越可靠

### 上述结果给出了不同Rho下的中介效应的区间与拟合优度R^2

#敏感性分析可视化

par(mfrow = c(1,2))#（可运行可不运行，一页多图）#画左图，（-0.8，0.8是敏感性分析Y轴的长宽）plot(sens.out, sens.par = "rho", main = "Sensitive analysis", ylim = c(-0.8, 0.8))#画右图plot(sens.out, sens.par = "R2", r.type = "total", sign.prod = "positive")

图1 Y轴表示中介效应值，X轴表示敏感度关于rho。

图一的总结是：rho的绝对值越高，中介效应越可靠

今天先分享到这里，这一期的中介变量和Y变量都是连续变量，下期分享以下三种情况，R如何构建中介模型：

中介变量	因变量
连续变量	2分类变量
2分类变量	连续变量
2分类变量	2分类变量
连续变量	生存时间/2分类变量
2分类变量	生存时间/2分类变量

所以留个疑问：中介变量如果是多分类怎么办呢？

http://mp.weixin.qq.com/s?__biz=Mzk0NTcxNDQ5NQ==&mid=2247484858&idx=1&sn=9f050ad50ef0fce28c6b5ba92d44bac1

流病统计与科研学习笔记

流行病与卫生统计学专业主要分享基于SAS、R以及其他统计软件实现各种统计学方法和结果绘图，提高自己的学习能力

柳叶刀子刊在线发表我国基本公共卫生服务高血压糖尿病患者管理，可能预估还有35%-40%的高血压和糖尿病患病未被纳入

回归模型大杂烩-logistic回归模型：二分类、多分类无序、多分类有序、偏比例、条件logistic回归模型汇总（R+SAS）

赋原始数据：回归模型大杂烩-神包autoReg直接整理好二分类logistic回归模型单因素和多因素结果(三线表+森林图均可输出

回归模型大杂烩-神包autoReg直接整理好二分类logistic回归模型单因素和多因素结果(三线表+森林图均可输出)

柳叶刀子刊发表新冠期间西太地区接种新冠疫苗情况，蒙古、越南、老挝、柬埔寨和马来西亚疫苗接种率高达95%，平均接种2.4剂以上。

回归模型大杂烩-R语言多重线性回归全流程-模型建立+前提条件检验+模型评价

回归模型大杂烩-R语言多重线性回归粗模型和校正模型结果一键整理输出

回归模型大杂烩-R语言多重线性回归标准化系数的输出

有慢性病家族史的人会不会有更健康的生活方式呢？这篇文献给出了答案

回归模型大杂烩-多重线性回归

BMC子刊，新冠期间11-17岁青少年心理健康略有恶化；15-17岁、女性、既往有更好健康心理的人在新冠期间心理健康的恶化更快

福利3：关联性研究表格2：批量提取多暴露对二分类结局的logistic所有参数，增加暴露分组的总人数、结局发生数、结局发生率

柳叶刀子刊在线发表新冠COVID-19对西太地区慢性非传染性疾病死亡的影响，发现新冠对不同慢病死亡率结果不一

BMC子刊首次大人群证据，曾感染新冠可能增加7种消化系统疾病21%~41%风险，而1-2年内胃肠道功能障碍和胃食管反流风险增加

SAS的proc genmod 如何输出OR值及置信区间呢？

福利2：简单易学的SAS宏；批量提取多暴露对二分类结局的logistic所有参数，再也不用一个一个粘贴了

重磅：新冠与自杀？柳叶刀子刊发表法国某地区新冠期间意图自杀发生率增长近35%，年轻女性意图自杀率最高，2次意图自杀中位数是91天

福利1：简单易学的SAS宏，批量提取单因素logistic所有参数和多因素logictic所有参数视频讲解

R语言实现基线表格2期

R语言如何创建协变量集合用于模型

R语言设定变量为连续、二分类、无序多分类、有序多分类变量的方法

SAS宏直接写暴露、中介、结局和协变量，出生存资料的中介效应分析结果，全文理论+实践操作+结果解读

柳叶刀子刊，新冠大流行期间因社区获得性肺炎死亡率和寿命损失下降，其中病毒性肺炎下降更明显；严格的非药物干预政策起到了关键作用

事后多重比较方法，看这一篇足够了Bonferroni法、Holm和Hochberg法

R语言进行多重插补-基于R语言的mice包常规方法进行插补

R语言进行多重插补-基于R语言的mice包预测均值法

R语言进行多重插补-基于R语言的mice包随机森林法

R语言进行多重插补-基于R语言的mice包的理论介绍

PLOS子刊，有死产史妇女未来心脑血管、2型糖尿病和肾脏疾病风险增加，而乳腺癌风险可能降低；流产似乎并不增加未来疾病风险

主成分分析的2种应用和SAS分析全流程+结果解读

R语言survival包coxph函数拟合cox回归模型常用的科研论文参数的提取和合并

自变量每变化一个标准差的估计值和P值的计算

R语言批量实现单因素二分类logistic回归并提取相关参数

柳叶刀子刊，多队列发现持续饮茶、每天2-3杯或6-8克茶具抗衰老作用，但要注意切勿饮酒

模仿柳叶刀期刊文献横向森林图的绘制-基于R语言ggplot2包

R语言最常用基本统计量的函数计算

震惊，因SAS代码导致暴露人群被切换，结果出现错误，撤回柳叶刀子刊文章

模仿柳叶刀期刊文献森林图的绘制-基于R语言forestplot包

R语言根据条件生成新变量的几种方法

Cox比例风险模型的比例风险的检验？基于R语言绘图检验

BMC Medicine，长期夜班、>10年夜班、8次/月夜班工作可能增加49%、23%、41%COPD发病风险。

R语言计算年龄标化率

R语言实现基线表格1期

Lancet子刊，明确了，打呼噜也是一种病，会增加中风风险；瘦人(BMI<24)也要注意打呼噜

中介变量和因变量为分类变量的中介模型R实现

JAMA子刊，15项临床试验荟萃分析提示：预防医院获得性肺炎，坚持刷牙是个好习惯

Lancet子刊，临床试验事后队列研究设计+Cox+亚组+限制性样条:75岁健康老年人若HDL-C>80mg/dL需警惕痴呆风险

中介效应模型实践篇

PLOS medicine 多喝低脂牛奶咖啡和茶，少喝全脂牛奶，不喝果汁、人工甜味饮料或含糖饮料，不喝酒或适度饮酒，死亡风险更低

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉