R语言实现基线表格1期

学术 2024-08-05 15:31 陕西

R语言实现基线表格1期

今天给大家详细介绍一下R语言tableone包，可以用于实现流行病学关联性研究中的基线表格。

下面是这个包的一些参数

CreateTableOne(

vars, #代表要汇总的变量，需以向量的形式提供；因子变量即为分类变量，数值变量即为连续变量。如果为空，则使用数据集中的所有变量。

strata,#代表分组变量，如果不写，则不分组，只有总体结果

data,#你的数据集

factorVars,#填写“属于数值变量，但你想要它变为分类变量”的变量 1/2/3

includeNA = FALSE,#如果为“TRUE”，则考虑分类变量的缺失值

test = TRUE,#如果分组变量为多组，则进行两两比较

testApprox = chisq.test,

argsApprox = list(correct = TRUE),

testExact = fisher.test,

argsExact = list(workspace = 2 * 10^5),

testNormal = oneway.test,

argsNormal = list(var.equal = TRUE),

testNonNormal = kruskal.test,

argsNonNormal = list(NULL),

smd = TRUE, #如果为TRUE，则增加标准化均值差

addOverall = FALSE #如果为TRUE，则增加汇总列

)

#其他的参数就是一些统计方法的选择，保持默认即可。

.libPaths()#查看R包位置setwd("F:/论文/心血管高危影响因素/result")#设置工作空间getwd()#加载工作空间# 安装包install.packages("tableone")# 加载包library(tableone)library(dplyr)#这个包用来整理数据的##导入数据data1<-read.csv("F:/论文/心血管高危影响因素/result/gw.csv",                   as.is = TRUE,header = T,sep = ",", fileEncoding='utf-8')

## 将分类变量转换为因子变量#fa1varsToFactor <- c("性别", "年龄", "城乡", "文化程度")data1[varsToFactor] <- lapply(data1[varsToFactor], factor)           #fa2:不仅可以将变量变为因子，还可以指定标签data1<- rbind(data1)%>%##必须写上这个行行合并的函数  mutate(性别 = factor(性别,                       levels = c("男性","女性"),                       labels = c(1,2)                       ))%>%  mutate(年龄= factor(年龄,                     levels = c("35~","45~","55~","65~76"),                    labels = c(1,2,3,4)                     ))%>%    mutate(文化程度= factor(文化程度,                  levels = c("小学及以下","初中","高中/中专","大专及以上","不详"),                  labels = c(1,2,3,4,5)                  ))

## 汇总的变量vars<-c(  "性别", "年龄", "城乡", "文化程度",  "TC","TG","LDL","HDL","SBP","DBP")

## 分组变量为两组的Table 1

tableOne <- CreateTableOne(vars = vars,                           strata = c("心血管高危"),#分组变量                           includeNA=TRUE,#考虑分类变量的缺失值                               addOverall=TRUE,#增加合计列                           data = data1)#查看tableOne

#summary可以查看详细总结，包括缺失情况summary(tableOne)

#进一步指定非正态变量，

#也可以增加“exact = c("status", "stage")”指定需要精确检验的分类变量，必须在这里指定这个参数

table1<-print(tableOne, nonnormal = c("SBP","DBP"),#指定非正态变量      cramVars = "hepato",#用于显示二级分类变量的两个水平      smd = TRUE,#是否展示标准化均值差      quote = TRUE)

#导出excelwrite.csv(table1, file = "table1.csv")

## ##################分组变量为多组的Table 1

tableOne <- CreateTableOne(vars = vars,                           strata = c("心血管高危聚类"),#只需改变这里的分组变量                           includeNA=TRUE,#考虑分类变量的缺失值                           addOverall=TRUE,#增加合计列                           test = TRUE,                           data = data1)#查看tableOne#summary可以查看详细总结，包括缺失情况summary(tableOne)           #进一步指定非正态变量table1<-print(tableOne, nonnormal = c("SBP","DBP"),#指定非正态变量              cramVars = "hepato",#用于显示二级分类变量的两个水平                  smd = TRUE,#是否展示标准化均值差              quote = TRUE)

#导出excel；必须先用print()函数才能导出table1

table1<-print(tableOne)write.csv(table1,file="table1.csv")

补充：

## 开始制作table1 汇总的变量vars<-c(  "age", "gender", "smoke", "alc",  "htn","dyslipidemia","cvd","cancer","bmi","waist")           ## 全人群的Table 1tableone <- CreateTableOne(vars = vars,                           strata = c("dm_pca_ses1"),#分组变量                           includeNA=TRUE,#考虑分类变量的缺失值                           addOverall=FALSE,#增加合计列                           data = data)#其他条件all_table1<-print(tableone,              showAllLevels=TRUE,#显示所有变量的水平              #nonnormal = nonvar,#非正态变量                  #exact = exactvars,#需要精确检验变量              catDigits = 1, #分类变量百分比小数位数为1位              contDigits = 1,#修改连续变量小数位数为1位              pDigits = 3, #调整P小数位数为3位              quote = FALSE, # 不显示引号              noSpaces = TRUE, # #删除用于对齐的空格              printToggle = TRUE) #展示输出结果

http://mp.weixin.qq.com/s?__biz=Mzk0NTcxNDQ5NQ==&mid=2247484958&idx=1&sn=92b817a087244b5976df92d4924d75c0

流病统计与科研学习笔记

流行病与卫生统计学专业主要分享基于SAS、R以及其他统计软件实现各种统计学方法和结果绘图，提高自己的学习能力

柳叶刀子刊在线发表我国基本公共卫生服务高血压糖尿病患者管理，可能预估还有35%-40%的高血压和糖尿病患病未被纳入

回归模型大杂烩-logistic回归模型：二分类、多分类无序、多分类有序、偏比例、条件logistic回归模型汇总（R+SAS）

赋原始数据：回归模型大杂烩-神包autoReg直接整理好二分类logistic回归模型单因素和多因素结果(三线表+森林图均可输出

回归模型大杂烩-神包autoReg直接整理好二分类logistic回归模型单因素和多因素结果(三线表+森林图均可输出)

柳叶刀子刊发表新冠期间西太地区接种新冠疫苗情况，蒙古、越南、老挝、柬埔寨和马来西亚疫苗接种率高达95%，平均接种2.4剂以上。

回归模型大杂烩-R语言多重线性回归全流程-模型建立+前提条件检验+模型评价

回归模型大杂烩-R语言多重线性回归粗模型和校正模型结果一键整理输出

回归模型大杂烩-R语言多重线性回归标准化系数的输出

有慢性病家族史的人会不会有更健康的生活方式呢？这篇文献给出了答案

回归模型大杂烩-多重线性回归

BMC子刊，新冠期间11-17岁青少年心理健康略有恶化；15-17岁、女性、既往有更好健康心理的人在新冠期间心理健康的恶化更快

福利3：关联性研究表格2：批量提取多暴露对二分类结局的logistic所有参数，增加暴露分组的总人数、结局发生数、结局发生率

柳叶刀子刊在线发表新冠COVID-19对西太地区慢性非传染性疾病死亡的影响，发现新冠对不同慢病死亡率结果不一

BMC子刊首次大人群证据，曾感染新冠可能增加7种消化系统疾病21%~41%风险，而1-2年内胃肠道功能障碍和胃食管反流风险增加

SAS的proc genmod 如何输出OR值及置信区间呢？

福利2：简单易学的SAS宏；批量提取多暴露对二分类结局的logistic所有参数，再也不用一个一个粘贴了

重磅：新冠与自杀？柳叶刀子刊发表法国某地区新冠期间意图自杀发生率增长近35%，年轻女性意图自杀率最高，2次意图自杀中位数是91天

福利1：简单易学的SAS宏，批量提取单因素logistic所有参数和多因素logictic所有参数视频讲解

R语言实现基线表格2期

R语言如何创建协变量集合用于模型

R语言设定变量为连续、二分类、无序多分类、有序多分类变量的方法

SAS宏直接写暴露、中介、结局和协变量，出生存资料的中介效应分析结果，全文理论+实践操作+结果解读

柳叶刀子刊，新冠大流行期间因社区获得性肺炎死亡率和寿命损失下降，其中病毒性肺炎下降更明显；严格的非药物干预政策起到了关键作用

事后多重比较方法，看这一篇足够了Bonferroni法、Holm和Hochberg法

R语言进行多重插补-基于R语言的mice包常规方法进行插补

R语言进行多重插补-基于R语言的mice包预测均值法

R语言进行多重插补-基于R语言的mice包随机森林法

R语言进行多重插补-基于R语言的mice包的理论介绍

PLOS子刊，有死产史妇女未来心脑血管、2型糖尿病和肾脏疾病风险增加，而乳腺癌风险可能降低；流产似乎并不增加未来疾病风险

主成分分析的2种应用和SAS分析全流程+结果解读

R语言survival包coxph函数拟合cox回归模型常用的科研论文参数的提取和合并

自变量每变化一个标准差的估计值和P值的计算

R语言批量实现单因素二分类logistic回归并提取相关参数

柳叶刀子刊，多队列发现持续饮茶、每天2-3杯或6-8克茶具抗衰老作用，但要注意切勿饮酒

模仿柳叶刀期刊文献横向森林图的绘制-基于R语言ggplot2包

R语言最常用基本统计量的函数计算

震惊，因SAS代码导致暴露人群被切换，结果出现错误，撤回柳叶刀子刊文章

模仿柳叶刀期刊文献森林图的绘制-基于R语言forestplot包

R语言根据条件生成新变量的几种方法

Cox比例风险模型的比例风险的检验？基于R语言绘图检验

BMC Medicine，长期夜班、>10年夜班、8次/月夜班工作可能增加49%、23%、41%COPD发病风险。

R语言计算年龄标化率

R语言实现基线表格1期

Lancet子刊，明确了，打呼噜也是一种病，会增加中风风险；瘦人(BMI<24)也要注意打呼噜

中介变量和因变量为分类变量的中介模型R实现

JAMA子刊，15项临床试验荟萃分析提示：预防医院获得性肺炎，坚持刷牙是个好习惯

Lancet子刊，临床试验事后队列研究设计+Cox+亚组+限制性样条:75岁健康老年人若HDL-C>80mg/dL需警惕痴呆风险

中介效应模型实践篇

PLOS medicine 多喝低脂牛奶咖啡和茶，少喝全脂牛奶，不喝果汁、人工甜味饮料或含糖饮料，不喝酒或适度饮酒，死亡风险更低

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉