写在前面:小小的table1,一点也不简单哦!
临床资料基线表(Clinical Data Baseline Table,俗称table1)是一种常用于临床研究和流行病学研究中的数据表格,Table1基线表往往是每篇论文开门见山的内容,重要性不言而喻。小编以前写过R工具,SAS工具,SPSS工具,小伙伴们可以可取所需。现在越来越多的R语言工具包提供了快速统计分析,批量分析,甚至形成三线表的功能,比如tableone,comparegroup,CRCgrp、autoReg、moonBook、Hmisc等等。翻遍公众号,似乎也找不到多个横向评测,究竟这些R包有何特色,有何不同,到底哪几个更牛逼?于是小编耗时2周,精心梳理了一下高分模板以及R包评测,以飨读者。
一、Table1高分案例
其中数据类型分为连续、多分类、二分类、等级型。绘制基线表时,应该根据每个变量的类型选择适当的描述性统计方法。这些统计指标有助于了解数据的分布、中心趋势、离散程度和特征类别的比例等,从而更全面地理解临床资料基线信息。
二、基线统计描述介绍
2.1 指标类型
2.2 方法与统计量
中文杂志为了防止国内论文造假,特地很多都要求提供统计量。R包却几乎都没有提供。Table 1各个变量类型对应的统计方法可参照下表。
2.3正态检验
正态检验有不同判断标准:①SAS软件规定:当样本含量n≤2000时,结果以SW检验为准,当样本含量n >2000时,结果以Kolmogorov-Smirnov(D检验)为准。②SPSS软件规定:当样本含量n≤5000时,结果以SW检验为准,当样本含量n >5000时,结果以Kolmogorov-Smirnov(D检验)为准。小编推荐SAS标准,永远不会错的。R包中“autoReg包”只需对“gaze”函数的参数进行设置,即可对连续变量进行Shapiro-Wilks检验(S-W检验)(适合样本量在5000以下的数据集,>5000报错)
三、Table1 R包介绍
3.1. R包思维导图
3.2 table1 R包简介与推荐
compareGroups包,十分强大基线表绘制。可以描述总研究人群(overall列)、选择研究人群、分组变量、、部分变量、亚组人群、连续变量分布描述、计算OR值或HR值、分组变量OR/HR值计算、调整输出结果、隐藏分类类别结果、调整有效数字位数、调整分类变量显示、显示两两比较结果、绘制分层基线特征表、输出基线特征表。尤其是两两比较,十分方便。
Tableone包,较简单。需要注意的是此时应先验证连续变量和分类是哪种检验方法,不够智能,特别之处在于能处理加权NHANES等数据的基线表。moonBook包,很强很强。韩国的心脏病学教授(Keon-Woong Moon)开发R包,能自动、手动设置你需要的基线分布,并且相应给出卡方、正态分布方案及p值。唯独是SW采用了5000,并未考虑方差齐问题,同时也并未考虑卡方3种方法的前提条件n40,T1的动态前提条件。语法简单,功能强大。官方说明见https://cran.r-project.org/web/packages/moonBook/vignettes/moonBook.html。autoReg包,也是Moon开发,可执行单变量回归、多变量回归以及向后逐步回归,结合myft函数同样可以实现三线表的绘制。MoonBook包强在基线描述,autoReg强在线性、多因素模型的一键输出。
3.2. 1 table1sci包
本包是基于小狐狸同学提供的思路修改而成。相比tableone等一众基线包,更加弥补了标准统计流程,例如卡方3类型,t’,方差齐等问题,正态5000例以上自动检验问题,同时鉴于国内杂志需求(如下图),提供详细统计检验及参数。
小编总结多组数据基线表常用的统计方法如下,内置与table1sci中,省去左右复制黏贴的工作及小白的思考。
table1sci尚在开发(请别私聊索要哦),先看代码初级效果,根据上述多组数据基线统计思路,考虑了方差齐、样本量n、期望T,并同时提供详细的统计参数。
五、R代码
小编选取网络上的一些文章汇总并加了详细标注,还排好版了。是不是很清晰?这可是花了2周时间测评了哦。小伙伴们可跳至自己需要的R包自由获取相应代码,table1sci不在列哦。
五、发散思维
一些所谓高喊他人盗版的收费网站,现在制作了在线三线表自动输出,后台都是简单调用tableone等包,并未真正就解决统计逻辑问题,毕竟这些包都主要是describe而不是inference。当审稿时候可能就被资深经验统计专家看出端倪错误了。
当然moonBook包和如compareGroups包还是挺不错的。小伙伴们切勿盲目迷信假大空的噱头宣传。
六、小结
用完一圈发现并没有完美基线R包,小编推荐多个包混合使用。compareGroups+ moonBook+ table1sci做出满意的基线表格。配对数据基线表暂无包。
参考文献:
Flora趣,R语言-利用jstable包制作三线表解决变量标签问题 1 R语言统计与绘图,介绍一个新的基线特征表绘制R包 R语言统计与绘图,compareGroups包,超级超级强大的临床基线特征表绘制包 一只勤奋的科研猫,R语言|4. 轻松绘制临床基线表Table 1