辛辛苦苦写好一篇文章投稿,就因为一个统计小错误被Editor“秒拒”,冤不冤?
今天分享一篇近期BMJ子刊《BMJ Paediatrics Open》在线发表的一篇综述,由期刊编辑和审稿人编撰,总结了在审核论文时常见的统计错误,并提出具体的改进建议,含金量还是蛮高的。我看完也有些收获,分享给大家,正好借着这个机会回答一下大家在投稿时常遇到的三个问题。我写文章报告结果的时候,有点纠结,不知道该多强调效应值还是P值。还有就是,报告P值的时候,要怎样才能写得清楚又严谨呢?
●首先,有效应值首选效应值。在很多研究中,作者仅报告了P值,反而忽略效应值(OR、RR值等),甚至为了减少字数,删掉了很多重要信息。事实上,效应值能直接衡量处理或暴露对结果的影响,相较而言,比P值更有意义。就算是为了节约篇幅,在效应值和P值之间进行选择时,也应该是省略P值,保留效应值。很多医学顶刊文章就是这样做的。●其次,报告精确的P值。过去由于计算能力受限,一些作者会用 "P< 0.05" 的方式近似表示P值。但现在软件可以给出P值的精确值,如果有精确值,就没有理由使用近似值,不能不考虑原因的参照过去的文章。 对于P 值非常小的情况,也应避免报告为"0.000",应改为 "< 0.001"。例如这篇中国医科大学学者发表在JAMA子刊的研究论文,他们对P值的使用就非常规范。记住,P值不能是0(也不会是1)。●减少下“不显著”的结论。这个问题也与我们的P值相关,当P > 0.05 时,许多作者会称结果为“无显著性差异”。但这是错误,或者说是误导性的,因为P值表示了统计显著性的可能性,而不是效应不存在。即使P值不显著,依然应报告效应量,并说明结果的可能性,而不应简单得出“无效应”的结论。●“table 1”的P值可以适当省略。我们研究论文里的“table 1”主要是说研究人群的一些基本情况,有时会看到P值,但其实它不太重要。做随机对照试验时,P值能证明随机化做得好,但好多变量一起比的话,P值小于0.05可能是碰巧,不影响试验本质,所以不用理它。前面这是原文,老郑也认为RCT研究表1(Table 1)结果无须报告P值,为什么?(1)规范的随机对照试验,它就应该被认为是均衡可比的,采用意向性分析前无须进一步去论证其均衡性;(2)P值无法有效反映分组均衡性,因为小样本,即便是不均衡性的数据,P值也很可能>0.05,而大样本,即便是均衡性的数据,P值也很可能<0.05。而观察性研究里,更重要的是组间差异的大小,或者作者对于预测因子临床重要性的看法,而不是老盯着P值,用这些P值来指导分析方法。我写统计学方法的时候,感觉要把每个步骤都说得特别清楚好难啊。想问您一下,统计方法这部分,是不是真的要像说明书一样写得超级详细才行?
●新的医疗技术或统计学方法,需要详细描述,常规方法则不用。通常,使用相对较新或不常见的统计方法时,我们可以引用使用了该方法的论文,引用描述该方法的论文要更好。●软件描述要准确且详细。这算是最容易被忽略的一点了,我常常和我的学生说,你要明确告诉别人你用了什么软件,不要简单写“R”,要写如“R V.4.2.1”。另外,除了所使用的基础软件包外,还需要引用用户贡献的或专门用于特定统计方法的附加软件包。●报告缺失数据处理的详细信息。缺失数据随处可见,不管是因为研究对象拒绝回答问题,或者退出,还是其他什么原因,都要在论文中报告你是如何处理这个问题的。我论文里的结果部分,审稿老师说我的结果表述有问题。但我反复检查,看不出问题所在,有哪些情况需要注意呢?
●小数位数的使用不当。现在我们的一些百分比,均值的数据多是使用软件直接得出,如研究的样本量为105,样本中有55.238%是女性。但经验法则是任何一个理性的人都会认为足够的精确度,然后再加一个数字,例如,对于女性百分比,则可以报告55.2%。补充一下,大家认为一般情况下,假设检验的P值保留几位小数呢?发现,医学顶刊比如《BMJ》、《JAMA》、《NEJM》一般是大于0.01的保留2位,小于0.01的保留三位小数。国内期刊一般都保留三位小数。我建议,诸位写论文,P值保留三位小数为妥。后期可根据编辑部要求进行减少。
●谨慎使用“研究得出具有因果关联”的表述。如果你的研究是一项观察性研究,就要谨慎使用因果的字眼。例如,观察性研究可能表明父母教育水平与儿童营养不良之间存在关联,但这并不意味着提高父母教育水平就能消除儿童营养不良,只有某些形式的研究设计和研究方法才能归因于因果关联。今天的文章就分享到这里,文章想要顺利发表,这些小细节不能放过,希望对大家有所帮助!