BMJ子刊:盘点论文中常见的统计错误,帮你避坑

健康   2024-10-14 07:47   浙江  

直播预告

10月20日,郑老师新一期NHANES直播课来了!详情可点击下方链接了解
针对公共数据库NHANES数据挖掘直播,快速下载分析数据

辛辛苦苦写好一篇文章投稿,就因为一个统计小错误被Editor“秒拒”,冤不冤?
今天分享一篇近期BMJ子刊《BMJ Paediatrics Open》在线发表的一篇综述,由期刊编辑和审稿人编撰,总结了在审核论文时常见的统计错误,并提出具体的改进建议,含金量还是蛮高的。
我看完也有些收获,分享给大家,正好借着这个机会回答一下大家在投稿时常遇到的三个问题。

Q1

郑老师,我写文章报告结果的时候,有点纠结,不知道该多强调效应值还是P值。还有就是,报告P值的时候,要怎样才能写得清楚又严谨呢?

●首先,有效应值首选效应值。在很多研究中,作者仅报告了P值,反而忽略效应值(OR、RR值等),甚至为了减少字数,删掉了很多重要信息。事实上,效应值能直接衡量处理或暴露对结果的影响,相较而言,比P值更有意义。
就算是为了节约篇幅,在效应值和P值之间进行选择时,也应该是省略P值,保留效应值。很多医学顶刊文章就是这样做的。
图1 医学顶刊JAMA文章表格截图
●其次,报告精确的P值。过去由于计算能力受限,一些作者会用 "P< 0.05" 的方式近似表示P值。但现在软件可以给出P值的精确值,如果有精确值,就没有理由使用近似值,不能不考虑原因的参照过去的文章。 
对于P 值非常小的情况,也应避免报告为"0.000",应改为 "< 0.001"。
例如这篇中国医科大学学者发表在JAMA子刊的研究论文,他们对P值的使用就非常规范。记住,P值不能是0(也不会是1)。
图2 JAMA子刊文章表格截图
减少下“不显著”的结论。这个问题也与我们的P值相关,当P > 0.05 时,许多作者会称结果为“无显著性差异”。但这是错误,或者说是误导性的,因为P值表示了统计显著性的可能性,而不是效应不存在。
即使P值不显著,依然应报告效应量,并说明结果的可能性,而不应简单得出“无效应”的结论。
“table 1”的P值可以适当省略。我们研究论文里的“table 1”主要是说研究人群的一些基本情况,有时会看到P值,但其实它不太重要。
做随机对照试验时,P值能证明随机化做得好,但好多变量一起比的话,P值小于0.05可能是碰巧,不影响试验本质,所以不用理它。
前面这是原文,老郑也认为RCT研究表1(Table 1)结果无须报告P值,为什么?
有以下2点理由:
(1)规范的随机对照试验,它就应该被认为是均衡可比的,采用意向性分析前无须进一步去论证其均衡性;
(2)P值无法有效反映分组均衡性,因为小样本,即便是不均衡性的数据,P值也很可能>0.05,而大样本,即便是均衡性的数据,P值也很可能<0.05。
而观察性研究里,更重要的是组间差异的大小,或者作者对于预测因子临床重要性的看法,而不是老盯着P值,用这些P值来指导分析方法

Q2

郑老师,我写统计学方法的时候,感觉要把每个步骤都说得特别清楚好难啊。想问您一下,统计方法这部分,是不是真的要像说明书一样写得超级详细才行?

新的医疗技术或统计学方法,需要详细描述,常规方法则不用。通常,使用相对较新或不常见的统计方法时,我们可以引用使用了该方法的论文,引用描述该方法的论文要更好。
软件描述要准确且详细。这算是最容易被忽略的一点了,我常常和我的学生说,你要明确告诉别人你用了什么软件,不要简单写“R”,要写如“R V.4.2.1”。另外,除了所使用的基础软件包外,还需要引用用户贡献的或专门用于特定统计方法的附加软件包。
报告缺失数据处理的详细信息。缺失数据随处可见,不管是因为研究对象拒绝回答问题,或者退出,还是其他什么原因,都要在论文中报告你是如何处理这个问题的。
最常见的还是多重插补法,感兴趣的不妨看一下我们之前的公益直播回放。

Q3

郑老师,我论文里的结果部分,审稿老师说我的结果表述有问题。但我反复检查,看不出问题所在,有哪些情况需要注意呢?

●小数位数的使用不当现在我们的一些百分比,均值的数据多是使用软件直接得出,研究的样本量为105,样本中有55.238%是女性。但经验法则是任何一个理性的人都会认为足够的精确度,然后再加一个数字,例如,对于女性百分比,则可以报告55.2%。
补充一下,大家认为一般情况下,假设检验的P值保留几位小数呢?

郑老师发现,医学顶刊比如《BMJ》、《JAMA》、《NEJM》一般是大于0.01的保留2位,小于0.01的保留三位小数。国内期刊一般都保留三位小数。我建议,诸位写论文,P值保留三位小数为妥。后期可根据编辑部要求进行减少。

●谨慎使用“研究得出具有因果关联”的表述。如果你的研究是一项观察性研究,就要谨慎使用因果的字眼。
例如,观察性研究可能表明父母教育水平与儿童营养不良之间存在关联,但这并不意味着提高父母教育水平就能消除儿童营养不良,只有某些形式的研究设计和研究方法才能归因于因果关联。
今天的文章就分享到这里,文章想要顺利发表,这些小细节不能放过,希望对大家有所帮助!

关于郑老师统计团队及公众号

全国较大的线上医学统计公众号平台,专注于医学生、医护工作者学术研究统计支持,我们是你们统计助理!

我们提供以下科研与统计服务:
研究者发起的临床、护理试验项目
医院回顾性数据分析与预测模型
医学数据库SEER、NHANES、GBD、孟德尔随机化等挖掘发表级数据
预测模型、GBD、NHANES医学数据库挖掘1对1R语言指导
联系助教小董咨询(微信号aq566665

医学论文与统计分析
本号为高校统计学老师所设,介绍医学论文进展与统计学方法,SPSS分析方法、真实世界研究、R语言与数据挖掘。关注后,发送关键词“33”到公众号就可以获取常见的统计软件比如Spss,sas,PASS(绝对无毒)等
 最新文章