期刊编辑：盘点论文中常见的统计错误

学术 2024-09-27 19:03 北京

本文整理自一篇题为“Common errors in statistics and methods”的综述，由期刊编辑和审稿人所撰写，总结了在审核论文时经常见到的统计错误，希望能够帮助准备投稿的研究者以避免踩坑。

统计学显著性和P值

只有P值，没有效应值

一些作者常在论文只给出p值而不给出效应值（如OR、RR）。如果是为了减少字数，在效应值和p值之间进行选择时，建议选择省略p值。效应值代表效应的大小，例如，患者风险降低了多少，在研究中具有显而易见的重要性。

使用近似的p值

一些作者可能会以近似值的形式陈述p值，通常使用不等式，例如p<0.05。这是在计算机和统计软件普及之前遗留下来的，当时需要在表格或教科书中查找统计量，通常无法获得准确的 p 值。现在软件可以给出P值的精确值，如果有精确值，就没有理由使用近似值。

一个例外是p值非常小，甚至计算机软件都可能无法准确计算p值。对于这些非常小的p值，不要报告为“0.0000”。p值不能是0（也不会是1）。某些软件可能会由于四舍五入而输出这样的值，这意味着p小于某个值，通常是 0.001 或0.0001，就能表示诸如为“P< 0.001”。

“table 1”的P值

论文的“table 1”通常是显示不同研究人群的人口统计学和临床特征，我们也常能看到一些论文会放上p值，但这里的P值作用很小。在随机对照试验的情况下，p值可以证明随机化的“有效”，但由于是对多个变量进行比较，可能会偶然出现P<0.05的情况。但这改变了这是一项随机试验的本质，这些值也不应改变预先制定的分析计划，因此只需忽略p值。

在观察性研究中，比p值更重要的是组间差异的大小，或者作者对于预测因子临床重要性的看法。在table 1中给出p值会导致作者倾向于让这些p值来指导分析方法，例如，使用p值作为构建回归模型的筛选策略，但这不是正确的方法。

统计方法的表述问题

缺乏关于高级或新统计方法的细节

当使用一种新的医疗技术（例如新药或新手术）时，作者需要详细描述；对于非常常见的技术，不需要这样做。统计方法也是如此。通常，使用相对较新或不常见的统计方法时，作者可以引用使用了该方法的论文，引用描述该方法的论文要更好。此外，不要引用无法访问、不正确或反对使用该方法的论文。

对所用软件的描述不明确

就像作者应该告诉读者所使用的药物是哪家公司生产的一样，也应该告诉读者使用了什么统计软件，而且要足够详细，以便大家可以去找到。不要简单写“R”，而应该是“R V.3.12”。另外，不要把前端和软件混为一谈，例如，RStudio是编辑器，而R是统计软件。此外，除了所使用的基础软件包外，还需要引用用户贡献的或专门用于特定统计方法的附加软件包。

缺乏有关如何处理缺失数据的详细信息

缺失数据随处可见，例如研究对象拒绝回答问题，或者退出，或者数据丢失，或者其他什么原因，要告诉读者你是如何处理这个问题的。常见的方法是多重插补，这种方法尚未得到充分利用，但在现代统计软件中越来越简单易用。

结果的表述问题

小数位数使用不当

如果研究的样本量为105，不要说样本中有55.238%是女性。同样，如果测量了年龄（以岁为单位），不要说平均年龄是34.561。经验法则是任何一个理性的人都会认为足够的精确度，然后再加一个数字，例如，对于以岁为单位的平均年龄，精确到1岁以内几乎肯定足够，因此可以报告1位小数：34.6 岁。对于女性百分比，则可以报告55.2%。

因果关联的表述

谨慎使用因果的字眼，只有某些形式的研究设计和研究方法才能归因于因果关联。避免从观察性研究中得出笼统的结论。观察性研究可能表明父母教育水平与儿童营养不良之间存在关联，但这并不意味着提高父母教育水平就能消除儿童营养不良。当作者犯下这个基本错误时，编辑通常会拒绝将论文送去同行评审。

参考文献：BMJ Paediatr Open. 2024; 8(1): e002755.

-----分割线------

医咖会在2023年上线了样本量计算小工具，将既往推出的样本量计算教程融入到每一步操作中，并有每个参数的说明以及取值建议。

点击左下角“阅读原文”即可使用，手机端和电脑端均可以体验哦！

http://mp.weixin.qq.com/s?__biz=MzI2OTQyMzc5MA==&mid=2247521242&idx=1&sn=dd4bf408688d133e49e1e53aae5944a7

医咖会

详细的医学统计教程；实例讲解临床研究设计；咨询临床研究方法学大咖；研究进展、临床指南、专家观点和循证医学案例...

最新文章

一预印本文章因共同作者“内讧”而撤稿，合著者称未征得其同意就发表

《eLife》将失去明年的影响因子，或被ESCI部分收录！

【直播预告】回顾性研究设计在临床科研中的应用

扭曲短语、不相关内容…这篇包含大量造假信号的论文引发“众怒”

一研究者被《Science》调查揭露数十篇论文造假，甚至鼓励实验室人员篡改数据

IF=35.5！每天5分钟改久坐为跑步，就可能降低血压

AI可以生成看似真实的论文图像，如何识别造假图片？

ChatGPT能给出有价值的同行评审意见吗？

如果你还没发SCI，那我真心建议你看看...

医学预测模型方法这么多，我该选择哪一个？

影响因子2.3，接受病例报告，欢迎投稿！

【视频】UK Biobank包含哪些数据？

JAMA子刊发布中国癌症30年发病率趋势，甲状腺癌发病率增长最大！

【直播预告】UK BioBank介绍及应用研究

根据科研诚信分析工具，这些期刊拥有最多的“可疑”论文！

《eLife》被on hold，警惕Clarivate的对学术公平的破坏

Web of Science暂停收录《eLife》（中科院1区），期刊硬刚回应“从未想要”影响因子

2024 ESC《血压升高和高血压管理指南》的10大要点

因太多的异常引用，期刊撤回一大学校长相关的75篇论文

这几种新型肿瘤试验设计，你都知道吗？

最新2024 AHA/ASA指南：卒中的一级预防

【公益讲座】外科临床研究与顶刊投稿经验分享（内附威科医学期刊APC折扣码）

JAMA：一图展示AI在临床中的10种应用场景

如何使用ChatGPT辅助快速列出写作提纲

美国一大学校长20年前发表的博士论文被指控剽窃：50多处未注明参考来源

收稿范围广，近两年发文量增长明显！JCR 2区期刊《Digital Health》诚邀中国作者投稿

想要开展一项回顾性研究，有哪些注意事项？

想利用AI检索和梳理文献？这几个工具值得一试！

【开课倒计时四天】利用公开数据库发顶刊SCI：老年健康调查“八库”训练营

柳叶刀发布最新综述：甲减的诊断和治疗

一病例报告因使用了患者外院的病历信息，发表后被人指控抄袭

2024“临床-统计交叉融合”学术交流，3天精彩讲座，不要错过！

内科学年鉴：代谢综合征患者限时进食，可以改善血糖！

Web of Science暂停收录《Cureus》和《Heliyon》期刊文章，来看两个期刊近年发文特征

顶尖研究者被质疑132篇论文有问题，目前已被撤职

利用公开数据库发顶刊SCI：老年健康调查“八库”训练营

非劣效性试验的关键统计学考虑

JAMA子刊：做科研的美国医生中，83.6%的人每周只能花不到10%的时间用于研究

真讽刺！号称要提升论文严谨性的论文因为不严谨而被撤稿...

慢阻肺合并心血管疾病领域的10大研究重点：美国胸科学会的研究声明

周末集中运动还是每天运动？只要量够，都与多种疾病风险降低相关！

Nature：130篇论文存在数据问题，均来自同一作者

期刊编辑：盘点论文中常见的统计错误

一项新研究指出：每7篇论文可能就有1篇造假

柳叶刀子刊发表全球卒中数据：卒中为全球第3大死因

UKB数据库分析：每天3杯咖啡，或显著降低心脏代谢疾病风险

2024年美国住院医薪酬调查：大多数住院医认为应该拿更高的薪水

诺奖风向标之拉斯克奖公布：“减肥神药”GLP-1的发现者获奖

NEJM：报告敏感性分析结果的四点建议

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉