心理统计和研究方法中常犯的七类错误

文摘   2024-10-25 10:48   北京  


在9月发表在BMJ Paediatrics Open上的一篇文章中,Flom等(2024汇集了该期刊的审稿人和编辑们在审稿过程中遇到的常见统计问题和最佳实践案例。通过对这些常见错误的分类和讨论,该文希望帮助作者在准备投稿时,提高报告的质量和严谨性。该团队通过调查问卷的形式,收集了统计审稿人和编辑在审稿过程中遇到的常见错误。这些错误被分为七个部分:图形表示、统计显著性及其相关问题、呈现方式、词汇、文本和表格呈现、因果关系、模型构建、回归和方法选择、元分析以及其他杂项。
一、图形表示  
饼图:饼图很少是数据可视化的最佳手段,尤其当类别较多时,点图等其他图形更为有效。
炸药图Dynamite plots):这种图表虽然形象,但往往难以从中得出结论,更好的选择包括条形图、箱形图等。
双轴图:这种图表无法清晰地展示出作者最关心的内容,并容易引起通过轻微改变轴的范围来操纵图表的嫌疑。更好的替代方案可能是分开的面板或比率图。
直方图:直方图的表现形式受起始值和箱宽影响很大,密度图等是更好的选择。
堆叠条形图:更好的选择是并排条形图、线图或镶嵌图。
使用图表展示结果时的原则:表格和图形应服务于不同的目的,表格用于展示具体数值,图形用于展示模式和关系。
二、统计显著性及其相关问题
p值未伴随效应量p值和效应量应一起呈现,以更好地理解研究结果。即便为了节约篇幅,在效应值和p值之间进行选择时,也应该是省略p值,保留效应值。
效应量未伴随置信区间(CIs:效应量应与CIs一起呈现,以便读者判断结果的可推广性。
近似p值的滥用:现代计算技术让研究者能提供精确的p值,因此,应避免使用近似值。对于p值非常小的情况,也应避免报告为"0.000",应改为 "< 0.001"。
使用“不显著”一词:当p > 0.05 时,许多作者会称结果为“无显著性差异”。但这是错误,或者说是误导性的,因为p值表示了统计显著性的可能性,而不是效应不存在。即使p值不显著,依然应报告效应量,并说明结果的可能性,而不应简单得出“无效应”的结论。
在描述性统计中报告p:在展示不同研究人群子组的基本社会人口统计学和临床特征时,使用p值很少是有用的。
三、呈现方式、词汇、文本和表格呈现
多变量与多水平的混淆:应根据实际情况选择正确的统计术语。
误用“±”符号:除非明确指出是标准误差、标准差还是置信区间,否则“±”符号本身没有意义。
新统计方法的描述不详细:应详细描述不熟悉或不常见的方法,并给出参考文献。
F统计量未伴随自由度(df:报告F统计量时需要同时报告分子和分母的自由度。
软件描述不清晰:应详细说明所使用的统计软件及其版本。例如,不要简单写“R”,要写如“R V.4.2.1”。另外,除了所使用的基础软件包外,还需要引用用户贡献的或专门用于特定统计方法的附加软件包。
功效分析描述不清晰:应提供足够的细节以便复现计算。
未详细报告缺失数据的处理:缺失数据随处可见,不管是因为研究对象拒绝回答问题,或者退出,还是其他什么原因,都要在论文中报告你是如何处理这个问题的。             
四、因果关系
因果语言的滥用:只有特定的研究设计和方法才能让我们得出因果关系,应避免从观察性研究中得出过于宽泛的结论。
五、模型构建、回归和方法选择
不恰当的敏感性分析:一般不建议进行数据驱动的敏感性分析,如元分析中的 “剔除”分析,以及从数据集中剔除观察到的“异常值”,因为此类分析可能会导致剔除有效数据和选择性报告,并在进行多项敏感性分析时增加统计I型错误的风险。事后敏感性分析必须仔细说明理由,并务必说明你究竟在检验什么。
任意进行变量选择:这些方法可能导致p值过低、标准误差过小和参数估计偏差。
过度使用线性回归:存在许多新工具和方法,作者在选择回归方法时应考虑这些进展。
因“每个人都这样做”而使用不恰当的方法:这是一个糟糕的理由,应该追求更好的方法论。
六、元分析
PRISMA指南的误用PRISMAPreferred Reporting Items for Systematic Reviews and Meta-Analyse)是报告元分析的指南,而不是进行元分析的指南。
将I²误解为异质性的绝对度量:I²是相对度量,应作为不一致性的度量来解释。
根据I²割点选择固定效应与随机效应模型:选择模型应基于推断意图和临床异质性,而不是仅基于I²值。
因共同人群效应量而使用固定效应模型:除非是纯复制的元分析,否则很少假定所选研究计算了共同的人群效应量。
七、其他杂项
不恰当的描述性统计:均值和中位数不是唯一的中心趋势度量,应根据数据分布选择合适的度量。
几率与风险的混淆:几率(Odds)和风险(Risk)不是同一概念,几率比(OR)和风险比(RR)也不相同。
报告数字时的小数位使用不恰当:根据合理精度报告数字,避免过度精确。原则上,一般是大于0.01的保留2位,小于0.01的保留三位小数。

数字的书写:小数字最好用文字书写,大数字则不用。

图源:pixabay.com

可见,遵循一些基本的统计学实践原则,可以使研究结果更加稳健,文章更加清晰。这项研究能为科研工作者提供宝贵的指导,帮助他们在未来的工作中避免这些常见的统计学陷阱。

引用该文:

Flom, P., Harron, K., Ballesteros, J., Kalinda, C., Koutoumanou, E., Miles, J., Nevitt, S. J., & Rohloff, P. (2024). Common errors in statistics and methods. BMJ paediatrics open, 8(1), e002755. https://doi.org/10.1136/bmjpo-2024-002755



相关图书推荐:




心理学研究方法:从选题到论文发表

点击封面,即可购买


王轶楠 编著

978-7-300-27971-8

2020年2月


本书以三名热爱科研的心理学学生的学术成长经历为线索,系统介绍了心理学研究的具体过程,以及其中可能遇到的各种问题及其解决方案,力争让读者在亲切共情的氛围中,学会如何探索研究兴趣,凝炼研究问题,明确研究假设,申请科研项目,最终撰写与发表学术论文。

行为科学统计精要(第10版)

点击封面,即可购买


【美】弗雷德里克·格雷维特 等 著

Frederick J. Gravetter et al.

刘红云 骆方 译

978-7-300-32781-5

2024年6月


这是一部经典的统计学教材,来自作者团队30余年应用统计和实验设计的教学实践。本书的最大特点在于方法清晰、内涵深刻、叙述生动。书中提供了大量应用性案例和课后练习,帮助数学基础薄弱的学生真正理解统计思想,掌握统计分析的技能。本书不教你如何做题,而是让你理解统计学的精神。因此,无论你基础如何,你都会在作者的耐心引导下无压力地进入统计学殿堂。

心理书坊
心理学,神经科学,精神病学,心理咨询与治疗……
 最新文章