国际顶级医学期刊《柳叶刀》(The Lancet)最近发表了一篇实用的通讯文章(Correspondence),该篇Correspondence基于过去3年内对提交给《柳叶刀》的1000多篇manuscripts进行审核的经验,总结了科研report中常见统计使用错误,并给出了规避统计使用错误的建议,值得一读。
小编强行学习了一下,原文见文末!
描述性统计对于理解数据至关重要,对于定量变量选择何种描述性统计指标描述,根据数据分布情况而定,可选择报告均值和标准差,或者报告中位数和四分位数范围(IQR)。同时,需要提供分析中使用的变量的直方图或表格等补充资料。 所有统计分析都建立在基本假设的基础上,如果可行的话,最好使用图形检查所有模型假设。 显示精确的p值,例如,0.032的p值应显示为p=0.032,而不是p<0.05,然而,可以使用不等式p<0.0001来报告非常小的p值。 不要简单将结果描述为没有效果,除非区间估计的所有效应值均没有临床意义。 基于临床重要性解释结果,并使用95%置信区间适当估计关联。 根据背景信息识别混杂因素,而不是统计学检验。 如果缺失数据的比例很高,可能会影响结果,不要简单删除不完整数据,建议使用逆概率加权或多重插补等方法。 使用专用的方法评估和处理稀疏数据偏倚(sparse-data bias)。 如果结果发生率较高,应报告危险比(risk ratio)或危险差(risk difference),而不是比值比(odds ratio)。 即使使用了相乘模型(multiplicative),也要评估相加交互作用(additive interactions)。
全文总结如下,
-END- 分享一份Python可视化教程(基于py可视化利器seaborn):530张图形+8000行代码+详细代码注释+后续免费更新+学习交流群,教程部分内容, 例如,
👉可视化配色工具,colormap多达3174类,数万种颜色!
每类图表包含详细代码+详细代码注释,多达8000行代码,例如,
如何加入学习?
👇加入学习(收费、备注:169)
✅解锁获取6大权限:
8000+行代码(复制即可运行) 在线教程文档(清晰目录) 依赖数据(免费下载) 交流群 后续更新 定期抽最新机器学习、数据科学类书籍 点个 在看、赞 就是最大的支持