所有的P≤0.05为何结论却是阴性结果?来看JAMA正刊的一个活生生例子

健康   2024-12-19 07:49   浙江  

2024年底直播预告

2024年“临床试验设计与数据分析"直播课12.22 举行,欢迎参加!

今天题目可能有点标题党,但事实上可能大多数人一下子想不到,为什么P≤0.05,结论却是阴性的呢。
下面,我们简单看看这篇JAMA主刊的文章,帮助大家理解!
2024年12月2日,医学顶刊《JAMA》(医学一区top,IF=63.1)发表了一篇题为Personalized Patient Data and Behavioral Nudges to Improve Adherence to Chronic Cardiovascular Medications:A Randomized Pragmatic Trial的研究论文,旨在比较三种不同类型的短信策略与常规护理,以提高不依从心血管药物治疗的患者的药物补充依从性。

如果你需要全文,请公众号后台回复关键词“pdf”更多关于临床试验设计与数据分析服务,请联系郑老师团队,助教微信:aq566665

研究设计

P(Population)研究对象:年龄在18~90岁之间,9501例确诊1种或多种心血管疾病并给予药物治疗的患者。【心血管疾病定义为:高血压、高脂血症、糖尿病、冠状动脉疾病[CAD]或房颤。】
I(Intervention)试验组:
(1) 通用提醒短信补充药物的短信提醒
(2) 行为轻推短信(通过文本内容促进用户立即补充药物)
(3) 行为轻推短信+固定消息聊天机器人(在行为轻推的短信基础上加一个聊天机器人,该机器人使用预编程算法与患者互动)
C(Comparison)对照组:常规护理(患者不接收短信)
O(Outcome)结局
主要结局:药物补充依从性,即在12个月内药物覆盖的天数比例(PDC)。
该数值基于药店数据计算,所有类别的药物在基线时就已确定补充间隙。
次要结局:急诊科就诊、住院和死亡的临床事件。
S(Study design)研究类型实效性随机对照试验




本研究是一篇实效性随机对照试验,关于实效性随机对照试验的定义,可以看一下郑老师之前的推文:实效性临床试验介绍

这项试验在三个不同的美国医疗保健系统中进行,涵盖了多样化的患者群体,包括传统上在临床试验中代表性不足的患者(如约49%的西班牙裔患者)。
这种设计使得试验结果更有可能代表真实世界中的患者群体,也是本研究实效性的体现。
图1 研究流程

个性化提醒并未增加患者的药物依从性

研究结果表明,在12个月时,各组的药物平均PDC:
  • 通用短信提醒组为62.0%;
  • 行为轻推短信为62.3%;
  • 行为轻推+聊天机器人为63.0%;
  • 常规护理为60.6%。
图2 每月覆盖天数比例
结果发现,与常规护理相比:
  • 通用提醒组的平均PDC高出2.2个百分点(P=0.02)
  • 行为轻推组高出2.0个百分点(P=0.04),
  • 行为轻推+聊天机器人组高出2.3个百分点(P=0.02)
可以看到,P值均小于0.05,但是最后作者仍然下了阴性的结论, 短信提醒在12个月时并未提高药物补充依从性。
这是为何呢?
图3 矫正调整后,与常规护理相比,干预组的覆盖天数差异

统计学解读

这个道理也很简单,高质量临床试验,多组比较需要控制假阳性率的情况,也就是一类错误,如果多次比较不调整检验水准α,仍然P≤0.05,便具有统计学意义,那容易得到不真实的有阳性结果。
研究者采用了多阶段gatekeeper方法通过调整检验水准α的方式来控制假阳性。
  • 第一阶段:将3个治疗组与常规护理组进行比较,使用校正阈值0.05/3进行多重治疗比较,P<0.017为有统计学意义;
  • 第二阶段:如果有任何一个检验有显著性,则对3个两两比较采用显著性水平(R/3)×(0.05/3)的Holm方法,其中R为第一阶段检验的显著性数量。
在调整分析中,第一阶段分析后,使用调整后的显著性水平0.05/3进行比较时并不显著,因此没有进行第二阶段干预组之间的成对比较。
所以所有结果都是有阴性结果!!!!
临床试验中多组比较十分常见,因此,在不同的临床研究中需要采用不同的策略与方法将总体Ⅰ类错误率控制在预设的水平,进行多重性调整控制假阳性。
√也就是说多组比较假阳性问题不得不考虑!
那如何控制?常用方法有这几个:
(1)平行策略多重性调整方法——Bonferroni方法
(2)序贯策略多重性调整方法——Holm 递减方法
(3)序贯策略多重性调整方法——Hochberg递增方法
(4)序贯策略多重性调整方法——固定顺序的检验方法
(5)序贯策略多重性调整方法——回退法
方法介绍我就不过多赘述了,老郑之前开展过一期公益直播,可参见本公众号同名视频号中【第9期 临床试验假阳性问题的统计学考虑】
也可参考这篇推文:中医药研究文章再发国际顶刊!我今天来聊聊多组两两比较的统计学方法
√是不是所有多重比较都要控制假阳性呢?
老郑告诉你,医学研究中,不是所有多重比较都要控制假阳性
医学研究,有随机对照研究,也有观察性研究,多组比较实际上大多数都不用控制,尤其是观察性研究,因为观察性研究绝大多数是探索性的研究。
只有验证性的随机对照研究才需要,比如3期临床试验。其他的探索性研究,很多临床大夫发起的临床试验,都可以不用控制。验证性医学研究次要结局指标也可以不需要。
好了,今天就分享到这里,希望大家有所收获
欢迎大家报名本周末老郑的直播课!

12.22郑老师临床试验项目设计直播

2024年“临床试验设计与数据分析"直播课,欢迎参加!

关于郑老师团队及公众号 

全国较大的线上医学统计公众号平台,专注于医学生、医护工作者学术研究统计支持,我们是统计助理!


我们提供以下临床试验全流程服务:

①随机对照研究方案设计指导
②撰写统计分析计划
③规范靠谱的数据分析
④论文写作指导与统计修回

详情链接:
临床试验项目设计与数据分析,我们是可靠的合作伙伴

联系陈老师咨询(微信号sas555777)



医学论文与统计分析
本号为高校统计学老师所设,介绍医学论文进展与统计学方法,SPSS分析方法、真实世界研究、R语言与数据挖掘。关注后,发送关键词“33”到公众号就可以获取常见的统计软件比如Spss,sas,PASS(绝对无毒)等
 最新文章