非劣效性试验的关键统计学考虑

学术 2024-10-07 19:01 北京

心血管领域随机临床试验主要采用传统的优效性设计，但非劣效性试验变得越来越多见。鉴于非劣效性设计的应用范围不断扩大，本文对非劣效性设计的主要优点和局限性进行了总结，并讨论了一些关键的统计学注意事项。

非劣效性试验 vs. 优效性试验

优效性试验是要探讨，与对照组（可以是阳性药物或安慰剂）相比，一种治疗方法是否能显著改善特定终点。如果不能证明优效性，就不能说明该疗法是劣于还是不劣于对照组。但如果事先进行了非劣效性设计，试验就可以评估该疗法是否在一定程度上不劣于对照组，这就是非劣效性试验的基础。非劣效性试验评估的是一种新疗法不比既有疗法差。

非劣效试验的优势

在一些情况下，非劣效性试验可能是首选。其中一种情况是，针对特定人群已经有一种有效疗法，因此对照组使用安慰剂是不符合伦理的，但新疗法可能具有非疗效方面的优势。

新疗法可能是一种更安全的制剂或创伤性更小的手术，也可能是一种更方便或更便宜的疗法。例如，华法林是预防房颤患者卒中的一种成熟有效的方法，但华法林需要常规监测和频繁调整剂量，还可能与某些食物和药物发生相互作用，治疗窗口期较窄。

华法林具有疗效，但也有局限性，有研究将Xa因子抑制剂与华法林进行了非劣效性试验，以证明在一定程度内是非劣效的，同时让患者能享受到更简单的治疗，而不存在管理的困难。因此，为了证明选择非劣效性设计的合理性，必须明确说明这些新疗法在非疗效方面的益处。

非劣效性试验的另一个好处是，一旦确定了非劣效性，随后就可以对终点进行相比于对照组的优效性试验。要做到这一点，试验必须分层进行，即首先进行试验并达到非劣效性标准，然后再进行优效性试验。

非劣效性试验的挑战

需要注意的一点是，证明非劣效性不等于断定两种疗法具有等效性甚至相似性。相反，非劣效性试验评估的是一种新疗法在一定程度内不比对照组差，这是一种单侧检验。而等效性试验旨在确定新疗法既不劣于现有疗法，也不优于现有疗法，因此需要进行双侧检验。因此，等效性试验所需的样本量要大得多，也不太常见。

非劣效性试验的另一个关键问题是要确保设计和执行得当。由于治疗依从性差或过早停止研究疗法会弱化真正的治疗差异，实际上会增加达到非劣效性标准的可能性，从而错误地得出新疗法的非劣效性结论。在优效性试验中，意向性治疗（ITT）分析通常被认为是评估疗效较为保守的方法，但在ITT分析中，治疗效果可能会被削弱，从而导致不正确地达到了非劣效性标准。因此，除了采用ITT分析外，还必须采用治疗中分析或遵循研究方案（PP）分析来明确非劣效性。

非劣效性试验的关键统计学考虑

与优效性试验不同，非劣效性试验的目的是证明某种疗法并不比对照疗法差到不可接受的程度，这个就是预先规定的非劣效界值。非劣效性试验得出的结论的有效性，取决于所选择的界值。传统的指导原则是，界值应代表具有临床重要性效应的最小值。

选择极小的界值会导致试验需要极大的样本量，从而难以显示统计学上的非劣效性。使用过宽的界值会增加得出新疗法非劣效性结论的可能性，而按照临床标准，新疗法可能并不具有非劣效性。定义什么是临床上重要的界值既主观又不直接，有几种方法可为设定非劣效性界值提供指导。

其中一种方法是旨在保留历史试验中阳性对照药物相对于安慰剂的部分获益。在没有安慰剂组的情况下，这种方法旨在提供一些保证，所研究的新疗法与安慰剂相比具有更大的疗效。从安慰剂与当前对照组的阳性药物的历史试验中获得治疗效果，从而为新试验设定非劣效界值，以保留历史试验中阳性对照组相比安慰剂治疗效果的部分百分比。

通常，非劣效性试验会保留历史治疗效果置信区间下限的50%。Xa因子抑制剂与华法林的非劣效性试验就采用了这种方法。为满足非劣效性要求，主要终点的危险比的置信区间上限不超过1.4，即至少保留华法林相对于安慰剂获益的50%。这种方法的局限性在于，如果在后续试验中，新疗法显示与基于非劣效性批准的药物相比存在非劣效性，那么新药物的疗效获益可能会进一步减少。

非劣效性界值也可根据事件发生率的绝对风险差异来确定。然而，由于与研究疗法无关的其他多种原因，事件发生率往往会随着时间的推移而降低，从而导致非劣效性的相对界限过于宽松。

最后，由于依赖界值来定义非劣效性，因此在报告结果时，非劣效性试验必须关注置信区间，而不仅仅是P值。

参考文献：Circulation. 2024;150(11):823-825.

快来参加医咖会国庆学习挑战赛，活动期间，所有基础课程免费学，包括SPSS教程、样本量计算、Meta分析等。挑战成功后，更能领取好礼。点击阅读原文，马上去学习！

http://mp.weixin.qq.com/s?__biz=MzI2OTQyMzc5MA==&mid=2247521359&idx=1&sn=3651bbd7229f315327a4d4404acf47a8

医咖会

详细的医学统计教程；实例讲解临床研究设计；咨询临床研究方法学大咖；研究进展、临床指南、专家观点和循证医学案例...

最新文章

一预印本文章因共同作者“内讧”而撤稿，合著者称未征得其同意就发表

《eLife》将失去明年的影响因子，或被ESCI部分收录！

【直播预告】回顾性研究设计在临床科研中的应用

扭曲短语、不相关内容…这篇包含大量造假信号的论文引发“众怒”

一研究者被《Science》调查揭露数十篇论文造假，甚至鼓励实验室人员篡改数据

IF=35.5！每天5分钟改久坐为跑步，就可能降低血压

AI可以生成看似真实的论文图像，如何识别造假图片？

ChatGPT能给出有价值的同行评审意见吗？

如果你还没发SCI，那我真心建议你看看...

医学预测模型方法这么多，我该选择哪一个？

影响因子2.3，接受病例报告，欢迎投稿！

【视频】UK Biobank包含哪些数据？

JAMA子刊发布中国癌症30年发病率趋势，甲状腺癌发病率增长最大！

【直播预告】UK BioBank介绍及应用研究

根据科研诚信分析工具，这些期刊拥有最多的“可疑”论文！

《eLife》被on hold，警惕Clarivate的对学术公平的破坏

Web of Science暂停收录《eLife》（中科院1区），期刊硬刚回应“从未想要”影响因子

2024 ESC《血压升高和高血压管理指南》的10大要点

因太多的异常引用，期刊撤回一大学校长相关的75篇论文

这几种新型肿瘤试验设计，你都知道吗？

最新2024 AHA/ASA指南：卒中的一级预防

【公益讲座】外科临床研究与顶刊投稿经验分享（内附威科医学期刊APC折扣码）

JAMA：一图展示AI在临床中的10种应用场景

如何使用ChatGPT辅助快速列出写作提纲

美国一大学校长20年前发表的博士论文被指控剽窃：50多处未注明参考来源

收稿范围广，近两年发文量增长明显！JCR 2区期刊《Digital Health》诚邀中国作者投稿

想要开展一项回顾性研究，有哪些注意事项？

想利用AI检索和梳理文献？这几个工具值得一试！

【开课倒计时四天】利用公开数据库发顶刊SCI：老年健康调查“八库”训练营

柳叶刀发布最新综述：甲减的诊断和治疗

一病例报告因使用了患者外院的病历信息，发表后被人指控抄袭

2024“临床-统计交叉融合”学术交流，3天精彩讲座，不要错过！

内科学年鉴：代谢综合征患者限时进食，可以改善血糖！

Web of Science暂停收录《Cureus》和《Heliyon》期刊文章，来看两个期刊近年发文特征

顶尖研究者被质疑132篇论文有问题，目前已被撤职

利用公开数据库发顶刊SCI：老年健康调查“八库”训练营

非劣效性试验的关键统计学考虑

JAMA子刊：做科研的美国医生中，83.6%的人每周只能花不到10%的时间用于研究

真讽刺！号称要提升论文严谨性的论文因为不严谨而被撤稿...

慢阻肺合并心血管疾病领域的10大研究重点：美国胸科学会的研究声明

周末集中运动还是每天运动？只要量够，都与多种疾病风险降低相关！

Nature：130篇论文存在数据问题，均来自同一作者

期刊编辑：盘点论文中常见的统计错误

一项新研究指出：每7篇论文可能就有1篇造假

柳叶刀子刊发表全球卒中数据：卒中为全球第3大死因

UKB数据库分析：每天3杯咖啡，或显著降低心脏代谢疾病风险

2024年美国住院医薪酬调查：大多数住院医认为应该拿更高的薪水

诺奖风向标之拉斯克奖公布：“减肥神药”GLP-1的发现者获奖

NEJM：报告敏感性分析结果的四点建议

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉