非劣效性试验的关键统计学考虑

学术   2024-10-07 19:01   北京  
心血管领域随机临床试验主要采用传统的优效性设计,但非劣效性试验变得越来越多见。鉴于非劣效性设计的应用范围不断扩大,本文对非劣效性设计的主要优点和局限性进行了总结,并讨论了一些关键的统计学注意事项。

非劣效性试验 vs. 优效性试验 

优效性试验是要探讨,与对照组(可以是阳性药物或安慰剂)相比,一种治疗方法是否能显著改善特定终点。如果不能证明优效性,就不能说明该疗法是劣于还是不劣于对照组但如果事先进行了非劣效性设计,试验就可以评估该疗法是否在一定程度上不劣于对照组,这就是非劣效性试验的基础。非劣效性试验评估的是一种新疗法不比既有疗法差

非劣效试验的优势

在一些情况下,非劣效性试验可能是首选。其中一种情况是,针对特定人群已经有一种有效疗法,因此对照组使用安慰剂是不符合伦理的,但新疗法可能具有非疗效方面的优势

新疗法可能是一种更安全的制剂或创伤性更小的手术,也可能是一种更方便或更便宜的疗法。例如,华法林是预防房颤患者卒中的一种成熟有效的方法,但华法林需要常规监测和频繁调整剂量,还可能与某些食物和药物发生相互作用,治疗窗口期较窄。

华法林具有疗效,但也有局限性,有研究将Xa因子抑制剂与华法林进行了非劣效性试验,以证明在一定程度内是非劣效的,同时让患者能享受到更简单的治疗,而不存在管理的困难。因此,为了证明选择非劣效性设计的合理性,必须明确说明这些新疗法在非疗效方面的益处

非劣效性试验的另一个好处是,一旦确定了非劣效性,随后就可以对终点进行相比于对照组的优效性试验。要做到这一点,试验必须分层进行,即首先进行试验并达到非劣效性标准,然后再进行优效性试验

非劣效性试验的挑战

需要注意的一点是,证明非劣效性不等于断定两种疗法具有等效性甚至相似性。相反,非劣效性试验评估的是一种新疗法在一定程度内不比对照组差,这是一种单侧检验。而等效性试验旨在确定新疗法既不劣于现有疗法,也不优于现有疗法,因此需要进行双侧检验。因此,等效性试验所需的样本量要大得多,也不太常见。

非劣效性试验的另一个关键问题是要确保设计和执行得当。由于治疗依从性差或过早停止研究疗法会弱化真正的治疗差异,实际上会增加达到非劣效性标准的可能性,从而错误地得出新疗法的非劣效性结论。在优效性试验中,意向性治疗(ITT)分析通常被认为是评估疗效较为保守的方法,但在ITT分析中,治疗效果可能会被削弱,从而导致不正确地达到了非劣效性标准。因此,除了采用ITT分析外,还必须采用治疗中分析或遵循研究方案(PP)分析来明确非劣效性

非劣效性试验的关键统计学考虑

与优效性试验不同,非劣效性试验的目的是证明某种疗法并不比对照疗法差到不可接受的程度,这个就是预先规定的非劣效界值。非劣效性试验得出的结论的有效性,取决于所选择的界值。传统的指导原则是,界值应代表具有临床重要性效应的最小值

选择极小的界值会导致试验需要极大的样本量,从而难以显示统计学上的非劣效性。使用过宽的界值会增加得出新疗法非劣效性结论的可能性,而按照临床标准,新疗法可能并不具有非劣效性。定义什么是临床上重要的界值既主观又不直接,有几种方法可为设定非劣效性界值提供指导。

其中一种方法是旨在保留历史试验中阳性对照药物相对于安慰剂的部分获益在没有安慰剂组的情况下,这种方法旨在提供一些保证,所研究的新疗法与安慰剂相比具有更大的疗效。从安慰剂与当前对照组的阳性药物的历史试验中获得治疗效果,从而为新试验设定非劣效界值,以保留历史试验中阳性对照组相比安慰剂治疗效果的部分百分比。

通常,非劣效性试验会保留历史治疗效果置信区间下限的50%。Xa因子抑制剂与华法林的非劣效性试验就采用了这种方法。为满足非劣效性要求,主要终点的危险比的置信区间上限不超过1.4,即至少保留华法林相对于安慰剂获益的50%。这种方法的局限性在于,如果在后续试验中,新疗法显示与基于非劣效性批准的药物相比存在非劣效性,那么新药物的疗效获益可能会进一步减少

非劣效性界值也可根据事件发生率的绝对风险差异来确定。然而,由于与研究疗法无关的其他多种原因,事件发生率往往会随着时间的推移而降低,从而导致非劣效性的相对界限过于宽松。

最后,由于依赖界值来定义非劣效性,因此在报告结果时,非劣效性试验必须关注置信区间,而不仅仅是P值

参考文献:Circulation. 2024;150(11):823-825.

快来参加医咖会国庆学习挑战赛,活动期间,所有基础课程免费学,包括SPSS教程、样本量计算、Meta分析等。挑战成功后,更能领取好礼。点击阅读原文,马上去学习!

医咖会
详细的医学统计教程;实例讲解临床研究设计;咨询临床研究方法学大咖;研究进展、临床指南、专家观点和循证医学案例...
 最新文章