在双准则决策框架下,有三种可能的错误决策率:
• “错误通过率”定义为在治疗无效时做出“通过”决定的概率,类似于单侧的I型错误。
• “假不通过率”定义为在治疗有效时做出“不通过”决定的概率,类似于 II 型错误。
• “错误考虑率”被定义为当治疗无效或有效时做出“考虑”决定的概率
我们使用贝叶斯最佳第 2 阶段双准则(BOP2-DC)设计来监控事件发生时间终点,该设计允许在试验结束时做出“通过/考虑/不通过”的决定。“通过”表示治疗被认为是可以接受的,“考虑”意味着治疗是值得考虑的,“不通过”意味着治疗被认为是不可接受的。让我们μ表示中位生存时间。BOP2-DC 设计可最大限度地提高正确通过率(CGR),同时将错误通过率(FGR)、错误不通过率(FNGR)和错误考虑率(FCR)控制在预先指定的水平。
CGR:治疗有效时正确做出“通过”决定的概率,即CGR=Pr(go|μ=10).
FGR:当治疗无效时错误地做出“通过”决定的概率,即FGR=Pr(go|μ=6).
FNGR:当治疗有效时错误地做出“不通过”决定的概率,即FNGR=Pr(nogo|μ=10).
FCR:当治疗无效或有效时,错误做出“考虑”决定的概率,即 FCR=max(Pr(consider|μ=10),Pr(consider|μ=6)).
在这里,CGR 类似于Power,FGR 和FNGR 分别类似于 I 类和II 类错误。
设 n 表示中间样本量,N 表示最大样本量。设μ_LRV=6 表示μ 的较低参考值,μ_CMV=8 表示μ 的最小临床意义值。如果新疗法显示出μ>μ_LRV较高的后验概率,则认为该疗法在统计学上有效,并且当它显示出中等后验概率时,该μ>μ_CMV被认为在临床上更优越。BOP2-DC 做出“通过/考虑/不通过”决策如下:
这里λ_LRV=0.7、γ_LRV=1、λ_CMV=0.5和γ_CMV=0是经过优化的设计参数,可在μ=10下最大化CGR,同时控制FGR≤0.05、FNGR≤0.2和FCR≤0.3。假设μ 的模糊的逆伽马先验 IG(1.05,0.43)。
对于第 i 个患者,让 Z_i 表示事件发生的时间,U_i 表示删失时间,T_i=min(Z_i,U_i )表示观察时间。总观测时间(TOT)定义为。也就是说,TOT 是有事件的患者的事件时间和被审查的患者的审查时间的总和。上述决策规则导致以下停止边界,并产生统计上的真实通过率 0.752:
*在中期,“通过”和“考虑”意味着继续试验
以下是基于使用BOP2-DC Web应用程序(BOP2-DC V1.0.6.0)进行的5000次仿真的设计操作特性,该应用程序可在以下网址获得
http://www.trialdesign.org.
Efficacy and Toxicity Monitoring
Co-primary Efficacy Monitoring/
Efficacy Monitoring
以上三种endpoints类型,大家可以自行模拟。
*与“考虑”决定相对应。
Trial setting tips:
根据美国食品和药物管理局(FDA)指南(2017)的术语,我们使用多个疗效终点来表示对两个主要终点中至少一个的治疗效果足以确定临床益处的情况。
20 和 30,然后输入“10 20 30 40”。要获得没有中期分析(即只有最终分析)的设计,请输入“0 40”。应校准样本量以获得理想的操作特性,特别是正确的通过率(当治疗有效时),这类似于功效,给定预先指定的错误通过率、错误不通过率和错误考虑率μ。
BOP2 假设μ 遵循逆伽马先验分布 IG(a, b log2),其中 a 和 b 根据用户输入的“零中位生存时间”(表示为 tn)和“先前有效样本量”(表示为 n0 > 0)确定,如下所示:a = n0 + 1,b = n0tn/log2 该先验设置先验均值等于原假设的中位生存时间,具有等效于 N0 事件的先验信息。我们推荐的默认模糊先验集 n0 = 0.05。
Reference
Zhao, Y., Li, D., Liu, R., & Yuan, Y. (2021). Bayesian optimal phase II designs with dual-criterion decision-making framework. Submitted