对于涉及生存﴾事件发生时间﴿终点的研究,治疗效果的参数δ定义为治疗组与对照组风险比的对数;δ = ln(HR)。在比例风险下,δ<0 表示治疗组的生存时间比对照组长。
检验原假设H0: δ = 0 与单侧和双侧备择相比,我们利用了顺序计算的logrank统计量的独立增量结构﴾Tsiatis,1981;Jennison 和 Turnbull,1997﴿。在获得任何数据之前,我们预先指定原假设将由 K-look 成组顺序设计在可能的停止时间 D1、D2… DK等处进行检验。其中 Dj 表示在look j 处获得的累计事件数,bj 是从某个消耗函数得出的相应水平α停止边界。
CHW 方法允许对发生这些look的累积事件进行数据独立性更改。
因此,让 D1∗, D2∗, . . .Dk∗表示由于对原始设计的变动而导致的K look处的改变累积事件。类似于为正态和二项式终点开发的符号,let D(j)= Dj -Dj-1和D∗(j)= D j ∗-D j -1∗ 是look-j-1和j之间事件数量的增量增加。
设 Z j ∗,cum 表示基于 logrank 统计量的 Z 分数,或者通过将 Cox 比例风险模型拟合到 look j 处可用的累积数据而获得的治疗效果估计值。然后,Tsiatis﴾1981﴿ 和 Jennison 和Turnbull ﴾1997﴿ 的结果表明,增量统计
它是渐近独立的,并且均值和方差呈正态分布
其中 r 是随机分配到治疗组的比例。Z j ∗,cum 来自对数秩检验
在期中监测中,我们默认使用近似值 ,并使用略有不同的近似值
如果监测依赖于到Look J的累积数据通过将Cox比例风险模型拟合的δJ和SE(δJ)提供的处理效果估计值,让
根据Wassmer ﴾2006﴿,通过将独立增量统计与权重相结合,构建了生存设计的CHW统计量:
生存终点的 CHW 统计量 与正态终点和二项式终点的CHW 统计量 相同的渐近分布。只需要,D∗(j)替换 n∗(j)。
假设在累积了 167 个事件后按计划进行了第一次look。假设我们观察到ˆδ =0.288,标准误差为 0.236。因此,第一次look时的累积统计量为(0.288/0.236)=-1.220。由于提前停止的名义临界值为 -2.963,因此试验继续进行。
第二次look时, delta 的估计值为 0.272,标准误差 ˆδ 的估计值为0.135,累积统计量=-2.015。
增量统计数据和加权统计数据分别计算为 -1.605 和 -1.998。
由于加权统计量超过名义临界值,因此将拒绝原假设。HR 的重复置信区间为 0.697,0.996,重复 p 值为0.023。
在Look L时Z∗L,chw= zL和在Kth 的look,D∗K累积事件是需要的。此时条件功率可以用以下形式重新表示
由于 δ 的真实值未知,因此习惯上将其Look L 估计值 δL 替换 ,
或者,在设计阶段的备择假设下指定的值 δ1,在上述条件功率表达式中。East为用户提供了这两种选择。Glimm(2011)认为期中分析时估计的疗效 具有随机性,如果用来计算条件效能,会使得期中分析时的数据出于不同的目的被使用了两次进而导致对应的条件效能更易出现极值。但是,目前实际应用及多数方法研究中对条件效能的计算仍使用期中分析时获得的疗效估计,因为需要利用第一阶段的真实数据来修正设计时对疗效的未知。
CHW方法认为其通过构建新统计量使得调整样本量后的最终检验统计量在原假设下仍满足近似正态,在给定期中数据的条件下,调整前后两个条件I类错误率两者完全相同。
Muller 和Schafer 方法则定义最终的检验界值为一个与重估样本量相关的函数,从而允许对后续试验的自由调整,如样本量重估后的有效性终止。
为保证调整样本量后的条件I类错误率不超过初始设计时的条件I类错误率,CDL(Chen, DeMets and Lan)法对应的CP至少50%,如果期中分析的条件功效至少为 50%,使用传统的 Wald 统计量进行最终分析。否则,将使用 CHW 统计量。Gao、Ware 和 Mehta ﴾2008﴿ 扩展了此方法,如果小于50%,也能保证条件I类错误率不膨胀。
可以看出,在100,000项试验中,只有2363项拒绝了原假设,总体1型误差为2.363%。因此,类型-1 错误得以保留。现在假设我们通过将 Use Wald Stat. if CP=0 来禁用 CDL约束,如下运行模拟显示,总体1型误差为2.59%,所以CDL设置CP至少是50%是必要的。
Metha 和Pocock则在Muller & Schafer方法和CDL 方法的基础上进一步定义了“希望区间”(Promising Zone),明确找出了最终的检验界值与初始统计量界值相等时对应的 CP上下界,此类方法多依赖于条件效能CP与调整样本量后的检验统计量界值的关系。
A two‐arm multi‐center randomized clinical trial is planned for subjects with advanced metastatic non‐small cell lung cancer with the goal of comparing the current standard second line therapy ﴾docetaxel+cisplatin﴿ to a new docetaxel containing combination regimen. The primary endpoint is Overall Survival ﴾OS﴿. The study is required to have one‐sided α = 0.025, and 90% power to detect an improvement in median survival, from 8 months on the control arm to 11.4 months on the experimental arm, which corresponds to a hazard ratio of 0.7. We shall first create a group sequential design for this study in East, and shall then show how the design may be improved by permitting an increase in the number of events and sample size at the time of the interim analysis.
K = 2, L = 1, r = 0.5, b2 =-1.9687, D1 = 167,D2 = 334,假如第一次Look分析的Z1=1.5则
因为,z1 = 1.5, D1 = 167 and r = 0.5,从而δ1 = 0.232,带入上式,D∗2= 656。
由于最大事件数上限为 501,因此当事件数达到 501 个时,此模拟将终止试验,而不是一直到 656 个事件。在这种情况下,将无法满足所需的目标条件功率 0.9。事实上,在这种情况下,使用 ˆδ1 代替未知真δ的条件功率仅为0.798。
参考文献:East说明书。