CMAC统计俱乐部副主席;DIA统计社区核心成员
中国临床试验统计学组主要成员
CSCO生物统计委员会委员
在制药行业,拥有近20年制药公司和CRO临床统计专业及管理经验
毕业于北京师范大学应用统计专业。先后曾任博奥生物统计团队生物统计师、统计组长;IQVIA(前身为Quintiles)高级统计师及统计团队北京负责人;四环医药临床开发中心数据管理、统计及编程团队负责人;轩竹医药数统负责人。
作为主要统计师,曾参与50+项临床试验,涵盖Phase I/II/III 及上市后临床试验(肿瘤领域及非肿瘤领域),参与多项国际合作开发的临床试验(Novartis, Takeda, Merck, GSK等),曾与公司团队合作多项FDA、CDE及EMA的多国申请项目
一、探索性临床试验
1
研究目的
在临床开发阶段,探索性临床试验非常关键,灵活性强,可根据需要进行多种试验设计。对于肿瘤产品,为应对更复杂的临床试验环境,上市后也还需进一步探索,包括联合治疗、药物相互作用、特殊人群等,挖掘更多潜在信号。
关于探索性临床试验,其主要目的通常包括以下几点:一是,基于短期终点衡量抗肿瘤活性;二是,初始估计Ⅲ期主要终点指标;三是,探索预测生物标志物;四是,寻找最优治疗方案;五是,对有效性、安全性和剂量的探索。
2
试验设计
在探索性临床试验中,肿瘤领域最常见的试验设计有单臂试验、随机试验及适应性设计等。
单臂试验,依据不同的对照方式可细分为历史对照、外部回顾性数据对照以及平行对照等。由于患者群体差异、治疗技术进步以及评估标准的不一致等多种偏倚因素的引入,单臂试验存在一定的局限性。
为增强证据的有效性,我们会采用随机试验和适应性设计。其中,随机试验可分为三种常见类型。
(1)随机对照(Nondefinitive Comparison),使用SOC作为对照,但鉴于研究早期的不确定性,通常采用小样本量进行非确定性比较;
(2)随机平行非对照(Independent Decision),随机选择相同的患者群体,但各试验组独立决策,不强制进行组间比较;
(3)随机选择(Selection Design),在国际上应用广泛,但在国内文献中相对较少见。其核心在于筛选出具有最强成功信号的药物或治疗方案,以确保后续确定性临床试验的高效与成功。
3
随机选择设计(Randomized selection design)
图1
如图1所示,随机选择设计的特点在于每个试验组可能代表不同的新药治疗方案,如新药1、新药2、新药3等,这些治疗选项是并列的。更常见的情形是,该试验设计用于比较不同治疗模式的差异,例如,即便是同一种创新药,也可能存在多种用药模式,需要评估出最优模式,以确定下一步的确证性试验,再如,最佳剂量方案的探索等。
在肿瘤治疗中,由于病情复杂,常涉及多种药物的联合使用,在药物注册时,会考虑联合用药的常见情况,以覆盖更广泛的市场需求。上市后,药物的联合用药方案会更多样化,需要比较不同联合用药方案,找出能使药物效果达到“1+1>1”或更高协同效应的组合。该设计的原理在于从多个类似的治疗方案中挑选出最优项,即根据成功概率的高低进行排序,最终选择最优方案,以进行进一步的确证性试验。同理,样本量的确定也是如此。这一过程也常被称作“Pick the Winner”。
二、经典案例:顺铂与氟尿嘧啶对比卡铂与紫杉醇治疗晚期肛门癌
1
背景
肛门癌是一种罕见的恶性肿瘤,其新发病例数量还在逐年增加。目前,在国际治疗指南中仅提到可以使用铂类和氟嘧啶类药物作为治疗方案,但具体选择哪种药物更为有效还未在医学界内达成共识。为了填补这一空白,推动了这项全球性的临床试验研究,通过对比顺铂联合氟尿嘧啶治疗方案,与卡铂联合紫杉醇治疗方案在肛门癌治疗中的效果,以确定哪一种方案更具优势,从而作为未来进一步确证性试验和临床应用的优选方案。
2
试验设计
图2
该试验主要纳入≥18岁的一线治疗患者,病情严重(分级为0~2级),主要表现为局部复发且不适合手术治疗或已转移的晚期肛门癌。试验中,患者将按照1:1的比例随机分配至两组,分别接受顺铂联合氟尿嘧啶与卡铂联合紫杉醇的治疗方案,样本量均为40例。
试验的主要终点是总缓解率(ORR in mITT),而次要终点则包括ORR in ITT、入组率、毒性、以及患者生存和生活质量等。由于晚期肛门癌的治疗方案一直较为有限,且其预后受多种因素影响,试验设计中考虑了四个分层因素。尽管样本量相对较小,但考虑到疾病复杂性和预后因素的多样性,试验采用了动态随机的方式进行。
在样本量确定方面,设定了最差预期效果(Worst)P0为40%。如果某个治疗方案的预期效果提升可以超过设定的10%(Difference > 10%),则每组需要36例样本可以确保有80%的成功率来检测到最佳效果(Best)。考虑到10%的脱落率(Drop out Rate),最终每组所需的样本量确定为40例。
“Pick the Winner”的流程需要通过假设策略完成,其判断流程如下:
图3
在统计分析方法中,关于主要分析人群(mITT),明确要求患者必须随机分配到研究中,符合资格并至少接受了一个周期的化疗,且在研究过程中有可评估响应或具有临床进展的证据。针对不同分析指标,采用合适的统计分析方法。对于比例(Proportion)的检验,采用的是卡方(x²)测试,并通过Logistic回归模型对分层变量进行调整;对于时间-事件率(TTE),使用了Kaplan-Meier曲线来展示生存情况,同时提供了风险比(HRs)及其95%置信区间(Cls)和P值,通过Cox回归模型对分层变量进行矫正;对于生活质量(QoL)的变化,则采用Ismeans Change的方法来分析从基线到终点的变化,并特别指出临床上显著的变化为≥10分。
在临床试验中,我们应对受试者的筛选、入组、治疗和评估过程都需要严格控制和记录。特别是在探索性阶段,更需要仔细记录每一个退出或剔除的原因,以便更好地分析治疗方案的相关因素。同时,对于毒性反应等严重不良事件,更需要高度关注和及时处理,以确保受试者安全和研究顺利进行。
在患者暴露方面,卡铂联合紫杉醇方案考虑到患者化疗感受,其使用周期较短但全剂量使用率较高;在剂量调整方面,两者差异不大;在ORR方面,两者总有效率相近,无显著差异;在PFS/OS方面,卡铂联合紫杉醇方案显著优于顺铂联合氟尿嘧啶方案,中位生存期更长,生存曲线更优,对患者生存更有利;在AE方面,卡铂联合紫杉醇方案的SAE只有36%,而顺铂联合氟尿嘧啶方案则达到了62%,这表明卡铂联合紫杉醇治疗方案在安全性方面更具优势。最终,依据“Pick the Winner”流程,卡铂加紫杉醇组被最终选定为我们最优的治疗方案,并将进行进一步的确证性试验。
三、随机选择设计总结
1
特点
早期探索性研究的随机选择设计,最早1977年由Simon提出。其目的为两个或多个治疗臂选择最优方案,通过事先确定成功选择概率,观察治疗臂中主要终点的绝对值大小,以此判断出最优治疗组用于下一步研究。其特点表现如下:
(1)保证随机化的同时,所需样本量少;
(2)选择性设计中无对照臂概念,所有队列均为试验臂相互比较;
(3)研究终点以二分类为主,生存终点适用性一般;
(4)结果判断依据数值绝对大小,无统计检验,不涉及Ⅰ类Ⅱ类错误;
(5)研究设计的最终结局为选出“The Champion Group”,即成功选择概率。
2
适用场景
其适用场景包括以下4个方面:
首先,随机选择设计主要适用于预试验(Pilot Study);其次,可用于探索同靶点不同药物或不同联合治疗组合(特别是核心药物相同)的治疗效应,以评估不同治疗方案的疗效和安全性;再次,可用于探索同个药物或联合治疗方案,不同剂量选择或治疗顺序的治疗效应,因为剂量和顺序可能影响疗效和安全性;最后,可用于从药物作用机理、预期疗效、用药安全性、用药方式、花费、生活质量等全面评估不同治疗方案的优劣。
而不适用场景则包括以下3个方面:
首先,对照臂中有标准治疗组,因为这会涉及伦理问题,且可能干扰研究结果;其次,若研究目的为获取确证性研究证据,因为该方法在计算样本量时非常节约,不足以支持确证性研究;最后,若已有明确优劣比较结果,在此情境下,其他评估因素可能不再具有决定性意义。
3
样本量估算公式
图4
样本量估算公式原理可参考图4,对于图2所示顺铂与氟尿嘧啶对比卡铂与紫杉醇治疗晚期肛门癌案例最优概率的选择是在80%-95%。
随机选择设计,虽然没有统计假设及统计推断,那么该设计最终pick the winner,会不会选错呢?当然会,只要是下结论就有犯错的可能,有相关文献报道,该设计所选的最优方案的假阳性率在20%-40%之间。
最后,对于样本量的计算,还有一个小工具可以使用,可参考如下网站:
https://hakdehbi.shinyapps.io/randomised_phase_2_margin_equiv/