上月中旬,《NEJM医学前沿》开启第四场KEYNOTE经典研究解读线上讨论会。美国杜克大学医学中心生物统计学教授罗晟和免疫学教授何有文与吉林省肿瘤医院程颖教授等中国专家,以帕博利珠单抗联合化疗治疗鳞状非小细胞肺癌(NSCLC)KEYNOTE-407试验为例,从统计学和基础免疫学角度深入分析免疫治疗临床试验设计、中国亚组数据和全球数据。
罗晟教授在报告中首先回顾了2018年发表在《新英格兰医学杂志》(NEJM)的KEYNOTE-407这项3期临床试验结果,并以该研究为例,深入分析多终点研究1类错误(即α)的拆分和回收,以及探讨多终点研究期中分析设计的奥秘。KEYNOTE-407研究的PFS、OS和ORR都是阳性结果,P值都有统计学意义。基于该研究559例患者数据,FDA于2018年10月30日批准帕博利珠单抗联合化疗一线治疗转移性鳞状NSCLC,无论PD-L1表达状态。需要注意的是,发表在NEJM的是该研究第2次期中分析(IA2)结果。罗晟教授指出KEYNOTE-407研究为多终点研究,主要终点为PFS和OS,次要终点为ORR。多终点的优势在于只要一个主要终点结果阳性,研究就是成功的。但代价是1类错误必要要进行拆分,但是如果设计巧妙,α拆分后可以回收。KEYNOTE-407研究方案最初为2016年版本,之后修改为2017年的最终版本。研究选择单边α≤0.025为具有统计学显著性。2016年版本研究方案分配多终点α对于ORR、PFS和OS分别为0.005、0.015和0.005。如果ORR结果阳性,α未被使用,可以被回收,传递给PFS。同样地,PFS结果也会影响OS的α分配,OS情况更复杂。如果ORR和PFS都不成功,α只能为0.005;如果ORR和PFS都成功,OS的α值为0.025。2017年版研究方案将ORR、PFS和OS的α预先分配调整为0.005、0.01(较前下降)和0.01(较前增加),改动的目的是为了提高OS的α值,以提高统计学功效(由75%增到85%)。2017年方案改动后,ORR、PFS和OS即使在最不乐观情况下,即α分别为0.005,0.01,0.01时,也会有非常好的功效(分别为84%,90%和85%)。罗晟教授深入分析了KEYNOTE-407研究的多次期中分析结果。他指出2016年方案包括IA1、IA2和最终分析,而2017版方案则增加了IA3,修改了随访时间,事件数也有所增加。因为IA1的ORR是阳性,所以α回收给PFS,α为0.015,功效为78%。但是其对应的OS在IA2时只有59%的事件数,功效低至28%。尽管如此,研究也显示出非常好的结果。基于期中分析结果,FDA有条件的批准帕博利珠单抗适应症,要求研究继续进行并提交PFS和OS的最终结果。罗教授表示美国FDA一般不鼓励对PFS进行期中分析,但是如果期中分析结果很好,可以加速药物获批。2020年,Journal of Thoracic Oncology杂志发表KEYNOTE-407研究最终结果。相比NEJM发表的IA2,随访时间延长一年,事件数有所增加,OS的HR值分别为0.64和0.71,PFS的HR值分别为0.56和0.57。治疗组中位OS有所提高,这也与随访时间延长、删失数据减少有关,而在IA2时PFS已经出现大部分事件,所以PFS已经比较可靠,跟最终结果接近。这也是FDA要求提交最终数据的原因。值得注意的是,研究方案对PFS、OS、总死亡人数和随访时间等预估结果非常准。此外,根据地区、PD-L1表达、化疗药物等对IA2和最终结果的分层分析显示,所有亚组的PFS和OS都具有统计学意义,且中国人群结果与全球数据结果类似。何有文教授在报告中首先分析了KEYNOTE-407研究采用的方案,随后从免疫学角度深入解读了免疫临床研究设计中化疗药物选择、免疫基础研究对肺鳞癌治疗的启示、驱动基因阳性肺鳞癌免疫治疗作用,以及不同免疫临床研究的异同等问题。KEYNOTE-407研究采用免疫联合化疗,化疗药物采用常规剂量卡铂和紫杉醇或白蛋白紫杉醇,但是目前最有效的联合药物尚未可知且大部分治疗为经验性治疗。此外,当下化疗与免疫治疗相容性不佳,如化疗引起淋巴细胞减少,损害免疫系统。何教授认为合适的肺鳞癌化疗联合免疫方案需要选择合适的化疗药物,合适的剂量,以及合适的给药时间和途径。化疗药物需要有免疫相容性,能够刺激免疫反应和诱导免疫原性细胞死亡。低剂量节拍化疗在头颈鳞癌、卵巢癌等肿瘤中已显示出优势。临床前研究显示同时或序贯给药、局部或系统给药,疗效不同。他指出,免疫治疗时代需要重新定义化疗目的,化疗不是消灭肿瘤,而是延缓肿瘤生长,并且选择免疫相容性药物,增强细胞毒性T淋巴细胞对肿瘤杀伤的敏感性,起到免疫调节作用。他指出肺鳞癌具有高肿瘤突变负荷,适合免疫治疗。此外,肺鳞癌缺乏可靶向突变。Nature发表的National Lung Matrix Trial显示基因组匹配的靶向治疗效率在非鳞癌中为30/187,而鳞癌中为0/55,提示这些突变可能并不是驱动基因,需要重新考虑靶向治疗鳞癌思路。他猜测KEYNOTE-407研究取得成功而IMpower 131研究未成功的原因可能包括:两个研究中药物分别为PD-1与PD-L1抑制剂,研究人群所有不同,以及PD-L1检测和评分系统不同。此外,他提到免疫治疗在驱动基因阳性的肺鳞癌中也有一定作用,研究最深入的是对免疫有抑制作用的EGFR基因。圆桌讨论环节主持人、华中科技大学附属同济医院褚倩教授与其他专家针对非鳞癌免疫治疗中的热点问题进行了深入讨论。中国医学科学院肿瘤医院段建春教授表示IMpower131和KEYNOTE-407研究有类似的试验设计,但是研究结果不同,主要原因可能为PD-1和PD-L1抑制剂的区别。她所在团队的一项镜像分析研究纳入随机对照试验数据,并采用配对分析,结果显示整体上PD-1抑制剂获益更多,所以猜测两条通路同时抑制可能会更好激活免疫系统。河南省肿瘤医院王慧娟教授认为肺鳞癌更依赖免疫治疗,尤其是亚洲肺鳞癌患者靶向治疗效果较差。复旦大学附属中山医院胡洁教授认为在免疫治疗时代需要重新思考化疗作用,其应该与既往仅有化疗时发挥不同作用。KEYNOTE-407研究中的亚洲人群中位OS更长,而中国人群选择紫杉醇而非白蛋白紫杉醇作为化疗方案。但是,关于替雷利珠单抗(PD-1抑制剂)的临床试验显示联合紫杉醇和白蛋白紫杉醇的HR值一样,这提示需要进一步评估细胞毒药物剂型的作用。她还提到,舒格利单抗(PD-L1抑制剂)在肺癌中取得成功,入组了包括非鳞癌和鳞癌的全人群。鳞癌亚组HR值最低,远低于KEYNOTE-407研究的HR值。何有文教授也指出,不同研究入组人群接近,结果有参考价值,但是不同药物不能直接比较,样本量大的研究结果可能更可靠。罗晟教授指出真实世界研究为观察性研究,有很多混杂因素,不是随机的。倾向性评分匹配是一种方法,但是存在局限性,很多资料匹配不上而被删除,导致样本量减少,统计学功效下降。另外,即使同样是PD-L1抑制剂,仍然存在差别,这也是针对同一个靶点有的药物起效、有的药物无效的原因之一。何有文教授认为一些肿瘤学医生缺乏免疫学背景,很多免疫联合疗法研究没有理论和临床前研究的基础。他建议在开始临床研究前,临床医生需要先深入了解治疗药物每一部分的机制,而不是仅仅简单组合。何教授还指出即使某项疗法有临床前数据支持,也要注意动物模型与人有差别。浙江大学医学院附属第二医院夏旸教授认为,PD-L1阴性人群在KEYNOTE-407研究中仍然获得阳性结果的启示在于PD-L1这一生物标志物可能存在时空异质性,而且PD-L1阴性患者还可能为高肿瘤突变负荷。何有文教授指出PD-L1水平是动态改变的,免疫反应也可以诱导PD-L1表达;未来可以考虑非侵入性手段,如迷你机器人,实时动态检测免疫标志物表达。此外,肺鳞癌往往不是单一基因驱动,免疫联合治疗是有必要的,抗血管生成治疗也有前景。罗晟教授在圆桌讨论中进一步阐述了期中分析。他提到结果没有揭盲时更改方案较为简单。研究者可以在不揭盲的情况下分析事件数,如果事件数太少,可以增加样本量或随访时间。此外,期中分析一般分为3种情况:(1)只评价安全性;(2)无效终止;(3)有效终止(需要调整α)。 吉林省肿瘤医院李双教授谈到,肺鳞癌突变频率较低,即使存在突变,靶向效果也不佳。未来针对驱动基因阳性肺鳞癌的试验,可以采取伞式研究设计,纳入不同基因突变类型,设置不同队列,对每个队列单独统计,并进行二阶段设计,设置终止指标,动态删减队列。在高效筛选出目标人群后,再设计随机双盲试验,选择标准治疗对照,进行头对头比较。此外,临床医生和统计学家也需要长期磨合,达成一定默契,更好地开展临床研究。程颖教授在会议总结中指出,本次会议针对KEYNOTE-407研究进行深入探讨,梳理临床医生在肺鳞癌免疫治疗中的困扰,给未来免疫治疗组合带来启示。为了让免疫治疗发挥最大作用,科学家还需要深入探索,提供更多基础研究数据。
版权信息
本文由《NEJM医学前沿》编辑部负责翻译、编写或约稿。对于源自NEJM集团旗下英文产品的翻译和编写文章,内容请以英文原版为准。中译全文以及所含图表等,由马萨诸塞州医学会NEJM集团独家授权。如需转载,请联系nejmqianyan@nejmqianyan.cn。未经授权的翻译是侵权行为,版权方保留追究法律责任的权利。