不同的临床能以什么终点申报NDA/BLA一直是个比较令人困惑的问题,就拿Dato的临床来说,TL01是一个PFS和OS dual primary endpoint的设计,但是是用PFS申报的BLA,尽管后续整个临床OS和亚组的non-sq亚组的OS都没有成功,但是仍然有一定获批的可能性。
都说FDA要看OS,那什么情况下要看OS,什么情况下可以用PFS或者even ORR作为替代终点来审批,然后什么情况下可以accelerated approval,之后再做confirmative?这些其实在不同indication和不同treatment setting的情况下都是不太清晰的。
中秋节就读了两篇FDA guidance,来看他们对肿瘤药,特别是肺癌药的如何申报是怎么界定的。
其中NSCLC的临床终点设计guidance是前面一篇的补充和子集,里面分别讲了使用OS和PFS的优劣势和censor data的如何处理的问题。两篇guidance都不长,推荐大家可以阅读,对于理解什么样的data可以批下来,以及什么时候必须用OS什么时候可以用PFS替代都很有帮助。
以前我一直觉得FDA是必须要OS的,仔细读了guidance才发现原来并不一定要OS。当然,对于OS比较长的indication比如her2+ BC或者是EGFR mut NSCLC FDA也可以接受用PFS作为终点,但是其实其他OS不长的indication,FDA在特定情况下也是可以接受以PFS或者ORR作为临床终点来申报的。
最后一版guidance是截止到2015年更新的。首先在FDA过去批过的药物里面,绝大部分还是基于OS来的,原因他们也说了,主要是因为非小细胞肺癌的生存期都比较短,因此不会因为看OS就延长了trial的时间。
但是同时,如果看到的TTP或者PFS有非常大的effective size来证明患者能够从中获益,这两个终点也是可以用于临床的申报的,特别是在复发难治的NSCLC里。但是,具体多大的effectsize算大,能够支持获批,FDA是不能明确说明的,还是要case by case的去看。
也就是说,如果真的看到一个很夸张的PFS data,比如HR特别特别低,还有就是PFS已经接近原来的OS了,那也可以用PFS。
ORR就比较难,因为单独高的ORR并不足以支撑获批,高的ORR还要配合足够长的DoR才能作为终点获批。比如sq的trial,就很有可能可以用这样的方式获批,因为大部分sq的trial ORR都很低,当然duration也不太好。所以如果能有durable的ORR,应该也不需要用OS来申报。
在2003年12月16日的ODAC meeting上,FDA的专家们讨论了到底应该用什么作为NSCLC临床实验的终点。
首先,当时因为没有辅助治疗的用药,因此,大部分人同意用DFS作为辅助治疗用药的终点来评价药物。另外,专家委员会也认为可以考虑把PFS引入作为临床终点,虽然PFS受到assess的时间和影像学的判断等影响,但是仅仅用于已经转移的NSCLC。
对于无法切除或者局部进展的NSCLC,也就是stage IIIa/b的病人,大家还是支持用OS作为临床终点来进行审批。
所以,总的来说FDA的专家们建议,OS还是作为主要终点,但是PFS并不一定不能作为主要终点。如果PFS的effect size足够大,包括HR/绝对值,也可以根据PFS作为审批。同时sponsor也需要证明PFS和OS的关系,也就是更长的PFS可以indicate更长的OS,或者需要证明病人用这个药相较于其他药的好处。比如可以让病人更晚用体感不好的化疗药等等,都是可以做为考量因素的。
中期分析的时候,FDA鼓励大家可以看看OS,但是并不鼓励大家看PFS,因为那时候PFS会被overstate,并不一定能反应真实情况。
关于data censor的问题,guidance的appendix也给了例子。什么时候可以censor data?比如记录缺失,到cut off date没有进展,因为某种原因在cut off date之前停止治疗了包括毒性或者其他没有记录的进展,在进展以前就开始了新的治疗方案,在lost 一两次 follow up以后发生了死亡或者进展。这些都可以删失的data。其他死亡和进展都应该算作progress。
如何可以overstate PFS呢?或者如何可以看出来一个临床研究有没有overstate PFS?1)可以看assessment interval是6w还是8w,8w显然有利于overstate,因为一般没有用药的病人更容易发生死亡,但是用药的病人如果不太容易,只是进展就可以overstate,最多可以到接近2mos。2)看censor data的分布,早期的data censor一般是因为toxicity或者是lost of follow up,后面的很多都是因为在cut off date还没progress。所以一个早期censor少比对照组少,后面censor比对照组多的分析,大概率是因为药好。如果反过来就大概率有问题。
最后,比如看了guidance如果要讨论比如dato这样的data能不能根据PFS批准,我只能说概率比较小了,因为不确定PFS的effectsize是不是足够大。如果是0.5以下的HR绝对值能有个2个月以上,而且还有7个病人在临床中因为ILD死亡。其他临床能不能用PFS获批,这就要综合看了。