药物临床试验的设计创新和技术创新
来源
《复旦学报(医学版)》2025年
作者
熊海燕,罗剑锋,王伟炳
复旦大学公共卫生学院流行病学教研室-公共卫生安全教育部重点实验室;复旦大学公共卫生学院生物统计学教研室
摘要
药物临床试验是评估药物有效性和安全性的关键实验流行病学研究方法。本文介绍了药物临床试验设计创新的类型和设计思路,为相关研究提供方法学参考。适应性设计是一类复杂创新型临床试验设计方法,依据适应性的目的可以分为:成组序贯设计,样本量重估计,无缝试验,富集设计、主方案设计(篮式试验、伞式试验、平台试验等)。适应性设计具备更大的调整灵活性,在一定程度上克服了常规临床试验的缺点,进而提高研究结果的有效性和论证强度。药物临床试验的设计创新与重塑将为实现精准医学目标提供更有力的循证证据。
关键词
药物临床试验;适应性设计;主方案设计;人工智能
正文 |
临床试验是临床研究中最重要的步骤之一,通常用来评价疾病治疗措施、干预措施的效果,其发展史可追溯到1747年James Lind的坏血病研究,并已成为医学领域证据生成的金标准。常规临床试验设计遵循的基本原则是随机、对照、盲法、重复,常见类型有平行设计、交叉设计、序贯设计、析因设计。理想情况下,治疗药物或干预措施须通过设计精良的随机对照试验测试方能进入下一步应用。但传统的临床试验设计具有局限性,包括设计和实施复杂、外推性受限、效率低下、盲法不易实现等[1]。
随着科学研究的发展,基因组学、蛋白质组学、代谢组学、病毒学以及大数据科学、计算生物学和人工智能的技术进步,人类对基础性疾病的病理生理学过程有了更好的理解。但是,医学领域里从实验室到床边的转化速度仍然落后,传统的临床研究已经无法满足新型药物和治疗技术研发的新需求:高效率、高质量的证据[2]。随着恶性肿瘤患病率的增加,抗肿瘤药物成为全球新药研发的热点,肿瘤药物临床试验方案设计较为复杂,传统设计在显著增加成本的情况下,并未提高试验效率及成功率。同时,肿瘤治疗已经从过去相对单一粗放式的放化疗,逐步向基于生物标志物的靶向治疗和免疫治疗共发展[3]。基因组学(用于识别分子改变)的进步、治疗方法的发现和快速临床转化,肿瘤学领域比任何其他领域都更能引领这些技术进步,走向精准肿瘤学时代。因此,药物临床试验方案设计创新具备急迫性和可行性,能更好地解决临床研究设计的困境,并为加快药物研发提供了新的机会[4-5]。本文主要介绍药物临床试验设计创新的类型和设计思路,为相关研究提供方法学参考。
增加试验灵活性的设计
主要是适应性设计(adaptive design)中的成组序贯设计、样本量重估计、无缝试验、富集设计。适应性设计是按照预先设定的研究计划,在期中分析时使用试验期间累积的数据对试验做出相应修改的临床试验设计。适应性设计的核心在于适应性地选择设计参数或设计元素,这种选择取决于研究目标、研究设计和分析方法。与经典设计相比,适应设计允许方案设计者在方案中预设可调的元素(样本、对照组等),根据试验中获取的数据(包括研究自身的数据和外部数据)作为新信息来确定这些可调元素在本试验中的最终值。近年来,国内外药品评审和监管政策[6-9]的支持引导及方法学的不断成熟,使得适应性设计在临床研究中越来越被认可和应用,其实施也取得了实质性进展,从而大大改善了随机对照试验的灵活性。常规临床试验设计依据的前期探索性研究结果往往数据有限,且可能存在偏差,而适应性设计允许通过研究过程中获取的各类信息,对后续试验进行调整,尽可能使受试者最大程度获益,缩短了研发的流程,最终提高临床试验的效率和成功率[10-13]。依据适应性的目的分类,常用的适应性设计包括:成组序贯设计、样本量重估计、无缝试验、富集设计、主方案设计等。
成组序贯设计
成组序贯设计(group sequential design)是每间隔一定的时间或一定比例的样本量后,对已完成试验的所有受试者进行期中分析,依据每一次期中分析的结果做出后续试验决策,以判断试验是否可以提前得到有效或无效结论[14-15]。成组序贯设计将多次假设检验的思想纳入到试验设计中,研究可在期中分析时根据事先设定的规则提前得出结论,提高效率且更符合伦理。一项关于急性脑出血降压治疗的国际多中心、随机、开放标签的Ⅲ期临床试验,运用成组序贯设计,最终在完成第3次期中分析后因检验效能低于预设值而决定停止试验[16]。
样本量重估计
样本量重估计(sample size re estimation)是指预先设定,利用累积的试验数据重新计算样本量,增强研究效力,以保证最终的统计检验能达到预先设定的目标或修改后的目标。样本量重估计的设计目的是为了解决初始样本量计算基于历史或参考数据,各种因信息不够充分而导致的样本量估算不够准确的问题。比如一项关于乳腺癌无病生存期的随访研究,运用样本量重估计方法后,发现其在估计对照组失败概率方面具有很好的效用[17]。
无缝试验
无缝试验(seamless trial)是指将两个试验无缝连接,在前期试验结束时做适应性剂量选择,并将所选剂量用于后期试验。相比常规独立的探索性和确证性研究,适应性无缝剂量选择可缩短试验间隔、减少总样本量、提高试验效率。如Uozumi等[18]的研究模拟了无缝Ⅰ/Ⅱ期设计,在期中分析时用药效学评价疗效,实现了更有效的设计,节约了时间、成本及样本量。在肿瘤临床研究中,无缝Ⅱ/Ⅲ期设计是一种可行且合适的方法,根据研究终点具有不同的设计子类别。
富集设计
富集设计(enrichment design)是指通过分析期中结果,依据预先设定的标准对试验人群亚组进行适应性调整,以确定试验后续阶段的目标人群,试验的最终分析目标可能是全人群、仅亚群,或者包括全人群和亚群,因此可以相对兼顾扩大至全人群以及亚组取得阳性结果的机会[19]。在新药临床试验中,对一种新的药物所适用人群往往缺乏足够的了解,某些药物可能对部分亚组人群有效,若入组全人群,则会导致治疗效应被稀释,进而试验失败,同时也会将大量的受试者暴露在无效的药物中。适应性富集设计在一定程度上克服了上述的问题。富集的方式分为两种:预后型富集和预测型富集。前者入选更有可能观察到终点事件或疾病进展的高风险人群,增加试验的绝对效应,而非相对效应;后者根据疾病特征选择对试验药物最可能有应答的受试者,以提高试验效率。应用富集设计加速了Tazemetostat成为FDA批准的第一个甲基转移酶抑制剂[20]。
此外,在临床试验中融入贝叶斯适应性设计,已被肿瘤学领域和医疗器械领域广泛接受。贝叶斯方法可以解决临床试验领域一些频率统计难以解决的问题,贝叶斯适应性设计试验的主要优点是适应性和灵活性,以及能够为治疗评估提供更全面的、基于概率的推理平台。
文章内容由凡默谷小编查阅文献选取,排版与编辑为原创。如转载,请尊重劳动成果,注明【来源:凡默谷公众号】。
增加试验效率的设计
发达国家和我国的一系列创新监管方法的革新正在使新药研发现代化,也大大提升了研究的效率。具有主方案(master protocols)的临床试验设计是加速肿瘤药和生物药研发的一种现代化方法,也是适应性设计的一种形式,但其在提高试验灵活性的同时,更能提高研究的效率。主方案是指一个整体临床试验方案含有多个子方案:篮式试验(basket trial)、伞式试验(umbrella trial)、平台试验(platform trial)。主方案设计是精准医学背景下率先在肿瘤领域开展的一种高效的临床试验创新设计策略,旨在较短时间内获取高质量证据以回答更多临床问题,使药物的临床评估速度和研发速度更加符合临床需求[2]。
篮式试验
篮式试验常用于同时检验一种药物对于多种具有相同基因突变疾病的临床效果,超越组织学的限制,可对多种疾病类型进行靶向治疗评估,其本质是一种药物对应不同的疾病或疾病亚型。篮式试验因无法选择一个共同的对照组,通常为单臂自身对照研究[21]。在肿瘤学领域的研究中,篮式设计的优点是使得某些非常罕见的肿瘤因为带有相同的基因突变类型而得到了治疗的机会,并已经在特定生物标志物驱动的人群中获得了几种药物的应用批准[22-26]。
伞式试验
与篮式试验相反,伞式试验是针对一种疾病,可同时检验多种药物临床效果的设计。多项干预措施以“伞”的形式,集合了涉及某一疾病及其不同亚型的多项子研究,这种设计可以用于Ⅱ期探索性试验和Ⅲ期确证性试验。在肿瘤学领域的研究中,伞式试验通常是在检测特定的生物标志物之前对受试者进行筛选纳入,然后再根据生物标志物的不同分入不同的亚组,开展不同的治疗。BATTLE试验采用适应性分配,将受试者分为厄洛替尼、凡德他尼、厄洛替尼加贝沙罗汀或索拉非尼组,通过“实时”活组织检查并验证其可行性,推动了制定个性化肺癌治疗方案的实质性进展[27](图1)。
平台试验
平台试验则同时检验多种药物对于多种疾病(或某一疾病不同亚型)的临床效果,用于评估多种治疗方法或治疗方法间不同组合的研究。其设计目的是在相同的主方案研究背景下,提供开放性的研究平台,支持多种治疗药物或方案根据一定的决策算法进入或退出平台,原则上允许平台试验永久进行。对于患者,可依据疾病特征获得精准治疗、获得更大的入组机会,同时共用对照组的设置也可提高试验效率。平台研究已应用于I SPY2试验和基于血浆的晚期乳腺癌分子谱分析告知治疗选择等研究[28-30]。
新技术用于临床试验的创新
未来临床试验的成功需要结合科学发展的新成果、新模式,如人工智能临床试验研究的融合、数字化终点等,对所有可用数据进行深度挖掘与整合,从根本上改变试验的设计、实施、监测、调整、报告和管理方式,向更加以患者为中心和直观的证据生成系统转变。方法学的进步和基于人工智能的整合数据分析将为实现下一代“深度”循证医学和个性化医疗的目标提供深刻的证据[31-34]。人工智能驱动的技术有可能改变临床试验过程的每个阶段。如人工智能技术在收集、组织和分析临床试验产生的越来越多的数据(包括失败的数据)方面具有无与伦比的潜力,可以提取有意义的信息模式来帮助设计。人工智能算法可以通过自动化数据捕获、数字化标准临床评估以及跨系统共享数据来帮助监测和管理患者。它与可穿戴技术相结合,可以实现对患者的持续监测和对治疗安全性和有效性的实时洞察,同时预测退出风险,从而提高参与度和保留率。试验会产生大量的运营数据,但功能数据孤岛和不同的系统可能会阻碍技术平台全面了解其在多个全球站点的临床试验组合。在开放数据标准支持的共享分析平台上整合所有数据(无论来源如何),可以促进协作和集成,并提供跨重要指标的见解。然而,人工智能在实际临床试验过程中的应用仍处于早期阶段。与其他医疗保健领域相比,在临床试验的许多方面,目前对数字化的需求先于对人工智能的需求(图2)。
临床试验的适应性设计具备灵活可调性,更能满足目前药物研发的多样性和复杂性需求。精准医学的本质是探索人体内药物、靶点与疾病之间未知的关系。针对某种疾病的分子亚型指导治疗是伞式试验设计的生物学逻辑。探索某个靶点对身体其他部位疾病的治疗潜力,是篮式试验设计的底层逻辑。开放性的动态理念是平台试验设计的核心。除了以上提到的单个适应性设计,多重适应性设计也是目前药物临床试验的趋势,也即在一项研究中运用多个适应性设计类型,通过方法的组合更好地实现研究目标。总之,适应性设计将为医药发展提供更好的循证研究证据。
临床试验新设计有效性的考量
适应性设计在解决更多更复杂的临床问题与需求时,也可能在实际操作过程中引发一些难点和问题:随机分配组间不均衡、统计分析难度大、选择偏倚及技术操作风险等。这就需要研究者在实际运用中采取规范、谨慎的科学态度进行综合评估与考量:(1)遵循良好的前瞻性适应性设计原则,适应性设计的细节应体现在方案里,实施中保持试验的完整性和有效性;(2)期中分析时,确保分析时的样本量足以做出适应性决定,估计处理效应时明确评估要点和科学性;(3)把控适应性设计的灵活性,评估并控制Ⅰ类错误率,提高研究效力。
主方案中的设计考量点包括:(1)共用对照组。在同时评估针对单一疾病的多种药物的试验中,可以共用对照组(应用目标人群目前的治疗标准)。应在试验药物和共用对照之间开展比较分析,而不是在实验性治疗组之间开展。(2)添加和停止治疗组。主方案和统计分析计划应根据预先指定的期中分析或外部新数据的结果描述添加、扩展或中止治疗组的条件。(3)生物标志物开发。评估生物标志物定义的人群的主方案应解释为何使用的生物标志物是合适的,并采用经过分析验证的体外诊断测试。
作者贡献
熊海燕 论文撰写。罗剑锋论文修订。王伟炳 课题构思和设计,获取资助,论文修订。
参考文献
详见《复旦学报(医学版)》2025年
免责声明
本公众号发布的文章均为促进制药界同行的交流与学习;不用于任何商业用途。我们尊重原创作品。选取的文章已明确注明来源和作者,版权归原作者所有,如涉及侵权或其他问题,请联系我们进行删除。
内容由凡默谷小编查阅文献选取,排版与编辑为原创。如转载,请尊重劳动成果,注明【来源:凡默谷公众号】。
文章内容为作者观点,不代表本公众号立场。
文章搜索
本公众号开通往期文章任意搜功能啦
在公众号菜单栏中输入“搜索”,即可搜索往期微信内容