观点洞察丨人工智能如何推动临床开发
翻译:我心悠扬的
作者:Chris Anagnostopoulos, David Champagne, Thomas Devenyns,Alex Devereson, and Heikki Tarkkila, representing views from McKinsey’s Life Sciences Practice.
人工智能正在加速药物发现。如果临床开发跟不上,患者的获益就会被延迟。
临床开发和随机临床试验 (RCT) 在很大程度上没有受到前所未有的人工智能 (AI) 发展推动药物研发创新浪潮的影响,包括生成人工智能 (gen AI) 和基础模型。然而,他们面临着精准医疗崛起和竞争更加激烈的发展格局的压力。到目前为止,临床开发中人工智能的采用强调了卓越运营和加速,但科学人工智能的进步使得现在可以利用现代分析工具和新颖的数据源来设计更精确、更高效的试验,并获得更高的成功率。
20 世纪中叶随机对照试验的引入开创了循证药物开发的现代时代。它们的严格性和简单性是对过度依赖事件和案例研究的受欢迎的防御措施,并且毫无疑问为患者提供了良好的服务,支持了无数安全、有效疗法的上市。然而,随机对照试验开始被视为瓶颈,它会延长疗法获得批准的时间,并可能增加成本。与此同时,随着人工智能突破一个又一个里程碑,患者热切地等待将这种前所未有的技术进步转化为药物研发,以更快地获得更好的治疗。
除了对时间表的期望不断提高之外,临床开发还面临着生成有针对性和有意义的数据的日益增长的需求。随着精准医学成为主流,随机对照试验通常不仅必须证明治疗的总体疗效,还要证明它是否有益于特定的患者群体。该部分越小,招募足够的患者参加试验就越困难。此外,为了满足监管机构和付款人设定的标准以及竞争压力,构成具有临床意义的治疗效果的标准正在不断提高。如今,在大多数治疗领域,每个适应症的投入平均比 2006 年增加了 40%,提高了差异化必要性。临床医生和患者都需要更多的证据来决定特定时间的最佳可用治疗方法。
所有这一切都是因为研究人员通过更多地利用人工智能和新一代人工智能来加速药物发现,例如 DeepMind 的人工智能平台 AlphaFold,它可以预测分子的 3D 结构,从而产生更多、设计更好的临床前产品,并具有更好的目标验证。并且还努力改进其运营流程,以加快申请首次人体研究所需的时间。但如果临床开发未能跟上步伐,更快的药物发现给患者带来的好处将不可避免地被延迟,并且人工智能加速的承诺可能会陷入困境。
虽然随机对照试验仍将是临床开发的核心支柱,但潮流正在发生变化。监管机构最近发布了有关正确使用真实世界数据(RWD)的指南。医疗保健数据生态系统正在蓬勃发展,利用尊重隐私的技术使患者级数据安全地用于研究。现在可以使用因果机器学习从多个数据源生成证据,其目的是通过生物统计学与机器学习(ML)以及越来越多的人工智能和基础模型的结合来区分相关性和因果关系。
尽管有这样的承诺,但只有少数老牌公司在临床开发中系统地部署人工智能和数据驱动的方法。到目前为止,重点是提高卓越运营和提高加速速度,而不是帮助制定试验设计策略。本白皮书的其余部分将更深入地探讨背景,提供具体的示例用例和相关影响,并确定公司在采用人工智能进行临床开发时面临的挑战。它不是停留在高水平上,而是旨在通过相关细节和案例将主题带入实践。
扩大人工智能和 RWD 在临床开发中的应用
如今,人工智能可以利用越来越多的 RWD。来自某些地区的电子健康记录和索赔数据随处可见,新的数据源(包括生物库、数据组学面板、全人群基因组研究、患者登记以及影像和数字病理学)的数量和多样性正在不断增加。所有这些来源都反映出患者共享数据的能力发生了显着变化,以便以尊重隐私的方式推进研究和治疗,包括能够以尊重患者隐私的方式训练机器学习模型的技术。
此外,新工具可以系统地从非结构化数据中捕获知识。大型语言模型(例如 BioGPT)能够将非结构化医生笔记转换为高质量的结构化数据。同样,这些模型可以搜索大量已发表的文献,并大规模识别生物实体之间的联系,为知识图生成高质量的输入,从而更好地代表跨领域(包括基因、靶点)给定适应症的可用证据的整体、蛋白质、途径和表型。
大多数在临床开发中使用人工智能和 RWD 的制药公司往往只在孤立的用例中这样做,并且很少将两者结合部署。例如,他们可能使用机器学习来选择试验地点或预测患者入组率。他们可能会使用 RWD 来测量疾病患病率(符合条件的人群的规模),以了解未经治疗的患者的疾病自然病程,或者出于监管目的构建外部控制臂。虽然这些用例带来了价值,但现在还可以实现更多价值。同样,虽然过去五年中人工智能药物发现公司的资金和投资水平增加了两倍,但临床开发领域的同等公司却并非如此。
展示人工智能潜力的四个案例
部署人工智能与 RWD 相结合的公司正在看到有影响力的结果。虽然 RWD 可以成为卫生当局提交包中有价值的支持证据,但最成功的公司重点使用 AI 和 RWD 来做出更好、更明智的决策,以支持临床开发项目从产品和投资组合策略到协议的每一步的成功和试验设计:
在定义产品策略的阶段,人工智能和RWD可以揭示哪些迹象是最有希望寻求新产品的迹象。几家领先的生物制药公司通过这种方式为现有产品确定了多个新适应症,一家早期生物技术公司使用人工智能和RWD来评估是否改变其针对新产品的适应症选择策略。
AI 和 RWD 可以支持有关临床试验目标患者群体的决策,包括亚组发现、完善试验资格标准、帮助排除极不可能从治疗中受益的患者,并缩短试验时间。一项早期生物技术可以更好地描述“超级进展者”(即,在临床试验的时间范围内疾病可能进展更快的患者),并在更快的时间范围内设计具有类似预期益处的试验。
对于投资组合策略的决策,人工智能和 RWD 可以帮助公司针对适应症或正确的患者确定正确的药物组合。一家生物制药公司利用前瞻性观察数据集来生成支持其三线治疗早期定位的证据。另一个公司能够识别其投资组合中几种药物的“超级反应者”,这些见解帮助公司在拥挤的适应症中最佳地定位其资产。
在选择和优化临床试验终点的步骤中,人工智能和 RWD 可以帮助公司识别随着时间的推移密切跟踪主要终点的患者属性。一家生物制药公司将一种罕见疾病的现有终点(这是一种罕见事件)替换为发生频率更高或可以通过血液测试测量的替代终点。这将试验时间缩短了 15% 至 30%。
以下讨论更深入地研究了四个详细的用例,说明了人工智能可以解锁的大量信息。
产品策略的适应症选择
选择特定分子针对哪些适应症是生物制药公司做出的最重要的决策之一。这一决策通常综合了关键意见领袖的意见、文献综述、基因组学分析(例如全基因组关联研究)、RCT 数据和竞争对手的决策。此类决策很少完全由数据驱动,通常难以整合,并且仅涵盖部分可用证据基础,从而导致主观和次优的综合。相比之下,RWD 和人工智能提供的策略在使用基于临床数据的多个数据集和基础模型时是客观和全面的,不断重新定义可能的艺术。
对于已经批准的疗法,公司可以使用 RWD 来了解疗法对替代适应症的可能疗效。一种方法是检查由医生自发开药的患者的结果;另一个是确定药物对因偶然合并症而接受治疗的患者的平均效果。然后,人工智能技术可以利用观察到的患者特征和结果之间的相关性,将任何发现推断到一组特征可能分布不同的患者。
当公司寻求扩大已批准产品的适应症或识别新产品时,RWD 和 AI 可以从患者和临床角度估计一种适应症与另一种适应症的生物学相似度,即患者是否经历相似的症状、合并症、实验室特征和治疗病程。将医疗事件视为关键词,并将患者病史视为文档的基础模型可以揭示不同事件(包括诊断)的语义相似性。每个适应症(可能是一大堆具有生物学相似性的适应症列表)根据其与一个或多个锚定参考的相似性进行评分——可能是产品最初批准的适应症,或者在新颖产品的情况下,有强有力的临床前证据表明该产品的作用机制 (MoA) 的功效。
评分还可以整合来自分子知识图谱的信息,这些信息显示新的联系,例如,已经在文献或公共数据中识别的蛋白质或人类生物途径等实体之间的联系。图 1 显示了这种方法的潜在结果:它可以揭示与每个参考适应症最密切相关的适应症,作为现有证据基础的锚点。与这些参考文献最相关的适应症会根据未满足的医疗需求、战略契合度和技术可行性进一步优先考虑,从而产生基于证据的适应症选择。
这些分析方法可以识别可通过体外或动物模型快速验证的新适应症,可以增加选择成功概率较高的适应症的信心,并可以相应地降低资源分配的风险。该分析为投资者、股东和研发领导者提供了更清晰、更全面的证据基础,并且可以帮助新疗法更快地到达患者手中,从而降低成本。
试验设计的亚组发现
一旦产品与适应症相匹配,制药公司就会采取全方位的临床开发和试验设计策略,即包括除根据主要意见领袖和传统观点认为高风险的患者之外的所有患者。因此,不太可能对治疗产生反应的患者可能会被纳入试验。这种方法的一个显着例外是精准肿瘤学,研究人员使用临床前发现的特定生物标志物(例如基因突变)根据患者的进展概率对患者进行分层或预测患者对不同治疗的反应。这种方法正在彻底改变肿瘤治疗,但即使它只能识别一小部分可能的患者亚群。
相比之下,人工智能和富含基因组学的 RWD 可以检查数千种遗传和/或表型属性,以查明最有可能影响预后或预测评分的组合,解释反应异质性,并提高试验的技术成功概率。即使在患者群体规模适中的情况下,在广泛 RWD 上训练的基础模型也可以用作适应症水平上更多定制建模的起点。
一家大型生物制药公司使用 RWD 从试验中剔除可能无反应的患者,并将预期持续时间缩短 5% 至 10%,而不会影响成功的可能性,这将使治疗更快地到达患者手中。另一家公司利用医院事件 RWD 来识别对其第一阶段产品的比较臂的超级反应者,确保试验的设计方式侧重于无法获得有效治疗的患者。
用于亚组发现的人工智能还可以以有效前沿的形式直接支持合格人群的规模与较小人群的治疗效果水平之间的战略权衡(图表2)。展览上标记为蓝色的不同亚群是那些不可能在不降低药物预期效果的情况下同时增加其宽度的亚群。这种方法扩大了接受这种新治疗的患者与最有可能从中受益的患者之间的重叠。
图表2
产品组合优化的子组发现和比较功效
人工智能不仅可以用来发现亚组,为试验设计提供信息,还可以为更广泛的产品组合策略做出贡献。许多生物制药公司的产品线和产品组合包含旨在治疗类似患者的多种产品,通常是因为公司缺乏足够的证据来告知不同的产品组合策略,特别是对于新的 MoA。然而,对所有可用数据源的系统分析可以预测不同患者亚组(或疾病内型)的反应,这可以帮助公司磨练其产品组合策略——在某些情况下,导致净现值实现两位数百分比的改善。这种战略立场可以支持有针对性的试验,产生临床医生在新产品激增的情况下为患者做出最佳治疗决策所需的精确证据。
此外,可以结合多种分析方法和数据源来确定组合中新型 MoA 相对于彼此的疗效或与已批准的不同患者亚组治疗的疗效。利用分子知识图谱中的数据丰富 RWD 可以实现由基础模型驱动的治疗表征,从而代表其相关的生物途径。由此,公司可以通过观察与新疗法具有相似生物作用机制的已批准疗法的结果来估计新疗法的功效。该练习可以在多种疾病内型或患者亚组中重复,通过患者级别属性的组合来识别(图表 3)。
图表3
临床开发中的终点优化
在许多试验中,没有单一的、既定的终点。在其他情况下,可能很难知道哪一种最能衡量药物的预期作用。某些终点可能需要很长时间才能显现,从而导致开发时间延长。其他人可能检测到的进展对于某些类型的患者比其他类型的患者更可靠,或者可能特别具有侵入性,从而增加了试验对患者的负担。
可以部署在丰富的患者级纵向数据集上使用的人工智能来识别随着时间的推移密切跟踪主要终点的患者属性。这样的应用程序可以控制多个混杂因素,以确保这种关联在患者群体可能不同的未来试验中持续存在,从而建立潜在的新终点。
在这里,X 射线、CT 和 MRI 扫描以及其他成像技术通常是以无创方式监测生物标志物的宝贵数据来源(就像使用 MRI 帮助检测阿尔茨海默病一样)6)。使用医学成像的基础模型越来越能够从原始图像中大规模提取由人类专业知识策划的成像生物标志物。他们甚至可以发现疾病活动和严重程度的全新的、隐藏得很深的视觉特征,并具有更好的预测特征。
在所有情况下,即使在治疗过程中,新终点与患者期望的结果(例如生存或生活质量)之间的关联也必须持续存在。RWD 中的临床数据和信息必须与对所考虑治疗影响的机制的生物学理解相结合。
应对组织挑战
不可避免地,用一种新的、分析驱动的、使用新数据的方法来补充一个世纪以来依赖随机对照试验的临床开发方法,会给组织带来挑战。以下是解决这些问题的一些方法。
将人工智能嵌入临床开发
大多数生物制药公司的治理流程和激励结构鼓励在产品团队级别及其他级别的临床开发中使用默认解决方案。一个后果是全民试验的盛行,这种试验针对尽可能广泛的人群,而不利用有关无反应者和超级反应者的证据——这种方法会增加试验的持续时间并降低成功的可能性,导致患者等待时间更长。从治疗中受益。
研发领导者可以通过鼓励在做出关键决策时使用分析方法整合所有可用证据来源来帮助改变这种文化。个人激励措施可以有所帮助。更强有力的一步是强化发展治理模式,要求所有关键决策都由人工智能支持。
发展内部能力和人才
外部提供商可以提供现成的人工智能解决方案来支持某些案例。但随着如此多的新解决方案不断涌现,目前还没有提供商能够支持所有这些解决方案。即使可以,公司在关键战略决策上依赖它们也是不明智的。拥有如此丰富知识产权的提供商最终可能会成为竞争对手。
因此,生物制药公司可以考虑构建自己的人工智能能力和产品。然而,获取相关数据集需要大量投资;建立必要的数据科学、数据工程和商务翻译专业知识;建立敏捷的产品开发流程,确保案例及时且经济高效地交付业务价值。
公司还必须努力吸引和留住顶尖数据科学家和数据工程师,因为生物制药行业通常不是他们的首选。可以提供帮助的措施包括提供有竞争力的薪酬待遇、建立创新的雇主品牌以及位于关键的人才中心。因此,关注行业的价值主张也可以——为员工提供帮助人们过上更长期、更健康生活的机会。
制定有针对性的数据策略
随着如此多的数据可用,公司应该考虑为每个疾病领域制定详细的迭代数据策略。购买某些商业数据集(例如电子健康记录、索赔,有时还包括组学)可能相对简单,即使在肿瘤学等需要丰富生物标志物数据的治疗领域也是如此。但其他类型的数据集(注册、生物银行和其他制药公司的临床试验)可能涉及复杂的谈判和合同,公司将不得不与一系列不同的数据提供商合作。
此外,每个数据集的结构可能不同,质量和完整性水平也不同。这意味着公司可能需要数据管理和分析能力来完成诸如组合不同数据集以填补证据空白以及满足监管机构对使用真实世界数据的期望等任务。
构建可扩展的产品
人工智能的力量在于其在整个临床开发组合中的应用,而不仅限于孤立的用例。由于代码库、数据平台、公司的数据工程能力以及收集、组合和分析数据所需的分析堆栈的限制,实现这种规模可能很困难。因此,试点通常只是这样——永远不会针对开发中的其他资产进行重用或部署。
为了解决这个问题,分析案例应该构建为产品,这意味着解决方案的构建方式使其易于重用并针对不同用例进行扩展,即使在概念验证阶段也是如此。例如,代码库应该有很好的注释,并部署常见的、可重用的分析组件,这些组件可以是内部开发的、开源的,也可以是现成的。共享的机器学习开发标准和编码框架可以帮助加快不同用例的开发工作,因为数据科学家和工程师都熟悉它们。公司还需要一个成熟且灵活的 ML 操作堆栈,即简化将 ML 模型投入生产以及维护和监控的过程所需的操作组件。
通过利用新数据和人工智能的力量,生物制药公司可以超越随机对照试验,极大地改善临床开发。从制定产品策略到设计方案和试验计划,开发过程的每个阶段都会产生效益。对于患者来说,由于开发时间的加快,结果可以加快获得新疗法的速度,并使治疗更有可能引起最强烈的反应。
高影响力的解决方案已经在实施,更多的解决方案将会随之实施。公司可以从开始构建所需的能力并在整个投资组合和资产生命周期中扩展这些能力中受益。临床开发和试验设计系统的变革时机已经成熟,对患者的价值将是巨大的。
PS:时间已经记不起岁月的不堪,春夏秋冬也唤不醒沉睡的躯壳。