仅供医学专业人士参考
随机临床试验是评估医疗治疗效果和安全性的黄金标准,其结果为药物审批、临床指南制定及保险覆盖决策提供重要依据。然而,这类试验费用高昂、耗时长,且样本代表性不足,特别是在心血管领域,试验需要检测小幅度的改善和低发生率结局事件。高达每位参与者35,000美元的成本,不仅延迟患者获益,还缩短了制药公司收回研发投入的关键时间窗口。此外,试验中的种族、性别代表性不足,影响了结果的公平性与可信度。
人工智能(AI)的技术进步,特别是深度学习和大语言模型,为许多领域带来了变革。在心血管领域中,AI正被应用于影像解读和早期诊断,但推广仍需解决可解释性和性能验证问题。AI有潜力在临床试验中加速并自动化整个流程,包括规划、招募、终点确认及结果传播。然而,AI在心血管试验中的应用仍有限,同时引发对偏倚、不公平性及结果准确性的担忧,这需要建立新的评估框架。
2024年3月,心力衰竭协作组织召集学术界、工业界、期刊及FDA的利益相关者,探讨AI在心血管试验中的潜力、挑战与风险。本文综述了会议内容,重点聚焦AI在试验设计和执行中的应用前景。
人工智能可以帮助研究者进行试验设计,包括选择纳入标准和预先设定的亚组分析。在肿瘤学领域,开发了一种名为Trial Pathfinder的人工智能工具,用于利用电子健康记录数据和逆概率加权方法模拟试验结果。应用该工具测试不同的纳入标准集表明,肿瘤学试验可以通过更广泛的纳入标准实现类似的治疗效果风险比(HR),从而加快患者招募速度,并提高试验结果的普适性。
然而,in silico试验(计算机模拟试验)并不能替代在前瞻性随机研究中对真实患者进行干预测试。对既往完成的试验进行模拟并不总能得出与随机研究相同的结果。此外,基于真实世界数据进行试验模拟需要患者在日常临床护理中接受研究性治疗,这种方法对于尚未批准的新型治疗方案来说是不可行的。
参与者招募是试验中的主要瓶颈,复杂资格标准的筛选耗时且依赖人工处理。尽管电子健康记录(EHR)和实时提醒工具可用于初步队列识别,这些方法局限于离散数据,且依赖数据的及时可用性。
借助自然语言处理(NLP)和生成式人工智能,筛选效率显著提升,自动化工具可结合自由文本、影像和实验室数据处理复杂标准,如症状性心力衰竭或纽约心脏病协会(NYHA)功能分级。基于规则语言模型的工具已成功从非结构化记录中提取纳排标准。
如RECTIFIER工具在COPILOT-HF试验中的应用,通过GPT-4及检索增强生成技术,筛选成本仅为每患者0.10美元,与临床专家一致率高达98%-100%。这些技术可快速筛查大量患者,提高准确性并避免遗漏,同时最终招募决策仍由研究者掌控,降低了误招风险。
传统知情同意对话往往形式化,冗长且晦涩的文件不利于参与者理解。生成式语言模型已成功简化外科手术知情同意书,未来交互式聊天机器人有望提高临床试验知情同意的效率和质量。聊天机器人可通过无限时长互动回答问题,评估理解程度,并根据需求调整语言和互动方式,同时减少参与者亲临研究现场的负担。
例如,儿科孟德尔基因组研究中心的观察性研究中,基于聊天机器人的同意流程使参与者能够在非工作时间完成同意,时间更短,满意度达86%,且理解测试结果与传统方法相当。此外,ChatGPT生成的外科手术知情同意文本在可读性和完整性方面优于医生编写的版本。
然而,人工智能在知情同意中的应用也引发伦理担忧,例如可能表现出强制性或偏向性。鉴于人际互动在建立信任和维护参与者自主权中的重要性,人工智能应作为研究者的辅助工具,而非完全取代其角色。
图1. 利用人工智能改善临床试验的机会
通过自然语言处理(NLP)实现临床结局的自动化判定,具有提升试验成本效益、速度和可重复性的潜力。在当前的关键性试验中,诸如心力衰竭住院或心肌梗死等结局通常由一个由医生组成的中央临床事件委员会(CEC)根据既定标准审查参与者的医疗记录进行判定,或者由研究现场的研究者进行判定。CEC的判定过程劳动强度大、费用高且难以扩展,而由各研究现场研究者作出的判定可能存在不一致性。
早期使用NLP进行临床结局判定的研究主要集中在观察性电子健康记录数据上。在INVESTED试验(用于有效预防心胸事件和失代偿性心力衰竭的流感疫苗研究)中,研究者对一个由单一中心(位于美国马萨诸塞州波士顿的Mass General Brigham)开发的NLP模型进行了外部验证,并将其与人类CEC判定结果进行了比较。NLP对心力衰竭的判定结果与CEC一致性达87%,显示了该模型从单中心到美国和加拿大多中心环境中推广的适用性。在INVESTED试验中对模型进行微调后,其性能得到提升,可达到与人类审查员一致的可重复性水平。
图2. INVESTED试验中用于自动终点裁定的NLP
在大规模实用性试验中,人工判定不可行的情况下,人工智能有潜力增强结局的确认。人工智能方法快速高效,可避免治疗益处或风险检测的延迟,并可能比现场判定提供更一致的结果。在结局确认方面,研究和开发的首要任务包括开发更准确的模型、评估其在国际试验或超越心力衰竭的心血管终点上的普适性,以及探索结合人类与人工智能审查的策略。
此外,除了疗效结局判定之外,人工智能还可以用于分类不良事件、确认相关但可能被漏诊的合并症,或者识别出高风险脱落的患者,并为其提供额外的教育支持以降低脱落风险。
来源:Artificial Intelligence in Cardiovascular Clinical Trials. Journal of the American College of Cardiology, 84(20), 2051–2062. https://doi.org/10.1016/j.jacc.2024. 08.069
往期回顾
观点 | Circulation:冠状动脉旁路移植术(CABG):过去、当下发展与未来展望
进展 | Circulation:老年STEMI伴多支血管病变,完全血运重建可显著降低术后4年MACE风险
进展 | JACC:STEMI患者推荐完全血运重建,那NSTEMI患者应如何选择?完全血运重建vs.仅处理罪犯病变
进展 | JACC:季节性流感在心力衰竭患者中可致超额死亡和住院风险
进展 | JACC:支架术后1年的患者行非心脏手术时,还有必要在围术期继续服用阿司匹林吗?
进展 | JAMA子刊:对于LVEF≥60%的HFpEF患者,心肌肌球蛋白抑制剂玛伐凯泰是否安全、有效?
观点 | Circulation:心肾双向管理的新时代已经到来:识别并及早管理CKD应成为心血管优先事项
进展 | JAMA子刊:高强度他汀基础上联合阿利西尤单抗可使急性心梗(AMI)患者斑块显著回缩
进展 | JACC:心衰合并高钾血症,钾离子结合剂Patiromer可帮助提高RAS抑制剂和MRA使用率
进展 | Circulation:心房分流治疗对LVEF不同的心衰患者疗效是否存在差异?RELIEVE-HF试验结果