人工智能在医学领域中应用丨通过质量保证、质量控制和验收测试来发挥AI优势降低风险

健康   2024-06-18 19:30   江苏  

"



团队介绍:中山市循证感控团队


中山市循证感控团队来自伟大民主革命先驱孙中山先生的故乡,团队成员以推行循证感控、精准感控为己任,践行 「 感控为公,天下为公 」 宗旨,惟愿诸君将推行感控理念之责任,置之于自身之肩上。

"


检索、编译:章琳 中山市中医院

审核:岑惠珊 中山市人民医院 



人工智能 (AI) 工具在医学领域有着巨大潜力,可以从诊断决策支持、工作流程管理、药物发现以及放射学中整个影像链的应用等方面彻底改变临床工作。尽管 AI 工具在医学领域前景广阔,但在临床环境中应用这些技术面临一些挑战,例如适用范围有限、现实场景中稳定性较差以及缺乏透明度等等。

美国物理学会医学分会(AAPM)第 273 号工作组报告,为临床部署前的 AI 工具测试和评估提供了框架。当前迫切挑战在于制定严格的质量保证程序,以最大限度地发挥 AI 工具的优势,降低其风险,并在临床环境中实施。

这一挑战催生了多学科 AAPM 工作组 TG416 的成立,该工作组名为 「CAD-AI 工具在临床实践中的质量保证和用户培训最佳实践 」。TG416 旨在为任何应用于医学领域中 AI 工具的实践提供最佳质量保证, 确保患者诊疗安全。本文是对 TG416 的介绍性论述。



AI 应用失败的例子


1、Epic 公司开发的基于人工智能的脓毒症治疗系统。经独立审计师报告指出,实际表现与其性能报告存在显著差距。

2、2017 年,阿根廷萨尔塔省采用了一项人工智能工具来识别青少年中存在高风险怀孕的个体。经独立审计人员发现,该工具夸大了预测准确性,因为它是在几乎完全相似且带有偏倚的数据集上进行训练和评估的。

3、已经获得临床应用监管许可的 AI 工具,在新的临床环境中使用时也可能出现性能不佳,这可能是由于泛化能力不足或超出说明书使用。



AI 应用失败例子的启示


这些案例凸显了医学领域中 AI 工具面临的挑战,因为开发者所用数据(即用于创建工具的训练、验证和测试集)的分布与外部测试集、之前未使用过的测试集或当地患者病例特征,可能存在偏倚。这需要开发人员在将 AI 工具纳入临床工作流程中时,需要透明地公开开发过程和质量保证程序。

而采用标准化的质量保证 (QA) 协议和质量控制 (QC) 程序有助于改进问题,包括:(1)在临床使用前进行验收测试(AT);(2)持续进行质量控制(QC)监测;(3)提供充分的用户培训。

01
质量保证(QA)

质量保证(QA)由初始验收测试(AT)和定期 QC 程序组成(如图 1 所示),旨在在问题影响患者之前识别、隔离和解决所有问题。质量控制(QC)是质量保证(QA)的重要组成部分。


图 1 质量保证(QA)、验收测试(AT)和质量控制(QC)在医疗领域的人工智能工具相互关联的流程图。

采用标准化质量保证(QA)协议。以医学影像领域为例,其长期以来一直致力于质量和安全,并通过严格执行质量保证(QA)协议进行监管。如在美国,乳腺 X 线摄影受到《乳腺 X 线摄影质量标准法》(MQSA)的监管,该法律要求实施全面的质量保证(QA)计划,包括初始验收测试(AT)、对硬件和软件进行持续性质控测试(QC)、设备维护、初次和持续教育以及同行评审的医疗审核。MQSA 框架可以作为一个有价值的模型,用于为医疗 AI 工具制定质量保证指南,旨在确保性能稳定、用户培训标准、持续教育以及定期同行评审。

鉴于 AI 在医学影像领域中的不同应用,每个 AI 工具都需要自己特定的 QA 程序,一般来说 QA 程序包括四个步骤:(1)新安装工具的测试,这通常比正在进行的常规质量控制测试更严格。(2)确定基准性能。(3)持续监控工具,确保及早发现性能的任何变化。(4) 在对可能影响 AI 工具输出的工作流进行任何更改后,定期重新验证以验证性能。

02
验收测试(AT)

AI 工具被归类为医疗设备,容易受到微小或明显故障的影响,从而对患者诊疗产生负面影响并引发法律责任。例如,Voter 等人在一项商业可用的 AI 工具上发现其诊断准确性有所降低,在某些情况下错误原因尚不清楚。这些发现强调了在使用本地定制参考测试集时对 AI 工具进行特定环境评估的重要性。

有效的 AT 确保 AI 工具无缝融入当地工作流程,而不会干扰现有功能。此外,它还验证性能、指出局限性,并标记潜在偏倚。

AI 开发团队需要在初始购买或升级过程中,以及再次执行 QA 程序时披露的信息内容,应包括开发数据统计学特征(如性别、体质指数(BMI)、年龄、种族、设备类型和其他混杂因素)。这些信息对于确定该工具是否适用于当地特定患者人群是必要的。

03
质量控制(QC)

验收测试(AT)建立基准性能,持续的质量控制(QC)对随时间变化的性能监测非常重要。随着时间推移,患者人口统计学或临床工作流程可能会发生变化,从而改变当地人口特征(例如患者年龄、BMI、治疗疾病、成像设备或协议)。经过优化处理后的数据可能导致 AI 工具偏离其初始性能。

1、对硬件、软件或 AI 输入系统进行定期测试,每日、每月或半年一次。开发人员确定可能影响 AI 输出的本地工作流程要素并提供监控工具,指定初始安装和未来升级的限值,随着时间的推移自动跟踪特定的性能基准。监测、测试频率应与工具风险相匹配(即风险越高,需要更频繁审计),还要考虑法规和操作经验。

2、重视用户反馈。如为临床医务人员提供用户友好且高效的报告工具,以记录 AI 工具在日常使用中提供不合理建议的情况。披露有关开发数据的详细信息,包括演示图组成和预期用途,以便医务人员能够更好地了解该工具在当地人群中的潜在局限性。

3、高风险的 AI 工具,例如涉及分诊或医疗诊断的工具,需要严格的年度评估。评估应仔细检查工具的公平性、潜在偏差和错误率。在临床工作流程发生重大变化、技术更新或临床用户发现异常错误后,可能需要对高风险工具进行频繁测试。旨在患者安全和运营效率之间取得平衡。

此外,应核查临床医生与 AI 工具的交互,以识别自动化偏差等潜在问题。年度重新验证过程可能涉及使用开发人员提供的和本地整理的参考测试集重复验收测试(AT)程序,以识别与基线性能的任何偏差。如果临床工作流程、患者人口统计、成像设备或软件升级或其他可能影响 AI 工具的因素发生变化,则必须考虑重新验证。在这种情况下,更新编制反映变化情况的本地参考测试集也是明智之选。此外,建立同行评审机制以识别性能变化也是必不可少的。

04
用户培训

用户培训是成功将 AI 工具融入诊疗工作的关键要素。为了降低风险,终端用户必须了解工具的预期用途、功能、局限性和伦理影响。这种培训应既全面,又针对每个临床科室的独特要求和规程。

除了特定的说明外,培训模块还应包括正确使用 AI 工具的信息、底层假设、法律框架,以及成功和不成功应用的案例研究。这种多方面的方法有助于理解工具的优点和局限性。

最重要的是,在 AI 工具开始影响临床决策之前就开始进行用户培训,并在整个 AI 工具运营期间定期更新。持续教育应包括同行评审,并使临床医生能够有效地了解 AI 工具在患者诊疗中所扮演角色及其影响。

此外,需要额外针对特定学科进行培训,来设置基于 AI 输出指导决策,例如放射治疗计划中自动分割需要对剂量师、物理学家、医生和肿瘤学家等进行有效培训。全面培训可以使团队能够有效地核查治疗计划过程中产生的 AI 输出结果,识别偏差和局限性。

制定实用且可供非 AI 专家的医疗专业人员使用的指南。由于不同 AI 工具的具体程序有所不同,开发人员应提供有关系统设置、协议、参考数据集的预期性能指标,以及正在进行的质量控制测试的详细指南也必不可少。

AI 的有益和有效应用主要通过严格的质量保证协议、透明的开发团队的实践以及持续监测和调整来增强。



总结



总之,在医疗领域中,严格的质量保证协议、透明的开发团队的实践、持续监测和调整使 AI 应用得更符合伦理且高效。通过持续监测(QC)和严格测试(AT),质量保证(QA)确保医疗 AI 工具在不同患者人群和临床应用中始终可靠有效。严格的测试程序提高了这些工具在临床医生和患者中的可信度,并支持确保 AI 工具能够有效推广到不同环境。

整合健全的质量保证计划可以创建一个更有韧性的医疗系统,使其能够充分利用 AI 带来的好处同时将风险最小化。这些因素共同促进了将 AI 打造成为一种更可靠、安全、公平的医学工具,使得医务人员能够建立信任并防止伤害发生,同时适应不断变化着的 AI 领域。

文献来源:

[1] Mahmood U, Shukla-Dave A, Chan HP, et al. Artificial intelligence in medicine: mitigating risks and maximizing benefits via quality assurance, quality control, and acceptance testing. BJR Artif Intell. 2024 Mar 4;1(1):ubae003. doi: 10.1093/bjrai/ubae003. PMID: 38476957; PMCID: PMC10928809.

题图:https://www.cxoinsightme.com/wp-content/uploads/2020/07/AI_shutterstock_1722492775-scaled.jpg


SIFIC感染循证资讯
SIFIC感染官微矩阵之一,发布感染相关国际指南,循证动态等。
 最新文章