点击上方「蓝字」关注我们
编者荐语:ChatGPT作为前沿的生成式人工智能聊天机器人,正逐步展现出在医疗领域的巨大潜力,特别是在提升医疗质量方面。本文深入探讨了AI聊天机器人在协助临床诊断中的可能作用,既揭示了其显著的优势,也坦诚地分析了面临的挑战。文章通过对比AI与医生的诊断能力,审视了AI在复杂病例识别、常见诊断问题解决、病历数据扫描等方面的应用前景,同时强调了AI在优化诊断流程、提高诊断效率方面的独特价值。
ChatGPT是一种生成式人工智能(AI)聊天机器人,最近被誉为提高医疗质量的最有希望的工具。一项研究将AI聊天机器人在医疗问题上的输出与医生的回答进行了比较;其他研究评估了AI聊天机器人对临床样本小片断的反应。尽管经过了几十年的技术进步,但高质量医疗保健的一个基本方面——做出正确和及时的诊断——仍然是现代医学的一个挑战。因此,任何有可能减少诊断错误的新兴技术都值得认真研究。
诊断困境在临床医学中很常见。对病人的最终诊断是一个随着时间演变的过程,可能包括不确定的时期。AI的一个潜在用途是在特别复杂的病例中识别罕见的诊断或不寻常的表现。从历史上看,如果病人有一定的体征、症状、检验和放射检查结果,临床医生依靠他们的记忆来回忆罕见的情况或不寻常的临床表现。在现代,临床医生经常使用互联网搜索引擎、在线资源或鉴别诊断生成器,以协助解决不明原因的临床表现。在有效的评估之前,AI聊天机器人可能会成为帮助诊断困境的有效工具。
相反,AI应用程序还必须解决常见的诊断问题,因为诊断错误造成的大部分伤害都涉及常见的医疗状况。AI聊天机器人的有效使用可以确保临床医生考虑到可能解释患者表现的所有常见状况。例如,运动时呼吸困难、贫血和低钠血症是典型的普通医学问题,但临床医生在进行诊断评估时往往依赖于他们的记忆,这是一种不可靠的方法。此外,临床医生可能无法正确解释检验或放射检查结果。可以通过实时咨询AI聊天平台以确保明显的诊断可能性没有被忽视。理想情况下,该平台将嵌入到电子健康记录(EHR)中以提高咨询效率。
AI的另一个优势是能够比人更快地扫描患者的病历。临床医生通常要花很长时间,通过浏览大量的记录、检验结果变化、放射和病理报告以及其他诊断数据,试图解读患者的描述和疾病历程。通过相关的可视化平台,AI可以以更直观的方式显示这些数据,并协助对这些累积的历史数据进行细致的解释。
尽管AI有这些潜在的好处,但随着AI进一步融入医疗健康,基本的局限性和挑战还是需要仔细考虑。最重要的是,输入聊天机器人的临床病例数据的准确性将决定输出的诊断的准确性。然而,研究表明许多诊断错误与核心临床技能有关,包括病史记录、体格检查和其他数据收集活动。从这些过程中收集的信息是AI聊天机器人辅助诊断的基础,但是这些信息可能不完整或不正确。
此外,患者的病史本质上是主观的。患者把自己的疼痛描述为“刺痛”,或者在疼痛量表上打10分,这可能会提供一些微妙的线索,这些线索又提供重要的信息,但只有人才能察觉到。AI很难以算法的方式持续使用来自患者的主观的个性化的报告。许多患者还描述了大量的症状。梳理并分类这些因素的相对重要性最好由一个有经验的临床医生来完成,他能够从情感上与患者建立联系,理解细微的差别,观察细微的线索,并推断出患者所描述的最显著的特征。有些患者也有可能不愿描述某些症状或其他病史,它通常需要一个富有同情心的临床医生与患者建立人际关系,以引出患者描述完整的病史。AI至少在目前的形式下无法做到这一点,未来需要许多科学进步才能获得这种能力。
体格检查结果的准确性也会限制AI的有效性。如果聊天机器人知道患者的颈静脉压升高或耻骨上压痛,它可能会做出更准确的诊断。然而,这是假设临床医生已经准确地评估了患者的颈静脉压升高或已经检测到耻骨上压痛。即使AI在支持临床诊断方面的作用越来越大,患者评估的基本方面——医生临床检查的准确性——仍然至关重要。
其次,尽管AI扫描病历的速度可能比人更快,但这种优势也依赖于扫描的信息的准确性。EHR有大量不准确的信息,一个重要的原因是复制和粘贴。其中一些不准确的信息包括错误地添加到问题列表中的关键常见诊断,如心力衰竭、慢性阻塞性肺病和慢性肾病。其他不准确的信息包括记录中的人为错误,例如错误的日期、时间或其他重要的患者信息。重要的是EHR中诊断数据的质量将直接决定AI生成诊断的准确性。
推进AI诊断的另一个重大挑战是判断诊断的准确性。许多医学诊断没有最终的确认。例如,蜂窝组织炎、肺炎和失代偿性心力衰竭等常见诊断依赖于临床医生对最终诊断的一致意见,然而这种情况并非发生在所有临床病例中。AI最有助于诊断客观性或数字真实性的情况,例如,当患者的肌酐水平在3天内从1.0 mg/dL上升到3.5 mg/dL时,诊断为急性肾损伤。然而,确定患者是否真的患有肺炎并不那么简单,这种诊断的一般表现包括全身性症状,如发热、咳嗽伴痰和中性粒细胞增多。然而,这些表现中任何一个的存在或缺失都不能明确证实或反驳诊断。评估AI诊断能力的准确性不同于检查它在下棋或解决数学问题时击败他人的能力。在这些AI成功的经典案例中,每个人都同意最终产品的准确性。相反,在许多情况下,即使患者病情有所好转,最终的诊断“答案”可能仍然不确定。临床诊断通常涉及收集和解释不精确和非数字的诊断数据,包括可能没有客观病理检查的诊断。因此,没有结构良好的病例片段判断临床诊断中的AI准确性尤其具有挑战性。
最后,考虑一个假设场景,在这个场景中聊天机器人最终获得了比人类更好的诊断能力。即使实现了这一点,目前AI也无法复制人与人之间的同理心。最近的一项研究表明,AI聊天机器人比医生更有同理心,但一个重要的问题是,这项研究只考虑了书面互动1。大多数患者希望他们的治疗临床医生在诊断时准确无误,在口头和面对面的交流中也能感同身受。即使在现代,有望在最基本和最人性化的层面上实现医患互动的这一核心方面,但AI不太可能很快取代人与人之间的联系。
结束语
当AI能有效地集成到临床医生的工作流程中时,AI的支持可能会提高护理质量,包括诊断。然而在目前的形式下,AI的优势并不能有效地解释临床诊断的某些现实方面。这些方面包括临床诊断所需的基本临床技能,如病史采集和体格检查、EHR数据的准确性、最终诊断准确性的不确定性以及人与人之间的同情心和沟通。随着AI在21世纪被用于改善诊断,这些问题必然会得到解决。
往期回顾
整理:彭 润
主办:重庆市医学会医学工程学分会
声明:
1.文章仅供参考,不作商用,不负法责;
2.原创文章未经许可不得擅作他用;
3.转载文章如有侵权,请与本平台联系。
点个在看 你最好看