颠覆性技术如大模型和人工智能正以迅猛的速度改变医疗健康领域。《论文速读》栏目旨在跟踪这些领域的最新进展,整理全球学术期刊中的前沿论文,帮助读者洞悉热门领域的最新趋势和突破。
本期我们聚焦于大型语言模型在医疗健康领域的前沿应用和突破性研究。这些研究涵盖了医疗服务的各个层面,从初级医疗保健到专科医疗服务,再到公共卫生管理,展现了人工智能在整个医疗体系中的变革性潜力。
期待与您共同探索大模型和医学人工智能领域的前沿科研成果。
01
From Text to Multimodality: Exploring the Evolution and Impact of Large Language Models in Medical Practice
◎ 标题:从文本到多模态:探索大型语言模型在医疗实践中的演进与影响
◎ 摘要:大型语言模型(LLMs)已迅速从基于文本的系统发展为多模态平台,对包括医疗在内的多个领域产生了重大影响。本综述探讨了LLMs向多模态大型语言模型(MLLMs)的演进,及其在医疗实践中日益增长的影响。我们考察了MLLMs在医疗领域的现状,分析了它们在临床决策支持、医学影像、患者参与和研究等方面的应用。研究强调了MLLMs整合文本、图像和音频等多样化数据类型的独特能力,以提供更全面的患者健康洞察。同时,我们也讨论了MLLM实施面临的挑战,包括数据限制、技术障碍和伦理考量。通过识别关键研究空白,本文旨在为未来研究提供指导,包括数据集开发、模态对齐方法和伦理指南制定等领域。随着MLLMs持续塑造医疗的未来,理解它们的潜力和局限性对于负责任且有效地将其整合到医疗实践中至关重要。
Figure:Simplified Taxonomy of MLLMs in Medicine
02
Towards Democratization of Subspeciality Medical Expertise
◎ 标题:迈向亚专科医学专业知识的民主化
◎ 摘要:亚专科医学专业知识的稀缺性,尤其是在罕见、复杂和危及生命的疾病方面,对医疗服务的提供构成了重大挑战。这个问题在心脏病学领域尤为突出,因为及时、准确的管理决定了患者的预后。我们探索了AMIE(Articulate Medical Intelligence Explorer)的潜力,这是一个基于大型语言模型(LLM)的实验性AI系统,专门针对诊断对话进行了优化,旨在增强和支持这一具有挑战性背景下的临床决策。
我们从亚专科心脏病学实践中整理了一个包含204个复杂病例的真实世界数据集,其中包括心电图、超声心动图、心脏MRI、基因检测和心肺压力测试的结果。我们开发了一个包含十个领域的评估标准,由亚专科专家用来评估普通心脏病专科医生或AMIE产生的诊断和临床管理计划的质量,后者还增强了网络搜索和自我批评能力。
结果显示,在10个领域中的5个领域,AMIE的评分优于普通心脏病专科医生(偏好范围从9%到20%),在其余领域表现相当。获取AMIE的回应在63.7%的病例中改善了心脏病专科医生的整体回应质量,而仅在3.4%的病例中降低了质量。在所有10个领域中,能够获取AMIE回应的心脏病专科医生的回应均优于无法获取AMIE回应的心脏病专科医生。定性检查表明,AMIE和普通心脏病专科医生可以相互补充,AMIE全面而敏感,而普通心脏病专科医生简洁而具体。总的来说,我们的结果表明,专业化的医学LLMs有潜力通过弥补亚专科专业知识的差距来增强普通心脏病专科医生的能力,尽管进一步的研究和验证对于广泛的临床应用至关重要。
Figure:Study design.
03
Improving primary healthcare with generative AI
◎ 标题:利用生成式人工智能改善初级医疗保健
◎ 摘要:中国的研究表明,大型语言模型可以改善初级医疗保健系统。然而,要公平地扩大这项技术的应用规模,需要关注农村和资源匮乏地区的情况,以及支持其实施的配套政策
◎ 作者:Winnie Yip
◎ 发表日期:2024-09-18
◎ 发表期刊:Nature Medicine
04
Guiding IoT-Based Healthcare Alert Systems with Large Language Models
◎ 标题:利用大型语言模型指导基于物联网的医疗警报系统
◎ 摘要:医疗警报系统(HAS)正在快速发展,这得益于人工智能(AI)、物联网(IoT)技术的进步以及人们日益增长的健康意识。尽管取得了显著进展,但一个基本挑战仍然存在:在资源受限的HAS环境中,如何平衡个性化健康警报的准确性和严格的隐私保护。为解决这个问题,我们提出了一个统一框架LLM-HAS,该框架将大型语言模型(LLM)整合到HAS中,显著提高了准确性,确保了用户隐私,增强了个性化健康服务,同时改善了用户的主观体验质量(QoE)。我们的创新框架利用专家混合(MoE)方法,结合LLM分析用户的个性化偏好和潜在健康风险,这些信息来自额外的文本工作描述。这种分析指导了专门的深度强化学习(DDPG)专家的选择,用于做出精确的健康警报。此外,LLM-HAS能够处理对话式用户反馈,这不仅允许对DDPG进行微调,还能加深用户参与度,从而提高健康管理策略的准确性和个性化程度。模拟结果验证了LLM-HAS框架的有效性,突显了其作为利用生成式AI(GAI)提供高度准确和可靠警报的开创性方法的潜力。
◎ 作者:Yulan Gao, Ziqiang Ye, et al.
◎ 发表日期:2024-08-23
◎ 发表期刊:arXiv preprint
◎ 原文链接:https://arxiv.org/abs/2408.13071
Figure:Architecture and workflow of the proposed LLM-HAS framework: Once the system receives extra text-based descriptions of occupation or status, LLM processes the data and selects the appropriate experts required to address the users’ specific needs.
05
Characterizing the Adoption and Experiences of Users of Artificial Intelligence–Generated Health Information in the United States: Cross-Sectional Questionnaire Study
◎ 标题:人工智能生成的健康信息在美国的采用情况和用户体验特征:横断面问卷调查研究
◎ 摘要:本研究通过对2406名美国受访者的横断面调查,探讨了ChatGPT作为在线健康信息(OHI)源的使用情况及其影响。研究发现,21.5%的受访者使用ChatGPT获取健康信息。这些用户较年轻,学历较低,更多使用临时医疗服务,并且是更积极的OHI消费者。约39.3%的用户每周使用ChatGPT获取OHI两次或以上,主要用于判断是否需要就医或探索替代治疗。大多数用户认为ChatGPT与其他OHI源和医生一样有用或更有用。值得注意的是,约三分之一的用户基于ChatGPT的信息改变了健康行为,如要求转诊或更改用药。尽管67.9%的用户对ChatGPT输出持怀疑态度,67.5%的用户仍会向医生求证。研究结论强调了AI生成的健康信息在影响健康行为和患者-医生互动方面的重要性,同时指出医生有机会指导患者更明智地使用这项技术。
◎ 作者:Ayo-Ajibola O, Davis RJ, et al.
◎ 发表日期:2024-08-14
◎ 发表期刊:Journal of Medical Internet Research
Table:Behavioral implications of ChatGPT online health information (OHI) use stratified by use frequency (respondents were allowed to select more than one response).