论文速读 · 第49期 | 大模型与医学人工智能

文摘   健康   2024-11-28 15:50   北京  
注:本期论文的对谈内容由 Notebook LM 生成,请谨慎收听

颠覆性技术如大模型和人工智能正以迅猛的速度改变医疗健康领域。《论文速读》栏目旨在跟踪这些领域的最新进展,整理全球学术期刊中的前沿论文,帮助读者洞悉热门领域的最新趋势和突破。

本期重点探讨大型语言模型(LLMs)和生成式人工智能(GAI)在心理健康和神经疾病诊断中的最新研究与应用,内容包括:
· 利用LLMs从用户日记文本中检测抑郁症的新方法,验证其在数字心理健康筛查中的潜在临床价值。 
· GAI在脑部MRI影像分析中的应用,提升脑疾病诊断的准确性,探讨五种基础GAI模型在MRI成像中的作用。
· 基于认知行为疗法的生成式AI工具Socrates 2.0,促进苏格拉底式对话,改善心理健康治疗的可行性研究。 
· LLMs在精神病学中的应用现状、局限性和未来展望,讨论其在诊断、治疗和个性化护理中的作用及挑战。 
· 引入ANGST数据集,评估LLMs在抑郁-焦虑共病诊断中的性能,揭示当前模型的能力和局限性,强调应用于心理健康诊断的持续挑战。 

期待与您共同探索大模型和医学人工智能领域的前沿科研成果。


01 

Using Large Language Models to Detect Depression From User-Generated Diary Text Data as a Novel Approach in Digital Mental Health Screening: Instrument Validation Study

 

◎ 标题:使用大型语言模型从用户生成的日记文本数据中检测抑郁症作为数字心理健康筛查的新方法:工具验证研究

◎ 摘要: 抑郁症在全球范围内具有重大影响,导致职业生产力下降和高残疾负担等社会后果。对临床显著性抑郁症的早期检测和干预已受到关注,但现有的抑郁筛查工具(如流行病学研究中心抑郁量表)在客观性和准确性方面存在局限。因此,研究人员正在寻找抑郁症的客观指标,包括图像分析、血液生物标志物和生态瞬时评估(EMA)。在EMA中,用户生成的文本数据,特别是日记写作,利用大型语言模型(如ChatGPT)的进步,已成为检测或诊断抑郁症的具有临床意义和可分析的来源。我们旨在通过情感日记写作应用程序,使用大型语言模型(LLM),基于用户生成的日记文本检测抑郁症,验证半结构化日记文本数据作为EMA数据源的价值。方法上,在为期两周的日记写作期开始和结束时,使用患者健康问卷评估参与者的抑郁状况,使用贝克自杀意念量表评估自杀风险,并收集每日日记的文本数据进行分析。评估了领先的LLM(如使用GPT-3.5和GPT-4的ChatGPT)在有无GPT-3.5微调训练数据集情况下的性能,模型性能比较涉及使用链式思维和零样本提示来分析文本结构和内容。结果显示,我们使用了91名参与者的428篇日记;GPT-3.5微调在抑郁检测中表现出优异性能,准确率为0.902,特异性为0.955。然而,未经过微调和提示技术的GPT-3.5的平衡准确率最高(0.844),召回率为0.929。结论是,GPT-3.5和GPT-4.0在基于日记识别抑郁风险方面均表现出较好的性能。我们的研究结果强调了用户生成的文本数据在检测抑郁症方面的潜在临床应用价值。除步数和身体活动等可测量指标外,未来研究应更多地关注定性的数字表达。

◎ 作者Shin D, Kim H, et al.
◎ 发表日期2024-11-16
◎ 发表期刊Journal of Medical Internet Research
◎ 原文链接:https://www.jmir.org/2024/1/e54617/

Figure:Chain-of-thought (CoT) prompting. Differences with standard prompting are shown in blue.



 

02 

Applications of Generative Artificial Intelligence in Brain MRI Image Analysis for Brain Disease Diagnosis



◎ 标题:生成式人工智能在脑部MRI图像分析中的应用:脑部疾病诊断

◎ 摘要:大脑易受感染、损伤和肿瘤等疾病的影响,这些疾病会严重影响日常生活和健康,因此早期诊断和治疗是必要的。由于MRI能够无干扰地检测早期异常,对于评估大脑结构和功能至关重要。生成式人工智能(GAI)能够对脑部MRI图像中的疾病特征进行建模,通过比较健康和患病大脑,提升诊断准确性。本综述探讨了GAI在分析脑部MRI图像以诊断脑部疾病中的变革性作用。研究了五种基础的GAI模型——生成对抗网络(GAN)、扩散模型、Transformer、变分自编码器(VAE)和自回归模型——及其在MRI成像中的应用。这些模型增强了数据预处理、图像分割和特征提取,从而提高了诊断准确性,支持早期疾病检测。本综述强调了GAI在解决数据稀缺问题、提高图像质量和提供对脑部疾病病理学的全面见解方面的优势,并讨论了未来研究的有前景方向。

◎ 作者Zhaomin Yao, Zhen Wang, et al.
◎ 发表日期2024-10-14
◎ 发表期刊Neuropharmacology and Therapy
◎ 原文链接:https://www.scienceopen.com/hosted-document?doi=10.15212/npt-2024-0007

Figure:Flowchart of use of AI to analyze MRI images.



03 

Large Language Models in Psychiatry: Current Applications, Limitations, and Future Scope

 

◎ 标题:大型语言模型在精神病学中的应用:现状、局限与未来展望

◎ 摘要:随着人工智能(AI)技术的进步,大型语言模型(LLMs)在自然语言理解和生成方面提供了卓越的能力,增强了各个领域。在精神病学中,LLMs通过分析大量医疗数据,提高诊断准确性、增强治疗沟通、个性化患者护理,发挥其理解和生成类人文本的优势,能够赋能医疗保健。在临床AI中,开发和利用稳健且可解释的模型一直是一个长期挑战。本综述调查了LLMs在精神病学实践中的现状,以及可用于训练精神病学LLMs的一系列语料库资源。我们讨论了LLMs在可重复性、能力、可用性、临床环境中的可解释性和伦理考虑方面的局限性。此外,我们提出了精神病学LLMs在研究、临床应用和教育方面的潜在未来方向。最后,我们讨论了在真实场景中将LLMs整合到不断发展的医疗保健领域所面临的挑战。

◎ 作者Liu Z, Bao Y, et al.

◎ 发表日期2024-10-11

◎ 发表期刊Big Data Mining and Analytics

◎ 原文链接https://www.sciopen.com/article/10.26599/BDMA.2024.9020046

Figure:Potential applications of LLMs in psychiatry. The future application of LLMs in psychiatric medicine, particularly in leveraging multimodal data, offers promising avenues for advancing research, clinical practice, and education. By incorporating various data types, LLMs can potentially provide more nuanced and holistic insights into mental disorder conditions, thereby enhancing both diagnosis and treatment.



04 

Still Not Quite There! Evaluating Large Language Models for Comorbid Mental Health Diagnosis

 

◎ 标题:仍然不够完美!评估大型语言模型在共病心理健康诊断中的表现

◎ 摘要:本研究介绍了ANGST,这是一个从社交媒体帖子中进行抑郁-焦虑共病分类的新颖、首创的基准数据集。与通常将不同心理健康障碍视为孤立条件、过度简化其复杂相互作用的当代数据集不同,ANGST支持多标签分类,允许每个帖子同时被识别为指示抑郁和/或焦虑。ANGST由专家心理学家精心注释的2876个帖子和额外的7667个银标签帖子组成,提供了更具代表性的在线心理健康话语样本。此外,我们使用从Mental-BERT到GPT-4的各种最先进的语言模型对ANGST进行了基准测试。结果显示,这些模型在复杂诊断情境中的能力和局限性有重要见解。虽然GPT-4通常优于其他模型,但在多类别共病分类中,没有模型的F1得分超过72%,这凸显了将语言模型应用于心理健康诊断的持续挑战。

◎ 作者Amey Hengle, Atharva Kulkarni, et al.

◎ 发表日期2024-10-04

◎ 发表期刊arXiv preprint

◎ 原文链接https://arxiv.org/abs/2410.03908

Table: Results of various methods for depression and anxiety binary classification


 

05 

A Novel Cognitive Behavioral Therapy–Based Generative AI Tool (Socrates 2.0) to Facilitate Socratic Dialogue: Protocol for a Mixed Methods Feasibility Study

 

◎ 标题:一种新型基于认知行为疗法的生成式AI工具(Socrates 2.0)促进苏格拉底式对话:混合方法可行性研究方案

◎ 摘要: 数字心理健康工具旨在增强传统的心理健康治疗,由于获取心理健康护理存在各种障碍(包括临床医生短缺日益严重),这些工具的重要性日益凸显。大多数现有工具使用基于规则的算法,导致与人类治疗师相比,交互感觉不自然。大型语言模型(LLMs)为开发更自然、更具吸引力的数字工具提供了解决方案。本文详细介绍了Socrates 2.0的开发,它是一种新型基于认知行为疗法的生成式AI工具,旨在促进围绕不现实或无益信念的苏格拉底式对话,这是认知行为疗法的核心技术。该工具采用基于多代理的LLM,包括一个AI治疗师Socrates,接受来自AI监督者和AI评估者的自动反馈。多个代理的组合有助于解决常见的LLM问题,如循环,并改善整体对话体验。初步用户反馈积极,但需要与潜在终端用户进行正式的可行性研究。为此,我们设计了一项混合方法的可行性研究,以收集用户和临床医生与该工具交互的定性和定量数据,目标是从100名用户和50名临床医生处收集可行性和可接受性数据,为在心理健康治疗中实施生成式AI工具(如Socrates 2.0)提供信息。结果显示,招募将于2024年2月开始,预计于2025年2月结束。截至2024年9月25日,已招募了55名参与者。Socrates 2.0的开发和所述的可行性研究是在将生成式AI应用于心理健康治疗方面的重要第一步,为正式的可行性研究奠定了基础。

◎ 作者Held P, Pridgen SA, et al.

◎ 发表日期2024-03-08

◎ 发表期刊JMIR Research Protocols

◎ 原文链接https://www.researchprotocols.org/2024/1/e58195

Figure:Socrates 2.0 artificial intelligence (AI) entity interactions.


 

美年健康研究院
健康管理和医药产业研究
 最新文章