01
Emerging research trends in artificial intelligence for cancer diagnostic systems: A comprehensive review
◎ 标题:人工智能在癌症诊断系统中的新兴研究趋势:系统综述
◎ 摘要:本综述文章全面分析了机器学习在癌症诊断系统应用中的最新发展。机器学习方法在提高癌症检测的准确性和速度方面的有效性已经显而易见,解决了大型复杂医疗数据集带来的挑战。本综述旨在评估癌症诊断中应用的现代机器学习技术,涵盖了各种算法,包括监督学习和无监督学习,以及深度学习和联邦学习方法。文章讨论了不同类型数据(如影像、基因组学和临床记录)的数据获取和预处理方法。此外,还探讨了癌症诊断特定的特征提取和选择技术。本文还研究了模型训练、评估指标和性能比较方法。综述同时深入探讨了机器学习在各种癌症类型中的应用,并讨论了与数据集限制、模型可解释性、多组学整合和伦理考虑相关的挑战。文章强调了可解释人工智能(XAI)在癌症诊断中的新兴领域,特别指出了为改善癌症诊断而提出的具体XAI技术。这些技术包括模型决策的交互式可视化和针对增强临床解释的特征重要性分析,旨在提高诊断准确性和医疗决策的透明度。文章最后概述了未来的研究方向,包括个性化医疗、联邦学习、深度学习进展和伦理考虑。本综述旨在为研究人员、临床医生和政策制定者在开发高效且可解释的基于机器学习的癌症诊断系统方面提供指导。
Figure:Artificial intelligence in cancer detection.
02
A scoping review of large language model based approaches for information extraction from radiology reports
◎ 标题:基于大规模语言模型的放射学报告信息抽取方法:范围性综述
◎ 摘要:放射影像学是一种全球普及的诊断方法,然而放射学报告中的自由文本很少被用于二次用途。自然语言处理可以从这些报告中提取结构化数据。本文总结了基于大规模语言模型(LLM)从放射学报告中进行信息抽取(IE)的当前研究现状。我们按照PRISMA-ScR指南进行了范围性综述。在2023年8月1日对五个数据库进行了查询。在符合纳入标准的34项研究中,仅描述了前transformer模型和基于编码器的模型。外部验证显示性能普遍下降,尽管LLM可能改善IE方法的泛化能力。与CT和MRI检查相关的报告,以及胸部报告占主导地位。最常见的挑战包括缺乏外部数据验证和所述方法的增强。不同的报告粒度影响了方法的可比性和透明度。
Figure: PRISMA flowchart describing the source of evidence retrieval and selection process.
03
The state of artificial intelligence in medical research: A survey of corresponding authors from top medical journals
◎ 标题:人工智能在医学研究中的应用现状:基于顶级医学期刊通讯作者的调查研究
◎ 摘要:自然语言处理(NLP)是人工智能的一个分支,通过大型语言模型(LLMs)使机器能够理解和回应人类语言。这些模型在医学研究、科学写作和出版等领域有多种应用,但幻觉、伦理问题、偏见和网络安全等问题需要得到解决。为了了解科学界对人工智能(AI)在研究和写作中的作用的理解和观点,我们设计了一项针对顶级医学期刊通讯作者的调查。从2023年7月13日至9月1日,使用SurveyMonkey网络工具进行了在线调查。调查对象是2022年在《期刊引证报告》排名的15本最高影响因子医学期刊上发表文章的通讯作者。调查链接已通过邮件发送给所有已确定的通讯作者。共有266位作者作答,其中236位进入最终分析。大多数研究者(40.6%)报告对人工智能有中等程度的熟悉,而少数(4.4%)没有相关知识。此外,绝大多数(79.0%)认为人工智能将在未来研究中发挥重要作用。值得注意的是,研究未发现学术指标与人工智能知识或信心之间存在相关性。结果表明,尽管研究者对人工智能的熟悉程度不同,但其在科学研究中的使用仍处于早期阶段。尽管缺乏正式的AI培训,许多在高影响力期刊上发表文章的学者已开始将这些技术整合到他们的项目中,包括改写、翻译和校对任务。未来的努力应集中在为有效使用AI提供培训、由期刊编辑制定指南,以及创建将多种集成工具捆绑到单一平台的软件应用。
◎ 作者:Salvagno M, Cassai AD, et al.
◎ 发表日期:2024-08-23
◎ 发表期刊:PLOS ON
Table:Medical fields expected to benefit most from AI applications.
04
Measured Performance and Healthcare Professional Perception of Large Language Models Used as Clinical Decision Support Systems: A Scoping Review - PubMed
◎ 标题:大型语言模型作为临床决策支持系统的实测性能和医疗专业人员感知:范围性综述
◎ 摘要:医疗保健行业面临着肿瘤委员会会议超负荷、讨论时间缩短以及护理质量问题等挑战,这需要创新性解决方案。整合临床决策支持系统(CDSSs)有潜力支持临床医生减轻癌症负担,但CDSSs在临床实践中的使用仍然不足。2022年OpenAI的ChatGPT的出现,促使人们评估大型语言模型(LLMs)作为潜在的CDSSs在诊断和治疗管理中的应用。我们进行了一项范围界定综述,评估像ChatGPT这样的LLMs作为CDSSs在多个医学专科,特别是在肿瘤学中的实用性,并比较了用户对LLMs的感知与这些系统实际测量的性能。
◎ 作者:Delourme S, Redjdal A, et al.
◎ 发表日期:2024-08-22
◎ 发表期刊:Stud Health Technol Inform
◎ 原文链接:https://pubmed.ncbi.nlm.nih.gov/39176924/
Table:Synthesis matrix of articles studied.
05
Applying and Evaluating Large Language Models in Mental Health Care: A Scoping Review of Human-Assessed Generative Tasks
◎ 标题:大规模语言模型在心理健康护理中的应用与评估:人工评估生成任务的范围性综述
◎ 摘要:大规模语言模型(LLMs)正在成为心理健康护理领域的有前景工具,通过生成类人回应的能力提供可扩展的支持。然而,这些模型在临床环境中的有效性仍不明确。本范围性综述旨在评估LLMs在心理健康护理中的当前生成应用,重点关注这些模型在真实场景中与人类参与者进行测试的研究。通过对APA PsycNet、Scopus、PubMed和Web of Science进行系统搜索,共识别出726篇独特文章,其中17篇符合纳入标准。这些研究涵盖了临床辅助、咨询、治疗和情感支持等应用。然而,评估方法往往缺乏标准化,大多数研究依赖于特设量表,限制了可比性和稳健性。隐私、安全和公平性问题也经常未被充分探讨。此外,对专有模型(如OpenAI的GPT系列)的依赖引发了透明度和可重复性方面的担忧。尽管LLMs在扩大心理健康护理服务可及性方面显示出潜力,特别是在服务不足的地区,但目前的证据不足以支持将其作为独立干预措施使用。需要更严格、标准化的评估和伦理监督,以确保这些工具能够安全有效地整合到临床实践中。
◎ 作者:Yining Hua, Hongbin Na, et al
◎ 发表日期:2024-08-21
◎ 发表期刊:arXiv preprint
Figure: Pyramid framework of evaluation constructs in generative applications of LLMs in mental health care. Contructs in gray represents constructs with no associated articles. "N" represents the number of unique articles that assessed each construct. Gray text indicates constructs that were not assessed in any study.