British Journal of Ophthalmology | GPT-4V在眼科多模态图像分析中的不足

学术 2024-08-23 17:00 北京

主要发现

British Journal of Ophthalmology期刊近期发表了一篇来自香港理工大学眼科视光学院研究团队的研究，该研究揭示了GPT-4V在处理眼科多模态图像方面的不足，并为进一步改进和测试多模态大语言模型在眼科领域的临床应用提供了一个新的基准测试数据集（OphthalVQA）。

原文献信息：

背景介绍

近年来，人工智能（AI）在医疗领域的应用迅速发展，特别是在眼科这种高度依赖图像诊断的学科中。GPT-4V是由OpenAI发布的多模态大语言模型（LLM），其不仅在开放世界视觉理解、视觉描述、多模态知识、常识、场景文本理解、文档推理、编码、时间推理、抽象推理、情感理解等方面有出色的表现，也在诸多包含胸部CT、脑部MRI等医学影像的医学基准测试任务中有令人印象深刻的表现。在眼科诊疗中，各种图像模态如裂隙灯照相、眼底照相、光学相干断层扫描（OCT）、眼底荧光血管造影（FFA）、眼部超声等对于眼科疾病的诊疗至关重要。然而，尚未有系统的研究评估GPT-4V在眼科多模态图像中的表现。该研究旨在评估GPT-4V在眼科多模态图像分析中的表现，探讨其在临床决策和患者咨询中的潜力。

主要研究

该研究使用包含6个模态、60张图像和600个问题的数据集进行测试。这些图像包括裂隙灯照相、广域眼底照相、后极部眼底彩照、OCT、FFA和眼部超声。每张图像对应10个开放性问题，涵盖检查种类、病变检测、诊断、进一步检查、治疗、病因、视力预后、并发症、疾病进展和预防。眼科医生人工评估了GPT-4V的回答，重点关注其准确性、可用性、安全性以及关于诊断问答的可重复性。其中准确性分为：准确、部分准确和不准确；可用性分为：高度可用、部分可用和不可用；安全性分为：没有危害、轻度危害和严重危害。结果显示：在GPT-4V的600个回答中，仅30.6%为准确，21.5%为高度可用，55.6%被认为没有危害。GPT-4V在裂隙灯照相中表现最佳，准确率、高度可用率和没有危害率分别为42.0%、38.5%和68.5%。然而，在后极部眼底彩照中表现最差，仅有13.7%的回答准确，3.7%高度可用，38.5%的回答没有危害。尽管GPT-4V正确识别了95.6%的眼部图像模态类型，但在病变识别（25.6%）、诊断（16.1%）和决策支持（24.0%）方面表现不佳。此外，在询问图像诊断的问答中，GPT-4V的回答可重复性仅为63.3%（38/60）。

总结

该研究建立了一个新的眼科多模态基准测试数据集（OphthalVQA），并将其用于评估GPT-4V在处理眼科多模态图片中的表现。结果发现GPT-4V在眼科多模态图片的问答中，仅30.6%的回答为准确，21.5%为高度可用，55.6%被认为没有危害。该研究认为：尽管GPT-4V在眼科多模态图像分析中展示了一定的潜力，但目前仍无法用于临床决策和患者咨询。

作者简介

本文第一作者为香港理工大学研究助理许普生，共同第一作者为一年级博士生陈晓兰和赵紫薇。通讯作者为香港理工大学研究助理教授施丹莉。

施丹莉，香港理工大学研究助理教授，主要研究方向为眼科数字健康、生成式人工智能、多模态人工智能，以及人工智能的临床转化。

关于 British Journal of Ophthalmology

British Journal of Ophthalmology（BJO）服务于眼科医生和视觉科学专家，发表眼科学临床研究、临床观察以及临床相关的实验室研究。

收稿率：9%
出版频率：月刊
出版速度：
投稿至初步决定：54天（中位时间；含外审）
接收至发表：24天（中位时间）
2023年影响因子：3.7

官网：bjo.bmj.com

欢迎订阅期刊Email Alerts获取最新文章资讯：

https://emails.bmj.com/k/Bmj/jausu/bjophthalmol

http://mp.weixin.qq.com/s?__biz=MzIzNjA4NTkyOQ==&mid=2651926730&idx=1&sn=b14100598ae2bd7e5ad2635a74b95b07

BMJ医学

BMJ出版集团（BMJ）隶属于英国医学会，经过180年的发展，BMJ已成为世界领先的医疗知识提供者。BMJ见证并支持中国医疗卫生的进步与发展。享誉世界的综合医学期刊 The BMJ （英国医学杂志）在中国拥有广大的读者和作者群体。

最新文章

主编说 | 关注小儿外科前沿动态共探先天性膈疝最新进展

新闻 | BMJ Medicine获首个影响因子6.0，位于JCR Q1分区

BMJ Evidence-Based Medicine | 针刺治疗膝骨关节炎的临床疗效与影响因素

BMJ Paediatrics Open | 中国早产儿支气管肺发育不良的时点患病率、疾病特征和诊疗情况：一项多中心横断面研究

BMJ Leader | 解决发展中国家欠发达城市儿科医务人员短缺问题的创新管理策略

JECH | 约40%的绝经后激素受体阳性乳腺癌可归因于体脂率过高

The BMJ | 基于多基因模型选择三阴乳腺癌患者术后化疗方案：BCTOP-T-A01试验

ARD | 单细胞多组学揭示狼疮肾炎肾脏中存在活跃的滤泡外B细胞和颗粒酶K阳性CD8 T细胞应答

The BMJ刊发专辑：中国慢性病当前挑战

The BMJ | “强化－简化”新策略显著改善伴有严重高血糖的新诊断2型糖尿病患者的长期血糖控制

RMD Open主题专辑征稿 | 临床前期类风湿关节炎：从病理学到预防

The BMJ | 2024气候变化文章合集

The BMJ | 极端降雨事件与全因死亡、心血管疾病死亡和呼吸系统疾病死亡风险存在关联

新闻 | eGastroenterology期刊被Scopus数据库收录

BMJ Open Ophthalmology主题专辑征稿 | 小梁网在眼部健康和眼科疾病中的作用

BMJ Mental Health | 老年人群中心理韧性与死亡的关联性

British Journal of Ophthalmology | 眼科学领域的生成式人工智能——主题专辑文章要点速览

文章概览 | British Journal of Ophthalmology 2024年第9期要点速览

BMJ Mental Health | 精神障碍、抗抑郁药物与心血管疾病之间的潜在因果关系分析：孟德尔随机化研究

BJSM | 运动与二甲双胍单独或联合治疗对糖代谢异常人群的效果：系统综述与网状荟萃分析

BMJ Mental Health | 健康生活方式对有既往抑郁史成年人的抑郁复发及死亡风险的影响：一项前瞻性队列研究

BMJ Paediatrics Open主题专辑征稿 | 儿童早期的残疾与发展

BMJ Mental Health | 非典型抗精神病药物治疗BPSD的疗效、可接受性和耐受性

eGastroenterology Conference 2024 第二轮会议通知

Injury Prevention主题专辑征稿 | 在可持续发展目标时代重新思考伤害研究与行动的未来

The BMJ | “笑的训练”vs人工泪液对干眼患者眼部不适的影响：一项非劣效性随机对照临床试验

BMJ Open Sport & Exercise Medicine主题专辑征稿 | 气候变化对运动表现、政策和体力活动的影响

BMJ Open Gastroenterology主题专辑征稿 | 加强医院中的营养支持

British Journal of Ophthalmology|近视防控的最佳实践：洞察与创新——关于近视预防和控制的圆桌讨论

The BMJ刊发专辑：中国女性健康促进

Annals of the Rheumatic Diseases| Th9细胞中PU.1-IL9正反馈循环促进类风湿关节炎的发展

医疗质量与安全国际论坛（08.26-28 香港）：合作交流中国专场欢迎莅临！

British Journal of Ophthalmology | GPT-4V在眼科多模态图像分析中的不足

BMJ Oncology | 将机器学习算法应用于全癌风险预测模型：大型前瞻性队列中的应用研究

会议预告｜“人工智能技术赋能医疗与质量改进：机遇与挑战”专题研讨会

会议预告｜如何发表质量改进工作：编辑视角工作坊（WORKSHOP）

BMJ Health & Care Informatics主题专辑征稿 | 循证数字健康

The BMJ | 主编推荐：中国作者文章影响力表现亮眼

The BMJ | 一些生物公司过分夸大了脐带血库对准父母的价值

Injury Prevention | 加强伤害研究领域的多样性、包容性和公正性

BMJ Paediatrics Open | 一家大型三级儿童医院儿科处方未取药的相关影响因素：一项回顾性观察研究

Injury Prevention | 将伤害预防整合至可持续发展目标：机遇与挑战

BMJ Paediatrics Open | 儿童和青少年回避性/限制性摄食障碍的躯体并发症：系统综述和荟萃分析

Journal of Clinical Pathology中国专辑征稿 | 分子病理学在诊断中的应用—聚焦中国人群

BJSM | 运动疗法与口服镇痛药在治疗髋膝骨关节炎中的疗效：随机对照试验的网状荟萃分析

eGastroenterology创刊一周年-文章精选（2）

文章概览 | British Journal of Ophthalmology2024年第8期要点速览

The BMJ | 高血压辅助决策系统干预效果—整群随机对照研究

BMJ Open Diabetes Research & Care | 不同亚型糖尿病患者羧酸酯脂肪酶基因新变异的鉴定及其特征

BMJ Quality & Safety | 中国互联网诊疗质量评估——一项采用标准化病人的研究

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉