ChatGPT在解答静脉曲张射频消融相关问题上的表现与质量

学术科学 2024-09-30 18:15 北京

ChatGPT是由OpenAI开发的基于人工智能（AI）的大型语言模型（LLM），它的出现改变了个人在线访问健康信息的方式。LLM能够生成类似人类的文本，通过友好的方式对患者进行询问，同时提供快速响应，并以此改善医疗保健沟通的潜力。与可能缺乏个性化的传统搜索引擎不同，LLM克服了沟通障碍，提供了一种集中且直观的方法来解决患者的咨询。2020年的一项研究显示，目前越来越多的人转向互联网获取健康信息，早欧洲有超过一半的人群（55%）通过在网上搜索健康信息。同样，在美国，寻求在线健康信息的人数比例从2008年的62.8%增加到2017年的74.7%，这凸显了评估LLM以确保他们提供准确可靠的健康信息的重要性。

本研究旨在评价ChatGPT提供的信息的准确性和可重复性，以回答有关静脉曲张射频消融（RFA）的常见问题。

研究精要

在这项横断面研究中，血管外科医生将ChatGPT回答的72.7%咨询信息评估为准确，且有高重现性（89.8%）。认为ChatGPT具有增强患者教育和决策的潜力。

研究人群及方法

这项横断面研究在巴基斯坦卡拉奇的阿加汗大学医院进行。研究人员通过可靠的在线来源整理出一套关于静脉曲张射频消融术（RFA）的18个常见问题（FAQs），并分使用ChatGPT的“新建聊天”选项向其进行2提问。再由12位经验丰富的血管外科医生（每位医生拥有超过2年的工作经验，且每年至少完成20例RFA手术）采用4分Likert量表独立评估所回答内容的准确性，并评估可重复性。

研究结果

研究共收到15份回复，其中3份因不符合纳入标准而被排除。进行内容评估的12名血管外科医生，主要为男性（83.3%），平均经验为12.3±6.2年，其中大多数来自英国（50%），其次是沙特阿拉伯（25%），巴基斯坦（16.7%）和美国（8.3%）。（表1）

表1

在18个问题中，有12个回答被至少75%（9/12）的评价者评为“准确但不够充分”或“全面”（表2）。在总共216个准确性等级中，最常见的分配的等级是“全面”（n=87/216，40.3%）和“准确但不够充分”（n=70/216，32.4%），而只有17.1%（n=37/216）被评为“准确和不准确信息的混合”，10.8%（n=22/216）被评为“完全不准确”。每个问题的准确性等级总结见图1。

表2

图1

但是回答的可重复性很高，两次输入之间有89.8%（n=194/216）的回答是一致的（表II）。其中问题1、2、4、5、8、11、12、13和18的可重复性达到了100%。

表3汇总了12位评估者对所有问题的平均评分和评分者间信度，这些问题被分为三个类别：治疗前关注事项、程序信息、恢复与结果。治疗前关注事项的平均准确评分为3.08 ± 0.07，程序信息的平均准确评分为3.00 ± 0.28，恢复与结果的平均准确评分为3.00 ± 0.16。总体而言，平均评分为3.03 ± 0.19，且评估者之间的分歧不显著（FK：-0.028，95%CI [-0.063，0.008]，p = 0.131）。

表3

在所有回复中，70.4%（152/216）被确定为“质量良好”和“可重现”，没有一个属于“质量良好”和“不可重现”类别（表4）。共有19.4%（42/216）的回答被认为是“质量差”和“可重现”，而10.2%（22/216）被认为是“质量差”和“不可重现”。

表4

结论

ChatGPT通常能为寻求静脉曲张射频消融（RFA）信息的患者提供准确且可重复的信息。然而，该研究也强调了回答质量和评估者一致性方面的差异性，凸显了在依赖人工智能生成的健康信息时需要谨慎。研究结果表明，大型语言模型（LLMs）通过提供便捷且及时的信息，有潜力提升患者教育水平并支持明智决策。不过，回答质量和评估者一致性方面的差异性也指出了在人工智能训练和验证过程中需要持续改进的必要性。未来的发展应侧重于整合信息验证和更新机制，提高数据来源的透明度，并解决回答准确性方面的局限性。

文章来源：

M. Anees, F.A. Shaikh, H. Shaikh, N.A. Siddiqui, Z.U. Rehman, Assessing the Quality of ChatGPT’s Responses to Questions Related to Radiofrequency Ablation for Varicose Veins, Journal of Vascular Surgery: Venous and Lymphatic Disorders (2024), doi: https://doi.org/10.1016/ j.jvsv.2024.101985.

文章翻译：文鑫

硕士研究生

重庆市人民医院心血管外科

往期回顾

PREVIOUS REVIEW

静脉腔内热消融治疗大直径功能不全大隐静脉的中期疗效

下肢静脉曲张丨MOCA消融术治疗静脉功能不全的静脉曲张：美国静脉和淋巴协会立场声明

一键进入血管和介入医师交流社区

扫码进入血管和医介大咖交流群

医介血管频道

感谢您关注医介血管频道！我们致力于打造血管和介入诊疗领域医师一站式分享、交流、学习平台，全面助力中国医师成长与发展。

最新文章

升主动脉瘤的治疗方式

卫生健康技术重点推广项目暨血液透析通路的建立与维护全程管理应用技术推广活动顺利举办

基于新型炎症反应参数评分构建深静脉血栓后综合征预测模型

图谱丨经腹切口显露腹腔干及肠系膜上动脉起始处

今日12:00开播丨启行联合查房系列活动第209期：血管外科常见问题

挑战丨大咖出题第180期：关于下肢静脉性溃疡的治疗以下说法错误的是？

精彩回顾丨2024年首都肿瘤与血管介入论坛暨肝脏相关疾病介入诊疗学习班

肱动脉切开取栓术要点

胸降主动脉瘤的外科及腔内处理

各类型皮瓣设计的解剖学特点

8:30直播丨TIPS手术专场——2024年首都肿瘤与血管介入论坛暨肝脏相关疾病介入诊疗学习班

8:00直播丨2024年首都肿瘤与血管介入论坛暨肝脏相关疾病介入诊疗学习班

主动脉夹层腔内治疗的手术解剖要点

即将启幕丨2024年首都肿瘤与血管介入论坛暨肝脏相关疾病介入诊疗学习班（12月13-15日）

9:00直播丨“精微见术卓越见器”2024门脉高压TIPS治疗技术规范化学习班

淋巴水肿的分类与分期

即将直播丨“精微见术卓越见器”2024门脉高压TIPS治疗技术规范化学习班

定制渐变弹力加压袜治疗职业性水肿的中期疗效评估：一项随机对照试验

图谱丨小肠系膜处的肠系膜上动脉显露

今日12:00开播丨启行联合查房系列活动第208期：血管外科常见问题

挑战丨大咖出题第179期：关于下肢静脉曲张的治疗以下说法错误的是？

直播预告丨12月11-13日“精微见术卓越见器”2024门脉高压TIPS治疗技术规范化学习班，敬请期待！

混合型下肢深DVT血管内治疗后发生PTS的影响因素

下腔静脉滤器丨解剖注意事项

图谱丨股区的外科解剖（下）

今日12:00开播丨启行联合查房系列活动第207期：血管外科常见问题

淋巴水肿的鉴别诊断

会议通知丨2024年首都肿瘤与血管介入论坛暨肝脏相关疾病介入诊疗学习班（12月13-15日）

血管手术的基本技巧

图谱丨股区的外科解剖（上）

今日12:00开播丨启行联合查房系列活动第206期：血栓特别节目

Shockwave治疗钙化性膝下外周动脉疾病的30天Disrupt PAD BTK II研究结果

下腔静脉滤器相关血栓形成患者的三种治疗方案疗效对比——单中心回顾性研究

图谱丨椎动脉外科解剖

今日12:00开播丨启行联合查房系列活动第205期：血管外科常见问题

布-加综合征的腔内治疗方式

腹主动脉瘤支架置入术并发症防治

布-加综合征的各种手术解剖要点

双侧大隐静脉曲张：同期与分期射频消融的疗效与安全性对比分析

非升即走！所有介入、血管外科人员将何去何从？

图谱丨颈部血管的重要局部解剖：颈动脉三角

今日12:00开播丨启行联合查房系列活动第204期：血管外科常见问题

挑战丨大咖出题第177期：患者左下肢溃疡伴色沉伴脱屑1年。脑梗后左下肢活动稍受限，创面仅行换药治疗。目前的首选治疗是哪项？

股动脉-腘动脉（膝上）人工血管旁路术并发症防治

指南共识丨经导管主动脉瓣置换术的围术期护理要点

主髂动脉闭塞性疾病丨腋动脉-股动脉旁路术操作步骤

精彩回顾丨卫生健康技术重点推广项目暨血液透析通路的建立与维护全程管理应用技术推广启动会

新选择！双氯芬酸外用凝胶治疗消融后静脉炎的新探索

上腔静脉综合征的外科手术及腔内治疗解剖要点

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉