摘要
人工智能聊天机器人 Chat Generative Pre-trained Transformer(ChatGPT)能生成详细的回复和类似人类的连贯答案,已被用于临床和学术医学领域。为了评估其在区域麻醉主题方面的准确性,我们制作了一篇关于添加地塞米松以延长外周神经阻滞时间的 ChatGPT 评论。我们邀请了一组区域麻醉和疼痛医学专家来帮助确定要研究的主题,完善输入 ChatGPT 程序的问题,审核稿件的准确性,并为文章撰写评论。虽然 ChatGPT 为普通医学或非专业受众提供了充分的主题摘要,但作为专家作者,所创建的评论似乎并不适合亚专业受众。作者提出的主要问题包括:检索方法不当、组织不力/缺乏流程、文本或参考文献不准确/遗漏以及缺乏新意。目前,我们认为 ChatGPT 无法取代人类专家,在为亚专科医学综述文章提供原创性、创造性解决方案/想法和解释数据方面也极为有限。
背景
人工智能(AI)聊天机器人 Chat Generative Pre-trained Transformer(ChatGPT)于 2022 年 11 月发布,因其对各种话题的详细回复和类似人类的连贯回答而受到公众的广泛关注。ChatGPT 和人工智能在临床和学术医学领域有许多潜在的应用。ChatGPT 已被列为多篇医学研究论文的作者。鉴于人们对这项技术的兴趣迅速增加,而且它与科学写作有明显的交叉,我们制作了一篇关于区域麻醉主题的 ChatGPT 评论,以评估它在这一领域的准确性。
方法
我们邀请了一组区域麻醉和疼痛医学专家帮助确定要研究的主题,完善输入 ChatGPT 程序的问题,审核稿件的准确性,并为文章撰写评论。共有九位专家同意加入该小组并撰写稿件。
小组首先讨论了要将哪个特定的区域麻醉主题输入 ChatGPT。一般标准是该主题需要有相当数量的数据(包括观察性研究和随机研究)发表(请参阅在线补充附录 1)。此外,该主题还必须有一系列现有证据,而这些证据并不统一指向一套答案,以测试 ChatGPT 综合汇总意见的能力。小组确定主题后,由两名研究人员独立将各种格式的问题输入 ChatGPT 程序。我们将综述字数限制在 3000 字以内,以符合期刊特稿的参数要求,并且没有特别要求提供图和表,以便将重点放在文字内容上。我们使用反抄袭软件程序(Dupli Checker: Thornton Heath, Surrey, UK; www.duplichecker.com)。稿件按简单的 0-100 分制打分,“0 ”代表 “完全不重要/质量最低”,“100 ”代表 “非常重要/质量最高”,并按照作者为《区域麻醉与疼痛医学》审稿的情况打分(接受、小修、大修、拒绝)。小组每位成员的评分汇总后得出平均分。平均分最高的稿件未经修改即提交给《区域麻醉与疼痛医学》审阅;另一份作为附录插入稿件中(请参阅在线补充附录 2)。
CHATGPT-CREATED OUTPUT 询问
撰写一篇关于使用地塞米松作为神经阻滞辅助剂的科学手稿。说明其疗效,并与静脉注射地塞米松进行比较。建议将地塞米松用于哪种神经阻滞?使用专业的科学写作风格,字数以 3000 字左右为宜。请向我提出任何与改进相关的问题。
1. 包含结构化摘要。
2. 包括建议的方法部分。
3. 包括潜在结果。
4. 包括讨论部分
5. 包括可能的引文,并注明 PubMed ID (PMID) 编号。
产出
引言 神经阻滞是在各种外科手术中提供区域麻醉和镇痛的常用技术。虽然神经阻滞可以有效缓解疼痛,但其持续时间果往往有限,患者可能需要额外的镇痛药物。为了延长镇痛时间并减少对额外镇痛药物的需求,通常会在神经阻滞中加入阿片类药物和局部麻醉剂等辅助药物。
近年来,合成糖皮质激素地塞米松成为神经阻滞的潜在辅助药物。地塞米松具有抗炎和镇痛特性,在动物模型中可增强局麻药的镇痛效果(PMID: 19176338)。
地塞米松作为神经阻滞的辅助药物已在多项临床试验中进行了研究,并取得了良好的效果。在臂丛神经阻滞、股神经阻滞等多种神经阻滞中,地塞米松已被证明可显著延长镇痛持续时间并降低术后疼痛评分(PMID: 29517624)。
尽管结果令人鼓舞,但地塞米松用于神经阻滞的最佳剂量和时机仍在研究中。此外,地塞米松作为神经阻滞的辅助用药,其安全性还没有得到很好的证实,尤其是在可能出现高血糖和免疫抑制等全身性不良反应方面。
本综述旨在概述目前使用地塞米松作为神经阻滞辅助剂的相关证据。具体来说,我们将研究地塞米松在延长镇痛时间和降低术后疼痛评分方面的疗效,比较其与静脉注射地塞米松的疗效,并确定哪些神经阻滞建议与地塞米松一起使用。我们还将讨论地塞米松的最佳剂量和使用时机,以及潜在的安全问题。
方法
我们对文献进行了系统性回顾,以确定有关使用地塞米松作为神经阻滞辅助药物的文章。我们检索了以下电子数据库:MEDLINE、EMBASE 和 Cochrane 图书馆。我们使用了包括 “神经阻滞”、“地塞米松”、“佐剂 ”和 “区域麻醉 ”在内的关键词组合。我们纳入了 2000 年 1 月至 2022 年 12 月间发表的英文随机对照试验 (RCT) 和荟萃分析。我们排除了不符合纳入标准的研究。
结果
本综述共纳入 15 项研究,包括 1563 名接受地塞米松辅助神经阻滞的患者。在这些研究中,9 项为研究性临床试验,5 项为前瞻性观察研究,1 项为回顾性观察研究。
这些研究包括各种神经阻滞,包括臂丛神经阻滞、椎间孔阻滞、股神经阻滞、坐骨神经阻滞等。研究中使用的地塞米松剂量从 2 mg到 16mg不等,大多数研究使用的剂量为 4-8mg。
在大多数研究中,在局麻药中加入地塞米松会显著延长镇痛时间。例如,Noss 等人的一项研究(PMID:25075626)发现,在肌间沟臂丛阻滞中将地塞米松加入布比卡因后,镇痛持续时间明显长于单独使用布比卡因(平均持续时间为 15.8 小时 vs 9.1 小时,P<0.001)。
同样,Kim 等人的研究(PMID: 24624048)发现,在股神经阻滞中将地塞米松加入罗哌卡因后,镇痛持续时间明显长于单独使用罗哌卡因(平均持续时间为 21.6 小时 vs 14.4 小时,p<0.001)。
在许多研究中,除了延长镇痛时间外,在局麻药中加入地塞米松还能降低术后疼痛评分。
例如,Tsai 等人的研究(PMID: 27787317)发现,在超声引导的锁骨上臂丛阻滞中加入地塞米松和罗哌卡因可降低术后 24 小时内所有时间点的静息疼痛评分和运动疼痛评分。
在 De Oliveira 等人的一项荟萃分析中,作者评估了地塞米松作为周围神经阻滞辅助药物的疗效。该研究包括 22 项 RCT 和 1678 名患者。
作者发现,在局麻药中加入地塞米松可显著延长镇痛时间(PMID: 26185942)。
在 Movafegh 等人的一项研究中,作者评估了地塞米松作为臂丛神经阻滞辅助药物的疗效。这项研究包括 60 名患者,他们被随机分配接受 8 毫克地塞米松或生理盐水。作者发现,与生理盐水组相比,地塞米松组的镇痛持续时间明显延长(PMID: 16269647)。
在 Cummings 等人的一项研究中,作者评估了地塞米松作为股神经阻滞辅助药物的疗效。这项研究包括 30 名患者,他们被随机分配接受 8 毫克地塞米松或生理盐水。作者发现,与生理盐水组相比,地塞米松组的镇痛持续时间明显延长(PMID: 21971633)。
总体而言,这些研究结果表明,在神经阻滞中加入地塞米松作为局麻药的辅助药物,可显著延长镇痛时间并降低术后疼痛评分。
但需要注意的是,有些研究报告的结果相互矛盾。例如,Ponde 等人的一项研究(PMID: 27003953)发现,在坐骨神经阻滞的局麻药中加入地塞米松并不能明显延长镇痛时间或降低术后疼痛评分。
讨论
我们的综述表明,在局麻药中加入地塞米松可延长神经阻滞的镇痛时间。
地塞米松作为神经阻滞辅助剂的作用机制被认为与它的抗炎特性有关。地塞米松可减少神经阻滞部位的炎症,从而减轻疼痛并延长镇痛时间。
地塞米松作为神经阻滞辅助剂的最佳剂量仍在研究中。大多数研究使用的地塞米松剂量为 4-8mg。较大剂量的地塞米松可能会增加不良反应的风险,如高血糖和免疫抑制。不过,一些研究表明,地塞米松剂量越大,镇痛持续时间越长。
例如,Abdallah 等人的一项研究(PMID:27096380)比较了两种剂量的地塞米松(4 mg和 10 mg)作为超声引导锁骨上臂丛阻滞的局麻药辅助剂的疗效。研究发现,与单独使用局麻药相比,两种剂量的地塞米松都能延长镇痛时间。
不过,与 4mg剂量相比,10mg剂量地塞米松的镇痛时间明显更长。
同样,Wu 等人的一项研究(PMID: 28376050)比较了三种剂量地塞米松(2 mg、4 mg和 8mg)作为罗哌卡因的辅助药物,用于超声引导下的腘坐骨神经阻滞的疗效。研究发现,与单独使用罗哌卡因相比,三种剂量的地塞米松都能延长镇痛时间。不过,与 2mg和 4mg剂量相比,8mg剂量地塞米松的镇痛持续时间明显更长。
值得注意的是,地塞米松的最佳剂量可能因神经阻滞的类型和具体的临床情况而异。因此,还需要进一步研究来确定每种神经阻滞的地塞米松最佳剂量。此外,还需要对不同剂量地塞米松的疗效和安全性进行比较研究,以确定临床使用的最佳剂量。
在神经阻滞的局麻药中加入地塞米松可延长镇痛时间,这具有重要的临床意义。它有可能减少对额外止痛药物的需求,并提高患者的满意度。此外,延长镇痛持续时间还能降低因重复使用镇痛药而引起并发症的风险。
值得注意的是,尽管地塞米松作为神经阻滞的辅助药物已被证明是有效的,但它并非没有风险。使用地塞米松可能会导致高血糖、免疫抑制和体液潴留。
不过,大多数研究中使用的剂量都很低,不会导致明显的不良反应。不过,有糖尿病、高血压或心力衰竭病史的患者应谨慎使用。
值得一提的是,地塞米松作为神经阻滞辅助药物的疗效并不局限于特定类型的神经阻滞。我们的研究包括臂丛神经阻滞、股神经阻滞和坐骨神经阻滞等。然而,根据神经阻滞的类型和具体的临床情况,最佳剂量和给药时间可能会有所不同。
此外,还可以将地塞米松作为神经阻滞的辅助药物与作为静脉注射药物进行比较。
在各种外科手术中,静脉注射地塞米松可有效减轻疼痛并减少阿片类药物的用量(PMID: 30621694)。不过,静脉注射地塞米松的镇痛持续时间要短于在神经阻滞中将地塞米松加入局麻药的镇痛持续时间。此外,静脉注射地塞米松与感染、血栓栓塞和高血糖等不良反应的高风险相关。
结论
在神经阻滞的局麻药中加入地塞米松可明显延长镇痛时间。这种效果具有重要的临床意义,有可能减少对额外止痛药物的需求,并提高患者的满意度。最佳剂量和给药时间可能因神经阻滞的类型和具体临床情况而异。虽然使用地塞米松作为神经阻滞的辅助药物通常是安全的,但对于有糖尿病、高血压或心力衰竭病史的患者应谨慎使用。静脉注射地塞米松也能有效减轻疼痛和减少阿片类药物的用量,但其作用持续时间较短,且发生不良反应的风险较高。
评论
我们的主要目标是测试和评估 ChatGPT 背后的人工智能技术。因此,我们讨论了许多可能的主题,并选择了一个已有大量研究和评论文章发表的主题(地塞米松延长外周神经阻滞)。使用 “地塞米松和神经阻滞 ”进行 PubMed 搜索(在线补充附录 1:搜索),并仅限于过去 5 年内的文章(搜索于 2023 年 2 月 19 日进行),共获得 103 篇相关引文,包括 11 篇叙事性综述、16 篇系统性综述/计量分析、62 篇 RCT 和 14 篇观察性试验。
虽然 ChatGPT 为普通医学或非专业受众编写了适当的主题摘要(地塞米松延长周围神经阻滞),但从专家对稿件的低评分来看,为该主题编写的两份摘要似乎不适合亚专科受众(评分较高版本的平均分为 36.1 分(0-100 分制),评分较低版本的平均分为 32.2 分;9 位作者中有 7 位(担任审稿人)将文章评为 “拒绝”,2 位(担任审稿人)将文章评为 “修订”。1(0-100 分制),评分较低的版本为 32.2;9 位作者(作为审稿人)中有 7 位将文章评为 “拒绝”,2 位评为 “重大修改”)。作者们提出的主要问题包括:检索方法不当、条理不清/缺乏流畅性、文本或参考文献不准确/遗漏以及缺乏新意。
两个版本都缺乏明确界定的检索方法。读者无法验证研究结果,因为没有说明用于查找结果文章的方法(如 MeSH 术语)。此外,也没有对检索和审核过程进行说明,也没有对所提供的证据进行分级。两个版本都没有以可读性强的方式进行编排,也没有逻辑性。通常情况下,ChatGPT 摘要读起来就像一份研究清单,研究结果一个接一个地罗列,缺乏连贯性。
一些主要问题是文本或参考文献的不准确/遗漏。例如,在专家评分最高的版本中,一些 PMID 似乎是随机的、不正确的参考文献,与讨论地塞米松的文章不符。这种人工智能混淆是 ChatGPT 和其他人工智能平台的一个已知局限2 。与 ChatGPT 使用的 15 篇文章(未提及如何在其搜索中找到文章)相比,我们在 PubMed(请参阅在线补充附录 1)上对最近 5 年的研究进行了搜索,共获得 103 篇文章,其中包括 16 篇系统综述/计量分析和 62 篇 RCT。虽然对 ChatGPT 为何忽略某些参考文献而纳入其他参考文献的深入分析并不十分清楚,也超出了本评论的范围,但我们在 PubMed 上搜索到的文章与 ChatGPT 使用的文章之间显然存在很大差异;因此,人工智能生成的综述的完整性可能存在问题。此外,我们还注意到 ChatGPT 的参考文献中经常出现错误(例如,作者/期刊信息和 PubMed 标识符参考文献不正确),这一重大问题损害了 ChatGPT 生成的综述的可信度和可靠性。虽然手稿中使用的 ChatGPT 综述在地塞米松延长神经阻滞时间方面没有明显的错误信息,但静脉注射地塞米松 “与较高的不良反应风险相关 ”这一结论值得商榷。此外,一位作者认为 “被拒绝的 ”ChatGPT(请参阅在线补充附录 2)忽略了地塞米松最佳给药途径这一关键问题(即研究了硬膜外注射地塞米松加局部麻醉,但却忽略了静脉注射地塞米松加局部麻醉,而仅研究了静脉注射地塞米松),然后提出了未经证实的重要主张:因此,在神经阻滞部位局部注射地塞米松更适合达到这些效果"。
两个版本都缺乏新意。对现有数据的解释很少,在某些方面,对所讨论的研究缺乏深入的讨论/分析。
例如,ChatGPT 指出添加地塞米松 “可显著延长镇痛持续时间”,但未能量化其数量(如最小临床重要性差异),而这对区域麻醉医师来说是一个重要事实。一些包含的内容还需要进一步扩展和说明(例如,静脉注射与硬膜外地塞米松)。没有一个版本为文献增添了新的内容。
作者的简要判断是,这两个版本都只是对该主题进行了肤浅的描述,不符合本刊实际综述论文的要求。两个版本读起来都像是该领域非专业人士撰写的书本章节或叙事评论。总体而言,这两篇论文的文风和结构都不够科学,不符合期刊标准,而且许多陈述都没有提供参考文献。