ChatGPT能审稿吗?

文摘   科学   2024-05-06 23:01   北京  


Nature近期发表了一篇研究,发现研究人员正在转向使用ChatGPT或其他人工智能( AI )工具进行同行评审。1


使用人工智能工具进行同行评审,除了版权问题,以及“经常产生误导性或捏造的信息”,更重要的是“它们是否真的具有判断期刊文章可靠性、创新性等质量的能力?”


Mike Thelwall(科学计量学最高奖普莱斯奖得主)最近在JDIS发表论文Can ChatGPT evaluate research quality? 以自己的51篇学术论文为样本,对Chat GPT判断文章质量的能力进行了案例研究。


他根据REF2021(英国研究卓越框架2021)社会科学和人文学科领域的评分指南(Main Panel D)训练了ChatGPT 4 REF D(简称ChatGPT)。由ChatGPT对样本文章的质量进行评分,再与他自己对文章的评分进行对照,以此测试ChatGPT在评估期刊文章质量方面的能力。


研究发现ChatGPT在评分方面的能力较弱,且有可能是根据论文自述的文字进行评分,具有误导性。因此现阶段,研究人员、编辑、审稿人、文献综述作者和评估者应避免使用ChatGPT 4对文章进行质量判断。


未来,人工智能工具将越来越多地用在学术研究和出版领域,我们需要明确这类工具究竟是否拥有学术价值评判的能力,并且在得出结论之前要确保工具不被滥用。毕竟,同行评审作为现代科研过程的一个重要组成部分,在促进科学进步、坚守科研诚信方面具有举足轻重的作用。


阅读全文

Can ChatGPT evaluate research quality?

ChatGPT能评价研究质量吗?

Mike Thelwall

DOI: 10.2478/jdis-2024-0013

全文链接


1. Is ChatGPT corrupting peer review? Telltale words hint at AI use,Nature 628, 483-484 (2024),doi: https://doi.org/10.1038/d41586-024-01051-2


如果有相关的研究或观点发表,欢迎投稿!



JDIS面向整个科学界,以荟萃使用跨学科方法和大型数据集来研究科学研究本身的基础机制为使命,以加深各界对科学主体(科学家、科研机构、国家等)之间相互作用的定量理解为愿景,为促进科学创新提供工具和决策参考。

主要发表以科学研究和创新活动本身为研究对象的数据挖掘和决策支持相关文章,例如科学学、循证决策、科研评价、科学计量学/信息计量学/文献计量学等,收文类型包括原创研究、综述、观点、通讯、笔记等八种长短文。

ImpactFactor:1.5,13/77

CiteScore:3.6,Q1

稿www.j-jdis.com

联络:jdis@mail.las.ac.cn

数据与情报科学英文刊
荟萃各界观点,用科学发现科学。
 最新文章