近日,Nature 杂志公开发表新文章 “The citation black market: schemes selling fake references alarm scientists”,揭露了学术界存在的通过金钱交易来提高论文引用量的现象。
事情经过
纽约大学阿布扎比分校的计算机科学家Yasir Zaki及其研究团队,在一项独特的研究中,为一位虚构的科学家精心构建了一个谷歌学术档案,并上传了20篇完全由人工智能撰写的假研究论文。在研究过程中,他们深入分析了数据集中某作者的相关引文,意外发现了一家公司涉嫌向Google Scholar档案非法出售引文服务。
为了进一步调查,Zaki团队与这家公司取得了联系,并了解到该公司提供的服务包括:以300美元的价格出售50条引文,或以500美元的价格出售100条引文。团队选择了第一种服务进行尝试。令人惊讶的是,仅仅过了40天,就有50条来自22种不同期刊的引文(其中14种期刊还被知名学术数据库Scopus所收录)被成功添加到了这位虚构科学家的Google Scholar档案中。法国格勒诺布尔阿尔卑斯大学计算机科学家 Labbé 表示,这些服务机构会炮制低质量的研究论文,并出售已被接受论文的作者名额,论文工厂有能力在他们出售的论文中插入引文。
更为有趣的是,上个月该团队还进行了一项类似的实验,他们为一只名叫Larry的猫创建了一个虚假的谷歌学术档案,并虚构了十几篇Larry作为唯一作者的论文。随后,网上竟然出现了多篇荒谬的“研究”,这些研究竟然还引用了Larry的“论文”。这一发现被研究人员在学术社交网站ResearchGate上公之于众,引起了广泛关注。在Larry的“学者”身份被揭露大约一周后,谷歌学术迅速采取了行动,删除了这只猫的所有“研究”成果、那些引用Larry“论文”的荒谬研究,以及由此产生的所有累积引文。
引用伪造的预印本
Zaki及其同事的研究旨在量化伪造引文现象的严重程度。他们此前还借助特定软件,筛选了Google Scholar上约160万份至少拥有10篇出版物的个人学术资料。重点搜索了那些引用次数超过200次,或是研究人员年引用增长率达到10倍及以上,亦或引用增长至少占总引用量25%的个案。经过这番筛查,团队锁定了1,016份符合条件的个人学术资料。
Zaki指出,这些资料中的许多论文引用,均源自未经同行评审的预印本文章,这些引用虽常出现在论文的参考文献列表中,但在正文部分却鲜有提及。
纽约大学阿布扎比分校的计算机科学家、本研究的共同作者Talal Rahwan强调:“通过制作虚假的预印本和提供付费服务,引用数据极易被人为操控。”
此外,研究人员还针对全球排名前10的大学中的574名学者进行了调查。他们发现,在那些将引用次数作为评估科学家标准之一的大学中,超过60%的机构会选择从Google Scholar平台获取相关的引用数。
如何解决
法国图卢兹大学的计算机科学家Guillaume Cabanac开发出了一种创新工具,该工具能够识别出那些试图通过插入怪异措辞来逃避抄袭检测软件的伪造论文。他揭示了一个令人震惊的现象:许多研究论文中引用的文献竟然与研究的主题毫无关联。
为了应对这一问题,Zaki的团队引入了“引用集中度指数”这一概念,其目的在于揭示科学家是否仅从极少数来源获取了大量引用。这种高度集中的引用模式往往是“引用环”的显著标志,即科学家们相互达成协议,彼此引用对方的作品,以此人为地提升各自的学术影响力。“可疑之处在于,这些人往往依赖于极少数几个来源来获得大量的引用,” Rahwan解释道。
然而,欺诈者们也在不断进化,寻找更隐蔽的方法来规避检测。Labbé指出,一种可能的策略是分散购买引用,即每次购买少量引用而非一次性大量购买,以此来降低被“引用集中度指数”识别的风险。
在Labbé看来,要从根本上解决引用作弊的问题,关键在于改变学术界的激励机制。他主张,应当减轻科学家因职业发展需要而承受的积累引用数量的压力。“发表和引用的压力正在对科学家的行为产生负面影响,”他强调说,呼吁学术界重新审视并优化其评价体系,以促进更加健康、真实的学术环境。
往期精彩推荐
6、如何优雅地参加学术交流活动?
OAE往期精彩鉴赏
关于OAE