海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月
在学术界,论文工厂因其批量生产毫无价值的虚假论文而臭名昭著。其实,论文工厂开展的业务范围比我们想象中的要大得多。比如,通过付费服务帮助撰稿人提高论文引用率。最近,美国西北大学博士生Reese Richardson和她的“打假小组”成员一起揭露了论文工厂惯用的手法。她们采取的方式很特别:把一只萌萌的猫咪送上了“学术热搜”。
图源:pixabay.com
事情源于Reese Richardson的朋友——剑桥大学工程和流体动力学研究员、学术打假爱好者Nick Wise收到了一份来自论文工厂的广告。该广告声称能够帮助买家提高某著名学术平台“A”(为防止模仿行为,本文中平台名称皆隐去)个人资料中论文引用次数和 h 指数。(注:本文的图均源自Reese Richardson的博客,链接见参考文献。)
该广告展示了多个成功案例,包括客户个人资料“升级”前后对比的图片。比如某客户通过向这家公司支付服务费用,该客户的 h 指数翻了一番,引文数量翻了两番。
不仅如此,广告显示,这些客户分别购买了 50 到 500 次引用不等。显示的18个客户中,大部分人仍然活跃在某平台上。其中可识别的客户都隶属于印度大学,此外还有分别来自阿曼和美国的两名客户无法识别。尽管,广告中还提到了某著名科技医学界索引“B”,但小组成员最终没能找到直接证据,证明该论文工厂能够提高其引用率。
那么,问题来了:论文工厂究竟是如何操纵引文数量的呢?
首先,强行插入参考文献。对于一些客户来说,大量的引用来自于同一可疑期刊的数十篇论文。这些论文可能是由论文工厂以客户身份所炮制的。在这类论文里,比如正文中编号最高的参考文献是参考文献 40,而参考文献列表则扩展到参考文献 53。参考文献 48 到 53都是服务客户而后期塞进去的。
除了插入虚假论文,一些已故知名科学家论文也被无辜“搭便车”。数十篇由毕达哥拉斯、伽利略、柯尔莫哥洛夫等知名人士撰写的论文,通过人工智能软件“D”被生成为除了摘要和标题之外都是“胡言乱语”的文章。这些论文没有在任何期刊或预印本服务器上发表,只以 PDF 文件的形式上传到某些学术社交网站“C”。即便随后这些文章就立刻被删除掉。然而,学术平台“A”已经通过“时间差”将这些文章编入了索引。这种野蛮粗暴的方式,甚至连期刊都不需要。
所以,论文工厂提高引用率的方法不外这样几个步骤:
与客户签订合同。
使用人工智能软件“D”自动生成几篇毫无意义的论文 。
在这些无意义的论文中随机插入对客户论文的引用。
将这些论文上传到学术社交网站“C”。
等待学术平台“A”将无意义的论文及其引文编入索引。
客户庆祝学术影响力“升级”
7删除上传学术社交网站“C”的无意义论文,抹去痕迹。
通过这种方式,任何人都可以付些费用给自己编写一部“学术影响力”的剧本来镀金。气愤之余,Reese Richardson决定揭露论文工厂的手法,来督促相关学术平台和网站尽快正视系统“漏洞”,亡羊补牢。
这时,她想到了自家的哈基米——一只名为 Larry的猫咪。她决定把Larry通过论文工厂打造称一名“高被引”的著名学者。
Larry个人资料中使用的头像照片,抱着它的是Reese Richardson的父亲
为了更令人信服,她将Larry在论文里的名字命名为“Larry Richardson”,这个名字听起来就像一名穿着格子呢外套的知识分子。然后,小组成员使用人工智能软件“D”生成了 12 篇论文,把“Larry Richardson ”列为唯一作者。接着,他们生成了另外 12 篇不是由 Larry 撰写的论文,并编辑了每篇论文的 LaTeX 文档,使每篇论文都引用了 Larry 的 12 篇论文。如此一来,12 篇论文每篇被引用 12 次 ,最终获得了144 次引用,h 指数为 12。
接下来,小组成员在学术社交网站“C”上为 Larry创建了个人资料,将论文上传到其个人资料下。值得注意的是,学术社交网站“C”的个人资料任何人都可以创建,通过电子邮件甚至无需验证。对作者身份的验证与审核形同虚设,这是该平台成为论文工厂帮凶的重要漏洞之一。
最后,就是等待学术平台“A”将这些论文抓取并编入索引了——学术平台“A”以将几乎任何内容作为学术论文编入索引而闻名。两周之后,Larry顺利成为学术平台“A”上有史以来被引用次数最多的猫:被引用了 132 次, h 指数是 11。
然而,Larry的“荣耀”仅仅持续了一周时间,学术平台“A”就把它的论文全部删除了,仅仅留下那几个数字诉说着曾经的“辉煌”。更令人遗憾的是,该平台仅仅对这只猫咪采取了“打假”措施,其他虚假论文仍然逍遥法外。
截至 2024 年 7 月 24 日Larry的个人资料
目前,学术平台“A”对此没有做出回应。
学术社交网站“C”相关负责人则表示,并不知道引文工厂在获得索引后删除了内容来掩盖踪迹。感谢科学家反映这一特殊情况,来对系统流程进行调整。
小组成员表示,此举并不是要让猫成为“高被引”的科学家,而是要证明引用指数是可以被人为操纵的。尽管相关学术平台漏洞百出,但目前的评价体系仍然以此指标来考核科学家的业绩与影响力,这是不严谨、不公平的。他们希望以此呼吁学界,以更为公平的方式来评价科学家的工作,至少能把评价体系的“篱笆”扎紧一些!这些虚假的头衔,哈基米Larry根本不在乎,真正的科学家也一样!
1.https://reeserichardson.blog/2024/07/18/engineering-the-worlds-highest-cited-cat-larry/?fbclid=IwZXh0bgNhZW0CMTEAAR3fgNoK34_yh-Nk8fiISK8hrsAlpWX-ilqKGVMVJ0M_EDjxN7eRVqPm3FY_aem_TCi-v05TctyJoGbPIUn7bA
2.https://www.nature.com/articles/d41586-024-01672-7
扩展阅读