中国成了论文造假的重灾区?| 搜信源

学术   教育   2023-09-04 08:00   中国香港  

● 在电脑端免费注册源看板(kanban.souxinyuan.com),订阅4,000多个优质信源的实时更新,打破算法茧房。

● 订阅不同主题的源简报,高效追踪前沿信息。

● 搜信源还提供定制式源简报源倾听源故事等面向企业与机构的信息收集与分析服务。

● 在文末点击“阅读原文”,访问搜信源官网


在“论文工厂”用钱买论文


据财新网8月29日报道,2022年8月底至2023年8月下旬,出版商辛达维(Hindawi)旗下期刊已撤稿约4,500篇主要作者来自中国单位的论文。撤稿论文领域包括生物医学、生物工程、地球科学、计算机科学、神经科学等。


这些被撤稿论文的主要问题有:存在报告对象的范围差异、研究描述差异、数据可用性和研究有差异、以及操纵同行评审等。


如此大规模的撤稿在历史上并不是首次。2015年3月,施普林格·自然集团(Springer Nature)旗下的英国学术出版商BioMed Central撤回了43篇论文,其中大部分来自中国。2017 年 5 月,原由施普林格·自然集团出版的《肿瘤生物学》(Tumor Biology) 宣布有史以来最大规模的撤稿,该期刊上中国作者发表的107篇论文被撤回,其中大部分是由于同行评审造假

● 信源链接:

https://science.caixin.com/2023-08-29/102097756.html

https://www.nature.com/nature-index/news/call-for-tougher-sanctions-in-response-to-growth-in-papers-recalled-for-misconduct


又是一年开学季到来,我们想问:中国的科研学术能力如何?中国的学术造假有多严重?有什么学术打假的办法?

发稿与撤稿数据
● 学术界的全球排名
撤稿观察数据库
学术打假人的分析

撤稿与学术造假
● 1990—2019年中国作者SCI撤稿数量变化特征与领域分布
● 因“论文工厂”撤回论文的特征分布及治理路径

打击“论文工厂”
● 学术界打假机构与工具

发稿与撤稿数据
1中国学术界的全球排名
信源:SCImago期刊与国家排名(SCImago Journal & Country Rank, SJR)
1999-2022各国论文引用量排名

SCImago期刊与国家排名(SCImago Journal & Country Rank,SJR)是一个可公开访问的网络平台,汇集了从全球规模最大的摘要和引文数据库Scopus中提取的期刊和国家科学指标信息。SJR提供全球超过34,100期刊的引用数据,这些期刊来自全球239个国家的5,000多个国际出版商,涉及309个学科。用户可以使用SJR数据库进行期刊和国家的比较分析,也可以对它们进行单独研究。


根据SJR的数据,从论文引用来量看,1996至2022年间,中国有超过900万发表的论文,其中有98.3%的文献为可引文献。中国的文献总引用量超过1.19亿,全球排名第三,仅次于美国和英国。


1999-2022各国论文H指数排名


另外,SJR数据库用“H指数”(H Index)来评估每个国家的科研影响力和贡献程度。这个指数的计算方法是,一个期刊中的论文数量(h)被引用过至少h次的情况。中国的H指数为1210,全球排名第11,前三名分别为美国、英国、德国。


中国在各领域发文数量


SJR还通过可视化图表的方式提供了对每个国家/地区文献发表情况的单独分析。例如,上图展示了中国近年来在工程学材料科学医学领域的发表数量居前的情况。

● 信源链接:

https://www.scimagojr.com/countryrank.php

2.  撤稿数据
信源:撤稿观察数据库(The Retraction Watch Database)
在数据库的国家类别输入“中国”返回的搜索情况,最新的数据为8月31日

撤稿观察(Retraction Watch)是一家非营利性的科学新闻网站,专注于追踪、报道和分析科学论文的撤稿情况。该网站成立于2010年,由科学新闻记者伊万·奥兰斯基(Ivan Oransky)和亚当·马库斯(Adam Marcus)共同创办。

网站下设的“撤稿观察数据库”(The Retraction Watch Database)通过收集来自不同学术期刊和相关机构的公告、通知,以及与学术界专家和编辑的交流,积累了大量有关撤稿事件的数据。这些数据包括被撤稿论文的作者、撤稿时间、撤稿原因、涉及的期刊等详细信息。通过整合这些信息,数据库提供了一个集中的平台,使用户能够方便地查阅和分析撤稿事件的背景和原因。


信源链接:

http://retractiondatabase.org/RetractionSearch.aspx?AspxAutoDetectCookieSupport=1

3. 辛达维(Hindawi)大规模撤稿数据分析

信源:伊丽莎白·比克(Elisabeth Bik)

文章截图


伊丽莎白·比克(Elisabeth Bik)是一位微生物学家和著名的“学术打假人”。她以揭示科研领域中的潜在问题和不当行为而著名,尤其是在科研论文中的图像数据造假检测方面。


2023年8月10日,她在自己创建的博客“诚信科学文摘” (Science Integrity Digest)上发表了一篇文章,分析我们前面引文提到的出版商辛达维(Hindawi)的大规模撤稿情况。


比克指出,从2009到2019年,辛达维每年平均撤回26篇论文,但到了2022年,这一数字激增至351篇,而截至到2023年8月,这一数字更是飙升至3,936篇


2009至2023年8月辛达维的撤稿统计


作者发现,大多数撤稿都源自特刊。“特刊”是期刊发表的常规论文的补充,并非由期刊的正式编辑把关,而是由所谓的“特邀编辑”来管理,因此很多人学术水平与道德标准参差不齐,可能常常使用亲友、论文工厂和人工智能聊天机器人产出的稿件来填充特刊。


比克细致分析了一些被撤稿的论文,发现这些文章粗制滥造。有的论文内容与标题或者期刊主题完全不符;有的甚至都没有耐心把文中标注的模板内容“XXX”删掉。作者推测,这可能是因为论文工厂暂未确定内容以便出售给出价最高的人。


● 信源链接:

https://scienceintegritydigest.com/2023/08/10/hindawis-mass-retraction-of-special-issues-papers/#more-3298


撤稿与学术造假

1. 1990—2019年中国作者SCI撤稿数量变化特征与领域分布
信源:期刊《科技与出版》

论文封面

宋晓林等四位作者于2021年在期刊《科技与出版》上发布了一篇论文,分析1990至2019年间SCI期刊中(世界著名期刊文献检索工具Science Citation Index列出的科学核心期刊)中国作者被撤稿的历史数据变化、涉及研究领域以及撤稿的主要原因。

作者在我们上文介绍的“撤稿观察数据库”中使用“中国”(包括港澳台)作为主要关键词,检索了1990年1月1日至2019年12月31日的数据,共检索出9,070条有效数据。

1990-2019年中国撤稿数量以及SCI发布论文数量


数据总体表明,1990至2019年,中国作者SCI撤稿数量为9,070篇,SCI撤稿率在0.01%~2.49%间,平均撤稿率为0.47%。1991至2003年,中国SCI撤稿数量一直相对较低;自2007年开始,撤稿数量急剧增加,在2010至2011年达到峰值;2012—2019年,中国撤稿数量较为稳定。

具体来看,2000至2006年期间,最主要的撤稿原因是“作者未回应”,占总撤稿数的38%至55%。然而,在2007年之后,“撤稿原因信息不足或未做解释”以及“篡改数据”成为撤稿的主要原因,分别占35%至43%和17%至21%。此外,还有“第三方机构指控”成为最主要的撤稿原因,在2001年至2020年期间占了7%至21%。

会议论文是撤稿论文数量分布的重灾区,排名前20的撤稿会议论文合计达到4,288篇大约占据被撤稿总数的50%。作者指出,这一现象可能主要由以下两个原因导致:一是许多高校、医院和研究机构制定了与论文产出相关的考核标准。比如,一些高校要求教职工每年必须完成一定数量的SCI和EI(工程索引)论文,并将这一要求与职称晋升、薪资待遇、福利待遇以及个人荣誉等挂钩。因此,发表SCI和EI论文成为了一项刚性需求。其次,会议论文通常被认为更容易发表,其中一些会议甚至不用进行同行评审。为了吸引更多参会者,这些会议通常会宣称会议是“包检索”的——虽然如此,但是这些会议或期刊通常具有极低的影响因子,位于SCI和EI检索的边缘地带。它们真正目的并非促进国内外学术交流,而是以收取高昂的会议费为目标。

作者指出,大量的撤稿不仅造成我国学术声誉受损,而且也造成了科研经费浪费。如果按照撤稿论文中相关收费标准为1, 500美元/篇(按照公共科学图书馆PLOS One收费标准),9,070篇撤稿论文中涉及的版面费约为人民币9,500万元(假定所有撤稿均收费)。注意:这仅为出版商收费,而不是论文工厂炮制假论文的收费。

● 信源链接:

http://kjycb.tsinghuajournals.com/article/2021/1005-0590/113209G3-2021-4-131.shtml

2. 因“论文工厂”撤回论文的特征分布及治理路径
信源:中国科技期刊研究

论文截图

作者王景周于2021年12月在《中国科技期刊研究》上发表论文,分析“论文工厂”发表的论文的时间分布、来源期刊、作者及机构的合作关系、撤回原因,以及学科分布等情况。

作者解释,“论文工厂”(paper mill)是指一些非法组织,通过生产、销售、加工科学论文以谋取利润。为了满足订单的数量和快速发表的需求,它们通常采用剽窃、伪造数据、抄袭、重复使用图表数据等违反学术诚信的手段。

为了研究这个问题,作者使用“撤稿观察数据库”和Web of Science数据库中被标注为“paper mill”的526篇论文进行了分析。

被打上“论文工厂“标签论文第一作者的区域及单位分布情况

研究发现,被撤回的526篇“学术工厂“论文的作者主要来自中国的医院,尤其是高校的附属医院。第一作者来自我国的29个省/市171个单位。其中,山东河南吉林三省的撤回论文较多,超过撤回论文总量的一半(51.90%);撤回论文量≥5篇的单位有21个,分布在13个省/市。除济宁市第一人民医院外,论文撤回量较多的全是高校——吉林大学、青岛大学、山东大学、中南大学、郑州大学占总量的32.13%


标注为“论文工厂“的论文来源机构合作时区图

此外,文章还引入了“中心性”这一指标来分析中介的作用。根据作者的数据可视化分析,机构出现的频次越多,节点就越大;节点之间的连线表示其合作关系,线的粗细表示合作强度的大小。中介中心性是指一个结点担任其他两个结点之间最短距离的桥梁的次数。当一个节点在不同机构之间充当“中介”的次数越多,它的中介中心性就越强。


被撤回论文最多的前20个机构及其中心性

作者据此分析,中心性为0的机构说明其论文生产主要来自内部,而中心性强的机构表明它们在跨机构跨地区的合作方面非常活跃,通常在论文工厂销售网络中扮演着重要的枢纽角色。


● 信源链接:

https://www.cjstp.cn/CN/10.11946/cjstp.202109060710


相关信源:

● 教育部:高等学校预防与处理学术不端行为办法

http://www.moe.gov.cn/srcsite/A02/s5911/moe_621/201607/t20160718_272156.html


● 科学技术部:《科研失信行为调查处理规则》

https://www.most.gov.cn/xxgk/xinxifenlei/fdzdgknr/fgzc/gfxwj/gfxwj2022/202209/t20220907_182313.html


打击论文工厂

1. 学术界“打假”机构与工具
信源:科学、技术和医学出版商协会(STM)
网站截图

STM是受荷兰法律约束的一家非营利性组织,致力于支持140多家会员单位在全球范围内推进可信研究。会员单位遍布全球20多个国家,主要由学术和专业出版商、学术团体、大学出版社、初创企业和老牌企业构成。中国也是STM的一个地区分支。

STM正在积极领导一个名为 "诚信中心(Integrity Hub)" 的项目,以应对学术造假问题。9月1日,STM诚信中心宣布与Clear Skies合作,将整合双方的技术工具,进一步增强STM检测欺诈性稿件的能力。

Clear Skies 的“论文工厂警报”工具(Clear Skies Papermill Alarm)是一个提供简单红绿灯评级系统的工具,用于评估论文的可信度。红色警报表示与已知的论文工厂产品内容高度相似;橙色警报表示中度相似;绿色警报表示与此类内容没有相似之处。Clear Skies 提供面向机构的数据接口服务,以及面向公众的云工具服务。

● 信源链接:

https://www.stm-assoc.org/stm-integrity-hub-incorporates-clear-skies-papermill-alarm-screening-tool/

● Clear Skies Papermill Alarm:
https://clear-skies.co.uk/


想为您的机构量身定制一份收集前沿信息的自动简报吗?欢迎了解搜信源的企业服务“定制式源简报”,并预约演示👇。



探索更多搜信源提供的个人产品与服务👇


免费订阅搜信源邮件推送,让您不再因平台算法而错过优质内容,扫描下图二维码即可订阅👇




想与搜信源合作吗?欢迎了解“信息营养师招募计划”👇。



👇关注搜信源👇


往期文章

AI同时带来机会与焦虑,企业、政府、普通人可能都需要这份《不焦虑AI日报》| 搜信源

继续审视福岛核废水,不轻视严重性,也不要“一边倒”式报道 | 搜信源

从今天起,福岛核废水要排放30年,到底会对我们产生怎样的影响?| 搜信源





END


搜信源公众号每星期一更新,旨在围绕当周中国与世界的新闻热点,为您搜集并推介大量优质的一手信源与数据,帮助您探究新闻背后的故事。如果您愿意分享您知道的优质信源,欢迎给我们留言。

如果搜信源的内容帮助到了您的新闻报道、研究或论文,还希望您能在发布作品中合适的位置给予搜信源一定的肯定。参考模板:【“搜信源”对本文资料搜集/选题/某数据来源/事实核查亦有贡献】。

搜信源
「搜信源」是中国领先的开源情报定制专家,帮助客户与用户实现自动化信息收集与洞察发现,基于优质信息,做出明智决策,取得竞争优势。
 最新文章