AI撰写论文：科学界的隐忧

学术 2024-10-11 16:47 江苏

编者注：

科学发现是人类最复杂的活动之一，包括掌握现有知识、填补研究空白、设计实验、分析结果和解读数据。Sakana AI实验室最近宣布他们开发了一种“AI科学家”，据称能够全自动进行科学研究。该系统利用生成式大语言模型（LLM）来进行头脑风暴、设计算法、绘制图表、撰写论文，并且成本低廉。这些主张相当大胆，但它们真能实现吗？

图片来源：Wes Cockx & Google DeepMind

计算机如何“研究科学”

很多科学研究是在通过分析公共数据库内容进行的，成千上万的科学论文可以在arXiv和PubMed等存储库中免费获得。使用在这些存储库中的数据进行训练的LLM捕捉了科学的语言及其模式。因此，生成式LLM能够生成貌似优质科学论文的内容，也许这并不令人惊讶——考虑到它已经吸收了许多可以模仿的范例。然而，尚不清楚的是，AI系统能否生成一篇有吸引力的科学论文。最关键的是，优秀的科学研究需要创新性。

AI论文真能有吸引力吗？

科学家想要学习新事物，尤其是那些与现有知识显著不同的新事物，这就需要对贡献的范围和价值进行判断。

Sakana系统试图通过两种方式解决“吸引力”问题。首先，它通过在Semantic Scholar存储库中检索现有研究来“评分”新论文的创意。任何过于相似的内容都会被舍弃。其次，Sakana的系统引入了“同行评审”步骤——使用另一种LLM来评估生成论文的质量和创新性。在这方面，openreview.net等网站上有大量的同行评审范例可以作为指导。

AI可能难以评估AI输出的质量

关于Sakana AI的输出，反馈意见不一。有些人认为它在生成“无尽的科学垃圾”。即使由该系统自身对其输出进行评估，也仅将这些论文评估为较为薄弱。随着技术的发展，这一情况可能会有所改善，但自动化科学论文的价值问题依然存在。LLM评估研究质量的能力也是一个未解的问题。

AI工具应帮助科学家而非取代他们

一些专门的搜索工具利用AI来帮助科学家寻找和综合现有工作。这些工具包括前面提到的Semantic Scholar，还有较新的系统如Elicit、Research Rabbit、scite和Consensus。

像PubTator这样的文本挖掘工具更深入地探讨论文，识别重点内容。这对于科学信息的整理和组织尤其有用。机器学习也被用来支持医学证据的综合和分析，比如Robot Reviewer等工具。通过Scholarcy对论文中的论点进行比较和对比的摘要，有助于进行文献综述。所有这些工具的目的都是帮助科学家更有效地开展工作，而不是取代他们。

AI研究可能加剧现有问题

尽管Sakana AI宣称它不认为人类科学家的作用会减弱，但该公司所设想的“完全由AI驱动的科学生态系统” 将对科学领域产生深远的影响。有一个担忧是，如果科学文献中充斥着AI生成的论文，未来的AI系统可能会以这些输出作为训练数据，进而发生模型崩溃。这可能导致它们的创新能力越来越弱。

然而，这对科学的影响远远超出了AI科学系统本身的影响。科学界中已经存在一些不良行为者，包括那些批量生产假论文的“论文工厂”。当一篇科学论文可以通过15美元和一个模糊的初始提示来生成时，这个问题只会变得更加严重。

在一个AI系统在其中扮演关键角色的科学生态系统中，引发了对科学过程意义和价值的根本性质疑，同时也对我们对AI科学家应持有何种程度的信任提出了问题。这种科学生态系统是我们所希望的吗？

AI撰写论文存在不少的局限性。它在处理较长对话时可能无法保持完全的一致性和连贯性，不具备独创性和创造性。不能替代专业领域人士的意见和建议，无法保证绝对的隐私和数据安全。就目前而言，母语润色编辑质量和准确性高，仍是帮助您论文发表的最佳方式。

最后，给不放弃的朋友们点赞，祝大家的文章都能顺利发表！

参考文献：

https://theconversation.com/a-new-ai-scientist-can-write-science-papers-without-any-human-input-heres-why-thats-a-problem-237029

翻译整理：Wendy

http://mp.weixin.qq.com/s?__biz=MzI3NDAwMTI1Nw==&mid=2650381387&idx=1&sn=ef57ba552a148369f4e001eb5e986be7

国际科学编辑

国际科学编辑（International Science Editing）中国分公司。

最新文章

投稿时需要附上CRediT Author Statement，怎么写？

中科院1区STOTEN被on hold，环境期刊大溃败

eLife被科睿唯安On hold！ eLife硬刚回应

AI撰写论文：科学界的隐忧

论文润色85折活动延续

目前被劫持的Scopus期刊

中国内地高校在2025年泰晤士高等教育世界大学排名中向世界前十名迈进

ChatGPT真的可靠吗？

SCI论文润色85折起！

知名医科大学更新预警期刊黑名单！

Acta Materia Medica 2024年第一期论文赏鉴完整版

双一流高校博士研究生奖助学金汇总

SCI论文开学季折扣，论文润色85折起！

研究信息图服务，专为《Research》杂志读者打造

2024国自然资助项目汇总！

影响因子4.5，被SCIE剔除！

明晚直播 | 诚邀您参加！

支持LateX格式论文润色，助您学术论文精致完美！

多消息传出！2024年国自然或在8月22号放榜，面上资助率或为11.19%

PLOS新期刊与ScienceOpen达成合作，通过ScienceOpen平台推广内容

AMM青年论坛第31期 | 明晚直播

“三无土博”毕业求职记……

暑期回馈，论文润色八五折起，另送消暑小风扇一个！

注意！IF 18.8，顶级期刊投稿网址被仿冒！

这本期刊第三届青年编委会招募

突发，中科院一区Top期刊正在被出版商调查

Wiley推出全新期刊系列，助力作者更好更快发表

四大水刊《PLoS One》升一区了

暑假双重福利来袭，你还在花钱做SCI论文查重？

这本ESCI期刊新一届青年编委招募

暑假双重福利来袭，你还在花钱做SCI论文查重？

收到审稿意见后，应如何回复评审报告？

4本期刊，被WoS剔除！

【周五直播】AMM青年论坛第二十六期

我们是这样使用Latex的

研究信息图服务，专为《Research》杂志读者打造

注意！又有4本期刊被WOS剔除！

推荐有礼，暂无稿件的朋友也可领取福袋 !

AMM青年论坛第25期 | 诚邀您参加！

2024同行评审周主题揭晓：同行评审中的创新与技术

最新影响因子（2023JCR）今天正式发布！

推荐有礼，暂无稿件的朋友也可领取福袋 !

AMM青年论坛第24期 | 明晚20点

使用预警名单的伦理考量

论文的整体结构：文前部分、主文部分和文尾部分

国自然重磅项目，首次为55周岁以下青年科研人员专设“赛道”！

推荐有礼，暂无稿件的朋友也可领取福袋 !

国家队出场是审查撤稿和科研不端行为的解决方案吗？

Acta Materia Medica (AMM) 杂志创刊两周年暨第二届"我药发现"国际创新药物研发高峰论坛会议通知

预存款活动开启，满额送京东卡！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉