全球首个AI科学家诞生！论文写稿与审稿一起拿下，实现全自动开放式科学发现

科技 2024-08-16 17:49 北京

来源| AI寒武纪

日本Sakana AI 公司推出 AI 科学家：首个全自动端到端科学论文生成系统

Sakana AI 发布的 AI 科学家系统，实现了机器学习领域首个全自动化的科研论文生成流程。该系统并非仅仅辅助科研的工具，而是能够自主进行构思、实验、分析、撰写，最终输出完整论文的 AI 代理，标志着 AI 驱动科研进入全新阶段

paper：https://arxiv.org/pdf/2408.06292

github：https://github.com/SakanaAI/AI-Scientist

核心创新:

端到端自动化：AI 科学家首次实现了机器学习研究全流程自动化，涵盖从想法生成到论文撰写的各个环节，突破了以往自动化科研系统仅专注于局部环节的局限。

开放式探索：系统借鉴进化计算和开放式研究的思想，能够迭代地生成和筛选研究想法，而非局限于预定义的搜索空间，从而实现更广泛的探索和发现。

可解释性：AI 科学家生成的代码、实验结果、可视化图表和论文文本，都为人类研究者提供了理解其科研过程和结果的途径，促进了人机协同和知识共享。

关键技术:

LLM 驱动：AI 科学家的核心是强大的 LLM，例如 Claude 和 GPT-40，它们不仅负责生成研究想法和论文文本，还驱动着实验设计、代码编写和结果分析等环节。

代码辅助工具 Aider：Aider 是一个基于 LLM 的代码辅助工具，能够理解 AI 科学家的指令，自动修改代码、执行实验、记录结果，并生成可视化图表。

自动审稿系统：为了评估论文质量，Sakana AI 开发了基于 GPT-40 的自动审稿系统，该系统能够模拟人类审稿人的行为，对生成的论文进行评估和反馈。

实证结果：

低成本、高效率：AI 科学家能够在一周内生成数百篇中等质量的论文，每篇论文的成本仅为 10-15 美元，极大地提高了科研效率并降低了成本。

接近人类水平的审稿：自动审稿系统在 ICLR 2022 论文数据集上的准确率达到 70%，F1 得分甚至超过人类审稿人，表明其具备了较高的评估能力。

原创性贡献：AI 科学家已经在扩散模型、语言建模和顿悟学习等领域生成了10篇具有原创性贡献的论文，例如 “Adaptive Dual-Scale Denoising for Dynamic Feature Balancing in Low-Dimensional Diffusion Models”

技术细节:

想法生成：AI 科学家利用 LLM 迭代地生成想法，并使用 Semantic Scholar API 过滤掉与现有文献过于相似的内容。AI 系统首先会“头脑风暴”，生成一系列新颖的研究方向。它从进化计算和开放式研究中汲取灵感，利用 LLM 作为“变异算子”，迭代地扩展想法库。每个想法都包含描述、实验执行计划和（自我评估的）趣味性、新颖性和可行性得分

实验迭代:Aider 能够自动执行实验，并在遇到错误或超时时进行代码修复和重试，确保实验的稳健性。AI 系统利用先进的代码辅助工具 Aider，将想法转化为代码，并在现有代码库中进行修改，然后自动执行实验并收集结果。Aider 还会以实验日志的形式记录实验过程和结果

论文撰写：AI 科学家遵循标准的机器学习会议论文格式，并使用 LaTeX 进行排版，同时确保论文内容基于真实的实验结果和参考文献。

自动审稿：审稿系统采用 NeurIPS 会议的评审指南，并结合了 self-reflection、few-shot learning 和 response ensembling 等技术，提高了审稿的准确性和可靠性。

这一波是否利好焦头烂额的研究生？评论区说出你的看法😄😄

http://mp.weixin.qq.com/s?__biz=MzkyMDU5OTAyNg==&mid=2247489881&idx=2&sn=0ae9e2429fe9a996f9a1fed3b46d8bad

智见AGI

围绕生成式AI技术的交流社区，与开发者和合作伙伴共同探究有深度的生成式AI技术前沿洞见、技术迭代、案例解析、方法和实践，助力企业的数字化转型

最新文章

中美之外，谁还能在AI竞争中占领制高点？迪拜与新加坡的契机

Blackwell与FP4精度：AI量化浪潮中推动端侧发展的“双子星”

OpenAI：AGI共5层，我们现在在第2层

吴恩达：《State of AI report》展现2024的主要趋势和突破（二）

OpenAI 推出了 Canvas 和 SearchGPT

英伟达 GPU 架构：演进与模型推理速度的深度关联

吴恩达：《State of AI report》展现2024的主要趋势和突破（一）

模型剪枝，如何把模型的使用成本降下来？

AI Agent智能数字员工解决案例

MemoRAG：重新定义长期记忆的AI问答模型

从Pre-training Scaling Law到Inference Scaling Law：OpenAI O1模型引领新范式

探秘AIPC软件：云端和本地如何奏响混合乐章

RAG测评关键指标

字节版Sora火爆24小时，同名论文再次被热议

李沐：如果有什么事这一辈子总要试下的，就趁早

曝英特尔被抢投50亿美元！高通求购关口，老伙计火线救场

黑神话热潮，能引发GPU狂欢的才是杀手级应用

o1核心作者MIT演讲：激励AI自我学习，比试图教会AI每一项任务更重要

数据先行 -- Scale AI如何通过AI数据服务成为独角兽

OpenAI重金押注，机器人NEO世界模型登场！机器人迎来ChatGPT时刻？

解析 Llama-Factory：从微调到推理的架构

OpenAI o1模型问世，五级AGI再突破！推理极限超博士，清北复旦华人立功

RAG领域出现技术创新，或将引领AI搜索重大变革？

OpenAI神秘模型「草莓」两周内上线？数学推理暴涨，月收费200刀已有人付费

使用 LlamaIndex 进行 CRAG 开发用来强化检索增强生成

苹果华为新机同日上市，靠谱剧透都在这里了

LLM如何结合知识图谱进行RAG

Windows率先本地文生图，互联iPhone秒传图片，最新AI PC来了！

Blackwell视角揭秘：生成式AI挑战如何重塑GPU芯片的未来版图

大厂不想你有 AI 女友

商汤SenseNova 5.5大模型的应用实践

又有AI创始人卖身大厂！带走25%员工留下空壳，为吴恩达第一位博士生

AI驱动的智能运维：行业案例与挑战解析

超越GPT-4o！阿里发布最强开源多模态模型Qwen2-VL，支持实时视频对话

给RAG开药方：亚马逊发布RAGChecker，专治AI回答不准

GPT-5降临，代号猎户座？OpenAI疑用草莓训练，数学推理暴涨超越所有模型

为什么AI PC需要NPU？

Transformer作者预警：只卖模型玩不过OpenAI！

大模型时代，传统程序员还需要写代码吗？

谷歌搜索引擎全面揭秘！近百份文档泄露，博主爆肝数周逆向工程

AI模型“减肥”风潮：量化究竟带来了什么？

比红杉还猛！7个月投资8家AI公司，智谱为什么投得这么凶？

100%结构化输出——OpenAI新功能大幅增强工具调用

ChatGPT成8岁娃「导师」，外国家长们慌了！

AI模型训练中的双剑侠dd：GPU和CPU的分工

全球首个AI科学家诞生！论文写稿与审稿一起拿下，实现全自动开放式科学发现

Relevance AI：打造一个AI智能体营销团队

谷歌版Her抢跑！一键召唤Gemini，全球52亿终端被颠覆

以小搏大：Salesforce 十亿参数模型表现超过ChatGPT

AI搜索向左，搜索 OG 向右

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

全球首个AI科学家诞生！ 论文写稿与审稿一起拿下，实现全自动开放式科学发现

全球首个AI科学家诞生！论文写稿与审稿一起拿下，实现全自动开放式科学发现