又一OpenAI研究员离职！不相信OpenAI能造福世界，AGI使命无比困难

文摘 2024-11-14 19:57 山西

就在刚刚，OpenAI治理研究员Richard Ngo宣布离职。

在OpenAI从事人工智能预测和治理工作三年后，我刚刚在Slack上发布了这条离职的消息。

内容并没有什么特别惊讶的地方，但你应该比大多数类似的消息更字面地理解它——我尽量只说了我直白相信的事情。

Ngo表示，他对过去一年里发生的事件有很多未解的问题，这使得他更难相信自己的工作能在长期内造福世界。他逐渐意识到，想要实现OpenAI的使命——让AGI良好发展，是多么困难。

Ngo自2021年起加入OpenAI，之前曾在Google DeepMind担任AI安全研究员。

近来，OpenAI中专注于AI安全的员工接连出走，Ngo是最新的一位。

OpenAI研究科学家、德扑之父Noam Brown送上了祝福。

前OpenAI员工（今年8月离职）回忆道，自己是通过Ngo「AGI安全基础」课程才接触到AI安全的，并祝他未来一切顺利。

离职信全文

大家好，我决定离开OpenAI（生效日期为星期五）。

在过去的三年里，我一直在Miles的领导下工作，因此在他离开之后，很自然，我似乎也该离开了。没有一个单一的主要因素促使我做出这个决定。

对于过去一年发生的事情，我依然有很多未解的问题，这让我更难以相信我的工作能长期为世界带来正面影响。我也一直感觉自己更倾向于公开地进行更多的迭代，并与更多合作者一起探讨多种研究方向。

接下来的几个月里，我打算主要进行独立研究，内容包括AI治理和理论性AI对齐问题的结合，然后再看看未来的方向如何。

尽管经历了许多波折，我真的很享受在OpenAI的时光。我有机会参与许多令人着迷的议题，包括预测、威胁建模、模型规格和AI治理，并与一群不断创造历史的、卓越的人一起工作。

当我面对那些新加入公司的成员时，我很难向他们传递OpenAI最初的雄心壮志：设定了让AGI良好发展的使命。

虽然「发展AGI」这一部分的任务似乎已在正确轨道上，我（和其他人）却逐渐意识到，想要对「良好发展」这一部分的任务作出积极贡献，远比预期的要困难得多，特别是需要预防它对人类生存的威胁。

部分是因为预测未来本身就很困难，同时由于AGI前景的巨大规模，容易放大人们的偏见、合理化和部落主义倾向（包括我自己）。

PS：

合理化（rationalization）是心理学和行为经济学中的一个概念，指的是人们在面对自己无法接受的行为、想法或决定时，通过给自己提供看似合理或合情的解释来减轻内心的不适感或认知失调。简单来说，合理化是一种防御机制，人们会为自己的不理性行为或决策找到合适的理由，以便自己能够接受或不感到内疚。这种心理机制帮助人们减轻认知冲突，但也可能导致不诚实或不理性的行为得以持续。

部落主义（tribalism）是一种社会现象，指的是人们对某个特定群体的强烈认同感和忠诚感，并因此对其他群体或文化产生排斥、敌视或竞争的态度。部落主义不仅限于传统的部落或民族，还可以表现在各种现代社会群体中，如政治派别、宗教信仰、公司文化、体育队伍支持者等。

无论好坏，我预计风险将会继续加大，因此我希望你们都能以正直、深思熟虑的态度，以及清晰的判断，来应对你们（以及OpenAI）在这些风险中的角色，明确何时以及如何做出的决定才能真正服务于我们的使命。

长期深耕AI安全

继许多专注于AI安全的员工离职OpenAI后，Richard Ngo的离职特别具有象征意义。

要知道，他是AI安全社区中一个有影响力的声音，自2018年以来一直致力于AI安全研究——而ChatGPT是在2022年底才开始风靡全球。

他是论文《The Alignment Problem from a Deep Learning Perspective》的共同作者，该论文已在ICLR上发表。

论文地址：https://arxiv.org/abs/2209.00626

他还收集了很多网络上的学习资料，编成了一系列「AI Alignment」的课程。

课程地址：https://course.aisafetyfundamentals.com/alignment

Ngo还是一个非常具有人文气息的科技从业者。这也不难解释他对OpenAI初心的坚守，以及对AI安全未来的担忧。

他在剑桥大学获得了机器学习哲学的哲学博士学位（2020–2021），并在同校获得了计算机科学的哲学硕士学位（2017–2018）。此外，他还在牛津大学获得了计算机科学与哲学的文学学士学位（2014–2017）。

他还在博客里撰写「AI Autofiction」（AI自传小说），在其中描述了从未来AI的角度来看世界可能是什么样子。

博客地址：https://www.narrativeark.xyz/t/ai-autofiction

AI安全员工出走潮

近来，许多专注于AI安全的员工都先后离职OpenAI。

OpenAI七年元老、安全副总裁Lilian Weng，于上周宣布离职。

OpenAI六年元老、研究主管Miles Brundage，同时也是Ngo的上司，于上个月离职。

再往前追溯，今年早些时候，OpenAI的超级对齐共同负责人Ilya Sutskever和Jan Leike也离开了公司。

Leike曾表示，「OpenAI的安全文化和流程已被耀眼的产品所取代」。

许多其他专注于安全的员工，包括William Saunders、Leopold Aschenbrenner、Pavel Izmailov、Collin Burns、Carroll Wainwright、Ryan Lowe、Daniel Kokotajlo和Cullen O’Keefe等，也都相继离职。

参考资料：

https://x.com/RichardMCNgo/status/1856843040427839804

https://www.transformernews.ai/p/richard-ngo-openai-resign-safety

想要了解更多资讯，请扫描下方二维码，关注机器学习研究会

转自：新智元

http://mp.weixin.qq.com/s?__biz=MzU1NTUxNTM0Mg==&mid=2247576120&idx=2&sn=eb2f503dedf385138bccf22e832e5190

机器学习研究组订阅

机器学习研究会由百度七剑客雷鸣先生创办，旨在推动AI的技术发展和产业落地。参与组织北大、清华”AI前沿与产业趋势“公开课，广泛的和高校、企业、创业、VC开展合作，自身也参与优秀AI项目的投资和孵化。

最新文章

OpenAI「23个黑手党」出走创业，融资近百亿！华人科学家约占1/3

10种数据预处理中的数据泄露模式解析:识别与避免策略

「谍战」开启！基建狂魔马斯克122天交付10万卡超算，对手大恐慌派间谍飞机侦查

14天速成LLM高手！大佬开源学习笔记，GitHub狂揽700星

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

过程奖励模型PRM成版本答案！谷歌DeepMind全自动标注逐步骤奖励PAV，准确率提升8%

Github上的十大RAG(信息检索增强生成)框架

斯坦福伯克利重磅发现DNA Scaling Law，Evo荣登Science封面！AI设计DNA/RNA/蛋白质再突破

ChatGPT深夜两弹更新！macOS版联动三款IDE无缝编程，Windows版全量上线

RAPTOR：多模型融合+层次结构 = 检索性能提升20%，结果还更稳健

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉模型进入上下文时代

又一OpenAI研究员离职！不相信OpenAI能造福世界，AGI使命无比困难

LLM4Rec最新重磅工作：字节跳动序列推荐分层大模型HLLM

OpenAI总裁出走3月终于归来！Greg结束「最长假期」专注重大技术挑战，每周狂肝100小时代码

Transformer打破三十年数学猜想！Meta研究者用AI给出反例，算法杀手攻克数学难题

FoundTS：首个覆盖多场景的时序预测基础模型评测基准

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

AlphaFold3重磅开源，诺奖级AI颠覆世界！GitHub斩获1.8k星，本地即可部署

扩散模型失宠？端侧非自回归图像生成基础模型Meissonic登场，超越SDXL！

Scaling Law撞墙，AI圈炸锅了！OpenAI旗舰Orion被曝遭遇瓶颈，大改技术路线

陶哲轩联手60多位数学家出题，世界顶尖模型通过率仅2%！专家级数学基准，让AI再苦战数年

三种Transformer模型中的注意力机制介绍及Pytorch实现：从自注意力到因果自注意力

奥特曼专访自曝OpenAI掌握AGI密钥，2025年降临！1人1万块GPU缔造十亿独角兽

哈佛推出全新类ChatGPT癌症诊断AI，登上Nature！准确率高达96%

基于图论的时间序列数据平稳性与连通性分析：利用图形、数学和 Python 揭示时间序列数据中的隐藏模式

无人车大战打响！美国萝卜日爆8000单破纪录，中美对决已到关键转折点

川普赢了，AI圈炸了！英伟达市值突破3.6万亿， OpenAI研究员：他或将见证AGI诞生

失业小哥在父母卧室做AI应用，日入2万刀！晒账单爆火全网，AI初创价值3500万

特朗普回归，美国AI解禁！马斯克变身全球首富，硅谷科技圈颠覆在即

软体机器人领域顶尖学者齐聚清华！第九届软体机器人大会将于11月15—17日在清华举行

从今天起，ChatGPT入口就是chat.com！

「黑神话」级3A大作AI实时游戏生成！港科大、中科大等祭出最强扩散Transformer，火爆国外

英伟达3.4万亿市值稳坐全球第一！苹果12年霸主地位终结

图结构赋能语言模型：华为诺亚MILA联合提出基于图的可控数据合成提升大语言模型长逻辑链推理能力

震撼预警：满血版o1倒计时！奥特曼完整专访流出：o系列疯狂迭代，马上起飞

AI圈卷疯了！xAI、Anthropic同日上线API：Grok免费公测，Claude 3.5 Haiku价格暴涨

AGENTiGraph：一个交互式知识图谱平台驱动的基于私有数据多智能体系统 - 东京&耶鲁大学等最新研究

UCLA、MIT数学家推翻39年经典数学猜想！AI证明卡在99.99%，人类最终证伪

谷歌员工集体打脸劈柴，25%新代码AI生成夸大事实！Linux之父怒斥90%都是营销

【NeurIPS2024】用于时间序列预测的检索增强扩散模型

世界首个1000亿AI智能体文明诞生！北大校友打造真实版「西部世界」，技术细节全公开

o1图像理解神秘现身，网友疯狂测试！Altman自曝：o2研究生级水平破105%

斯坦福&哈佛医学院 - MMedAgent，一个用于医疗领域的多模态医疗AI智能体

谷歌Agent首次发现真实世界代码漏洞！抢救全球数亿设备，或挽回数十亿美元损失？

全球首款AI游戏诞生！无需游戏引擎，视频模型直出「我的世界」

时序异常检测新进展！华为诺亚方舟实验室&华东师大提出首个时序异常检测通用模型

吞吐量最高飙升20倍！豆包大模型团队开源RLHF框架，破解强化学习训练部署难题

打破RLHF瓶颈，克服奖励欺骗！Meta发布全新后训练方式CGPO，编程水平直升5%

KDD 2024 | 数据驱动的分布偏移检测与自适应

苹果地表最强AI PC诞生，M4 Max猛兽加持性能暴涨！顶配6万，续航飙至24小时

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉