首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

突发！OpenAI七年元老、安全副总裁Lilian Weng官宣离职！北大本科，决定专心写博客

文摘 2024-11-09 17:59 江苏

新智元报道

日前，OpenAI安全研究副总裁Lilian Weng发出长信，官宣离职！Lilian Weng表示，自己终于有时间写更多博客了。

离职信全文：我有时间写博客了

亲爱的朋友们，我做出了一个极其艰难的决定，那就是离开OpenAI。11月15日将是我在办公室的最后一天。

OpenAI是我作为科学家和领导者成长的地方，我将永远珍惜与每一位共事过和结识的同事在一起的时光。OpenAI团队一直是我的知己、良师益友，也是我个人身份的重要组成部分。

我依然清晰地记得2017年时，我对OpenAI的使命是多么着迷。那时，我们这群人梦想着一个看似不可能、宛如科幻的未来。

开始，我在这里研究的是全栈机器人挑战——从深度强化学习算法，到感知，再到固件——目标是教会单只机械手如何解开魔方。整个团队花了整整两年时间，但我们最终成功了。

当OpenAI进入GPT范式，我们开始探索如何将最佳AI模型部署到现实世界时，我建立了第一个「应用研究团队」（Applied Research team）。团队推出了微调API、嵌入API和审核端点的初始版本，为应用安全工作奠定了基础，并为许多早期API客户提供了创新解决方案。

在GPT-4发布后，我被赋予了一项新的使命：重新思考OpenAI安全系统的愿景，并将工作集中在一个掌控完整安全堆栈的团队之下。这是我做过的最困难、最有压力，同时也是最令人兴奋的事情之一。

如今，安全系统团队拥有80多名出色的科学家、工程师、产品经理和政策专家，我为我们团队取得的一切感到无比自豪。我们共同成为每次重大发布的基石——从GPT-4及其视觉和turbo版本，到GPT商店、语音功能和01。

在训练这些模型既强大又负责任方面的工作上，我们树立了新的行业标准。我特别为我们最新的成就——o1-preview模型感到自豪，它是我们迄今为止最安全的模型，在保持其实用性的同时，表现出对「越狱」攻击的卓越抵抗力。

我们取得的成功，十分令人瞩目：

我们训练模型如何处理敏感或不安全的请求，包括何时拒绝或接受，通过遵循一套明确定义的模型安全行为政策，在安全性和实用性之间取得了良好的平衡。
我们在每次模型发布中都提高了对抗性鲁棒性，包括防御越狱、指令层级，并通过推理能力大大提高了模型的鲁棒性。
我们设计了严格而创新的评估方法，与准备框架保持一致，并为每个前沿模型进行了全面的安全测试和红队测试。我们对透明度的承诺体现在我们详细的模型系统卡中。
我们开发了业界领先的具有多模态能力的审核模型，并免费与公众分享。我们目前在更通用的监控框架和增强的安全推理能力方面的工作将为更多安全工作流程提供支持。
我们为安全数据日志记录、指标、仪表板、主动学习管道、分类器部署、推理时过滤和新型快速响应系统奠定了工程基础。

回顾我们取得的成就，我为安全系统团队的每个成员感到无比自豪，我坚信团队将继续蓬勃发展。我由衷地感谢你们，你们是最棒的！

现在，在OpenAI工作了七年之后，我感觉是时候重新出发，探索新的领域了。OpenAI正处于火箭般的轨道上，我衷心祝愿这里的每个人一切顺利。

PS：我的博客仍然活跃，并将继续更新。我可能很快就有更多时间来更频繁地更新博客，或许还能抽出更多时间来编码。

Lilian Weng：北大本科，高被引学者

Lilian Weng曾是OpenAI安全系统负责人，主要从事机器学习、深度学习等研究。

Weng本科毕业于北京大学信息系统与计算机科学专业，曾前往香港大学进行短期交流，之后在印第安纳大学布鲁明顿（Indiana University Bloomington）分校获得博士学位。

博士期间，Weng的研究领域为复杂系统和网络，关注社交媒体、社交游戏、人机交互和复杂信息网络建模。

打开她的谷歌学术档案，还可以看到Weng曾经发表的关于模因和社交网络的论文。

她曾在eBay、Mozilla等公司做过用户分析方面的实习，之后「转行」成功，进入Facebook和Dropbox从事软件工程和数据科学方面的工作。

2018年起，Weng加入OpenAI担任研究科学家，作为机器人团队的技术主管，专注于训练机器人任务的算法。

2021年，Weng负责领导应用人工智能的研究团队，并在2023年成为了安全团队的负责人。

今年8月，OpenAI将之前的安全团队负责人Aleksander Madry调任至一个专注于推理基础工作的团队。而原来Madry领导的安全团队转由Lilian Weng负责。

随后，Weng将同时管理专注于长期和短期AI安全的团队，这一组织决策令一些研究人员担心，因为长期和短期安全的激励措施可能会相互冲突。

值得一提的是，Weng在个人网站上撰写的博客文章非常受欢迎，基本都是万字长文，既有技术干货又有观点输出，是很多业内人士的参考。

接下来，让我们期待这位北大校友的更多成就，以及即将出现的干货博文吧。

参考资料：

https://x.com/lilianweng/status/1855031273690984623

公益分享、推荐留学/求职/移民行业顶尖资源，做大家留学（移民）路上的避坑神器！已累计帮助5000+家庭走稳留学、移民路~

最新文章

MIT早申放榜，信奥满分世界冠军被录取！这些年，被MIT录取的信竞学子还有谁？

第四届 NOI 女生竞赛获奖名单公布

有幸被照亮，也想成为光！2024家长春晚重装回归，等你来闪耀

重磅！十部门联合发文：留学回国人才纳入国家统一就业政策体系！

重磅！被造假搞怕了！澳门大学暂停内地国际班学生申请

今天三所藤校放榜！哈佛大陆生源零录取

“南方哈佛”埃默里ED1放榜！申请人数创新高，中国学生offer数大幅缩水

0新生! 多伦多华人私校面临关门！

最新研究：导师这两类行为对学生心理健康伤害最大

刚刚交钱，我的留学中介就跑了……

当街枪杀巨头高管，26岁嫌疑人落网！是藤校精英

保录取翻车！南京一家长花70万找中介上港大，孩子刚读1年被清退！家长：中介私下伪造材料

特朗普：上任第一天废除出生公民权，赴美生子落地公民恐终结

加拿大移民局"下狠手"! 3大新规严查在校留学生! 违者恐面临驱逐! 立即生效!

移民局公告：2025财年H1B签证抽签全部结束，中签率：28%

重大利好！Amazon宣布25年重启PERM，留学生有望拿到绿卡……

为什么都在卷港校？看看香港八大高校毕业生薪资就懂了！

入了藤校，应试教育的弊端一览无余?！

注意！美签系统大改革！将于2024年12月7日全面升级！

“游”进耶鲁！北京一男生获得耶鲁提前录取！

美国教授痛心：UC伯克利GPA 4.0计算机本科生，毕业即失业？

94岁巴菲特安排后事：捐赠股份，只留0.5%给三个孩子（巨富的父母们需要给孩子们留下一笔【合适】的钱）

深度 | 经济学人：亚洲中产的困境……

炸了！加拿大查获10,000份伪造录取通知书，80%是印度留学生

黄仁勋港科大全程高能！与梁朝伟共同获得荣誉博士学位

又暴雷！澳洲学院文凭及证书恐作废，超7000名学生被调查

霸气！MIT最新官宣：家庭收入低于20万美元，学费全免！

有被震惊到：中国留美学生贡献150亿！《美国门户开放报告》Open Doors发布了！

13位华人学生入选！星河湾、人大附、北实验3名国内学生上榜

赌王之子何猷君满绩毕业爆上热搜后，MIT被“嘲”了个彻底…

据说，南外家长会上的ppt被疯传……

不再有华盛顿精英告诉父母如何养育孩子！川普提名高中生做教育部长，让精英教育转向平民教育？

恢复标化后，耶鲁早申暴跌？国际申请人减少30%！

有"内幕"？UC招生官曝光25万份申请审查真相，不符合最低要求也能被"破格录取"？！

谷歌2024博士奖学金公布，KAN作者刘子鸣等数十位年轻华人博士生入选

25Fall也太难了！港中文商学院会计专业停止招生？！

突发！康奈尔大学警告国际学生明年1月后不要做这些事！

注意！62名深圳培训班“自修生”报考香港DSE被拒

全面收紧！加拿大突然关闭学签申请通道SDS！影对中国留学生意味着什么？

洛杉矶表态“反川”！推新法加强庇护无证移民，加州大学还安全吗？

祝贺！丘成桐中学科学奖总决赛名单揭晓：南京这些学生入围！

美国公民无证配偶“就地假释”政策被否决，不太可能再重启…

突发！OpenAI七年元老、安全副总裁Lilian Weng官宣离职！北大本科，决定专心写博客

川普重返白宫第一天计划：大学生顺利毕业就“自动”获绿卡？

川普“回宫”！留学未来四年祸福难料，爬藤工签难如登天？

别踩坑！教育部：对13所国外院校学历学位认证加强审查

特朗普宣布胜选！马斯克发射火箭庆祝？留学生的“劫”来了……

从上外附中走出的90后上海女生，成美国数学大奖首位女性华人得主！

决战在即！哈里斯喊话全美华人！她有胜算吗？

马斯克的儿子将入读“北美小衡水”？

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉