首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

Ilya Sutskever：预训练已到瓶颈！

旅行 2024-11-13 07:30 北京

扩大训练规模已经失效了！

OpenAI 联合创始人、AI 领域权威 Ilya Sutskever 在接受路透社采访时表示：预训练（Pre-training）已经遇到瓶颈。

这个消息可算是Ilya 加持的一颗重磅炸弹啊。

要知道，预训练——通过海量无标注数据来训练模型理解语言模式和结构的方法，可是 ChatGPT 成功的关键所在啊！

Sutskever 可并非胡说八道。

作为预训练Scaling Law 的早期倡导者，他的观点值得重视。他表示：

「2010 年代是扩大规模的时代，但现在我们重新回到了探索和发现的时代。所有人都在寻找下一个突破点。」

新方向：测试时计算

既然预训练遇到瓶颈，那下一步该怎么办？

研究人员们已经找到了新的方向：测试时计算（Test-time compute）。

这是什么概念？

简单来说，就是让模型在使用过程中（也就是推理阶段）自己评估多个解决方案，然后选择最优答案。

OpenAI 的 Noam Brown 透露了一个惊人的数据：这种方法带来的性能提升，相当于把模型规模扩大 10 万倍！

硬件市场要变天？

这个转变不仅仅影响 AI 模型的发展方向，还可能颠覆整个 AI 硬件市场。

为什么呢？

因为未来可能需要：

更少的训练环节
更多的推理过程

这意味着市场对专门用于推理的芯片需求会大增。英伟达等公司恐怕得重新考虑他们的市场策略了。

投资界已经嗅到了这个变化。红杉资本（Sequoia Capital）等机构正在调整他们的投资方向。

推理能力才是王道？

Sutskever 现在已经离开 OpenAI，创立了 Safe Superintelligence（SSI）。

虽然他没有透露具体细节，但表示他的团队正在研究一种替代预训练Scaling Law 的新方法。

他强调：「现在比以往任何时候都更重要的是，要找到正确的扩展方向。」

看来，未来的 AI 发展将更注重提升模型的推理能力。通过类似思维链（CoT）这样的方法，让模型具备「思考」的能力，这似乎是目前最有前途的发展方向。

值得注意的是，这并不意味着 AI 发展已经停滞。或许正相反——这代表着我们正在进入一个全新的阶段：

从简单的规模扩张，转向更智能的发展道路。

👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本；
每天挖掘出10+ 热门的/新的 github 开源 AI 项目；
每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

http://mp.weixin.qq.com/s?__biz=MzA4NzgzMjA4MQ==&mid=2453456239&idx=1&sn=af0671f61c03f401b205e4b886ce384a

关注AGI 的沿途风景！

最新文章

最新企业AI报告出炉：OpenAI份额大跌16%，Anthropic正成最大赢家！

Andrej Karpathy谈模型的奇葩命名

重磅！Neuralink加拿大获批，脑机接口临床试验正式启动

AlphaQubit：量子计算错误纠正的未来之光

揭秘：这个GPT 套壳应用是如何做到500万用户的？

吴恩达推出大模型游戏创作课程！

重磅！DeepSeek发布R1 推理模型，硬刚OpenAI o1

地球能养活1000 亿人口吗？

OpenAI 悄悄开启 full-O1 测试！

重磅！ChatGPT开启「眼睛」，实时摄像头对话来了！

印度新闻巨头ANI 怒告OpenAI：你偷我家的菜！

Anthropic发布新研究：为AI评估引入统计误差条！

OpenAI发布学生写作指南，终于教会了学生如何「正确」使用ChatGPT！

EEG脑机接口：用脑子来控制机器人！

马斯克：2026年AGI必到，Optimus替你接送孩子！

Windsurf：Cursor 的最大竞争对手来了！

Perplexity重磅推出购物助手：AI购物新时代来了？

Claude变身「claude酱」，和二次元宅对线开口就是「绝绝子」

重磅！OpenAI o1 或于本周发布，API 推迟至2025年！

200M 模型 SOTA 开源图像细节描述！

李开复的01.ai 用3百万造出GPT-4级对手！

AI奶奶专治电信诈骗：40分钟废话连篇，骗子气到爆粗口！

Grok 3 因证明「黎曼假设」而被暂停训练？！

NEO 重磅问世：第一位「全能」机器学习AI工程师！

MoE「现形记」：训练时按需使用，推理时全员出动？

llms.txt：AI时代的robots.txt！

llama-ocr 登顶Hacker News！

AGI 定义之争：DeepMind vs OpenAI vs Anthropic

走近科学之，17岁高中生的“神级Prompt”

来了！ChatGPT 推出桌面级编程助手！

Anthropic推出Claude 智能改进器，「一键优化」你的AI提示词！

谍战！OpenAI 派飞机侦查马斯克xAI 超算中心

重磅！OpenAI「Operator」明年一月发布！

LeCun被指剽窃！Marcus怒斥：我要告你！

重磅！马斯克或将影响特朗普新政府的AI监管政策

Hinton：别学AI，去当水管工吧！

软体机器人的「超级肌肉」来了：力举千倍重物，柔软如肌肤

Ilya Sutskever：预训练已到瓶颈！

Sam Altman的Worldcoin：用眼睛换币，84%人亏损！

重磅！OpenAI前CTO Murati新团队初具规模！挖角OpenAI成功？

独家解密！Lex Fridman与Anthropic CEO 5小时长谈：Claude 4.0、AGI 2026年或将到来！

再见GPT！你好，「o」！

重磅！AlphaFold 3 终于开源了！

AGI 何时到来？Sam Altman、Dario Amodei、Geoffrey Hinton、Yann LeCun 的时间表

MobA：让AI 真正学会使用手机！

大模型进入瓶颈期，Gary Marcus：我赢了！

OpenAI 新模型Orion 或难产！

Sora 两周内发布！

狂飙！ChatGPT跃升至全球第八大网站！

SpaceX「火星互联网」计划曝光：每秒千万亿比特的星际通信！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉