观点速读｜Keras之父肖莱：规模不等于智能、模型会通过记忆作弊、智能是通过有限数据习得新技能

文摘 2024-11-10 08:00 浙江

👇关注公众号后设🌟标，不错过第一手AI新鲜观点和动态

本文所呈现的观点整理自弗朗索瓦·肖莱接受Machine Learning Street Talk Youtube频道专访，公开发表于2024年11月06日。原始内容参考：https://www.youtube.com/watch?v=JTU8Ha4Jyfc

人物简介

弗朗索瓦·肖莱（François Chollet）是一位法国计算机科学家，深度学习专家，现为谷歌人工智能研究员。他最为人知的是Keras的创造者，这是一个用户友好的高级神经网络API，最初用Python编写，可以运行在TensorFlow、Microsoft Cognitive Toolkit、Theano或PlaidML之上。Keras简化了构建和训练深度学习模型的过程，极大地降低了深度学习的入门门槛，对深度学习的普及和应用起到了重要的推动作用。

除了Keras，Chollet还在深度学习领域做出了其他重要贡献，例如开发了Xception图像分类模型，并撰写了《Python深度学习》一书，该书被广泛认为是深度学习的入门经典，深入浅出地讲解了深度学习的核心概念和实践技巧。

Chollet的研究兴趣包括人工智能、抽象、认知和意识的哲学。他强调深度学习模型的局限性，并提倡研究更具通用性和鲁棒性的人工智能。他还关注人工智能的社会影响，并积极参与相关讨论。

核心观点整理

Chollet在访谈中对当前AI技术进行了深刻的批判性反思，并对真正人工智能的定义、衡量标准以及AGI的未来发展方向提出了独到的见解。

1. “规模即一切”的谬误：规模并非等同于智能

Chollet尖锐批判了当前AI领域流行的“规模即一切”理念，认为单纯依赖于扩大数据规模和计算能力并不能等同于提升智能水平。现有的基准测试，例如大型语言模型的考试式评测，容易被模型的记忆能力“作弊”，无法真正衡量其智能水平。真正的智能在于处理新颖性，即根据已有知识快速构建模型来应对从未见过的场景。

★
“规模就是一切”的想法来自于在训练深度神经网络时对缩放定律的观察……许多人由此推断，我们从这些模型中所能获得的性能没有限制。我们只需要将计算量扩大几个数量级，最终就能远远超过人类的水平，纯粹通过扩展计算量就能做到，无需改变架构，也无需改变训练范式……这里的主要缺陷在于你衡量性能的方式……性能是通过类似考试的基准测试来衡量的，这实际上是记忆游戏……我的看法是，你观察到的这种性能提升实际上与智力是正交的。你并没有真正衡量智力，因为你的基准测试可以通过提前准备，提前记住东西来破解。如果你想衡量智力，你需要一种不同的游戏，一种你无法准备的游戏，例如ARC。

2. 智能的定义：技能习得效率

Chollet将智能定义为“技能习得效率”，即系统在有限数据下获取新技能的能力。他认为，智能是获得新技能的能力，而不是技能本身。为了更有效地衡量这种能力，他创建了抽象推理语料库(ARC)数据集，这是一个旨在抵抗记忆策略的智力测试，人类很容易通过，而AI却很难。

★
智能性非常具体地指你处理新颖事物的能力，处理你从未见过的情况，并即兴提出在该情境下有意义的模型的能力……人工通用智能的抽象推理语料库，简称ARC，你可以把它想象成一种可以让人类进行的智商测试……ARC被设计成能够抵抗死记硬背，而所有其他基准测试都可以仅靠记忆来破解……我将智力定义为技能习得效率……如果你想真正衡量智力，你必须观察系统在有限的数据量下获取新技能的效率。

3. 大型语言模型的局限性：内插数据库而非真正的推理系统

Chollet将大型语言模型描述为“内插数据库”或“近似检索系统”，认为它们主要依赖于记忆和组合已有的知识，而非真正的推理和理解。它们的泛化能力很弱，难以应对训练数据之外的全新问题。

★
我认为人们卡住的地方在于，当他们听到“记忆”时，他们会认为大型语言模型 (LLM) 只是在死记硬背问题的答案，只是在死记硬背内容……但这并不是它们主要的工作。它们主要记忆的是函数、程序，而这些程序在某种程度上可以泛化，可以进行自由泛化……LLM 的工作方式是训练它们，训练这些非常丰富、非常灵活的模型来预测下一个标记……你学习这些向量函数，将输入序列的元素作为输入，并输出其后续元素……它们实际上是向量函数。

4. “万花筒假说”：世界由少量意义原子的重复和组合构成

Chollet提出了“万花筒假说”，认为世界看似无限复杂，实则由少量意义原子（抽象）的重复和组合构成。智能的关键在于从经验中提取这些抽象，并将其组合起来理解新情况。这包含了抽象生成和合成两个关键过程。

★
世界总体上，以及任何特定领域，都遵循相同的结构，表面上看起来极其丰富、复杂，并且每时每刻都充满新意。但实际上，它是由少量意义原子的重复和组合构成的……智能是一种认知机制，你用它来适应新事物，理解你从未见过的情况。它通过结合现有的构建块（抽象构建块）即时创建新情况的模型来工作……这里有两个关键技巧。一个技巧是合成技巧……还有一个是抽象生成，这是一个逆向过程……所以是合成和抽象生成。

5. 深度学习的局限与程序合成：深度学习擅长系统一思维，难以处理系统二思维

Chollet指出深度学习擅长处理系统一思维（直觉、下意识反应），但难以处理系统二思维（逻辑推理、有意识思考）。实现系统二思维需要程序合成，而深度学习模型（曲线）不适合表示离散的程序化计算。

★
我认为一个重要的催化事件是与 Christian Segedy 合作使用深度学习进行自动定理证明……关键思想是使用深度学习模型来指导搜索过程……我的确比随机方法好得多，但是如果你分析它的性能以及它是如何产生比随机方法更好的性能的，它只是在进行浅层模式识别。它并没有真正进行任何形式的系统性推理……这似乎是一个巨大的障碍，我无法通过调整架构、训练数据或其他任何东西来克服……你无法通过深度学习学习可泛化的离散程序。

6. 儿童发展与智能：分层式学习方式为AI系统设计提供启示

Chollet观察到儿童的学习是建构主义的，通过主动尝试、提取技能、设定目标、循环反馈来学习。这种分层式学习方式，从基础的感官运动能力逐渐构建出更高级的认知能力，为AI系统的设计提供了启示。

★
观察孩子长大的一件事是，建构主义完全正确。他们以一种非常积极的方式学习事物，他们尝试事物，并从这些经验中，这些非常刻意的经验中，提取新的技能，然后他们将这些技能重新投入到新的目标中……他们设定目标的方式总是基于他们已经知道的事情……你一开始不知道多少，比如你出生时，你只是由一些反射行为驱动的。但是当你开始形成这些目标时，它们总是来自你已经掌握的层面，你正在一层一层地构建你自己的思想。

7. ARC数据集的局限与未来改进：动态生成基准更有效评估AI泛化能力

Chollet承认ARC数据集存在局限性，例如任务多样性不足、可能存在与线上数据重叠的问题。他建议未来将ARC打造为一个动态生成基准，更有效地评估AI的泛化能力和数据效率。

★
我认为第一个局限性在于，它可能在多样性和新颖性方面达不到其目标……它们也可能与网上现有的东西非常接近……所以我认为这是主要缺陷……我认为，最终要衡量智力，你需要的不只是一个静态的数据集，你需要一个任务生成过程……

8. 对超智能和奇点论的批判：好故事而非理性科学分析

Chollet对超智能论和奇点论持批判态度，认为这些观点是具有传播性的好故事，背后存在着对“救世主情结”和“永生”的渴望，而非基于理性的科学分析。他认为AGI只是一个强大的工具，其危险性并非源于其智能本身，而是源于其目标设定和行动空间的设计。

★
我认为它们是好故事，比如关于世界末日的故事……这些都是好故事，这就是为什么你在小说中，比如科幻小说中经常看到它们的原因……它们并不新鲜。它们已经存在了数千年……我认为这是主要的驱动力……它们作为模因很好。它们是好故事。人们想要相信它们。而且它们也很容易保留和传播。

名词解释:

系统一思维/系统二思维: 这是认知心理学中的一个概念，将思维过程分为两种系统：系统一（直觉系统）快速、自动、无意识；系统二（理性系统）慢速、费力、有意识。
程序合成: 程序合成是指自动生成计算机程序以满足特定规范或解决特定问题的技术。
ARC数据集 (Abstract Reasoning Corpus): 一个用于评估人工智能系统抽象推理能力的数据集，其特点是任务新颖，不易被模型的记忆能力“作弊”。
缩放定律 (Scaling Laws): 描述深度学习模型性能与训练数据量和计算量之间关系的规律。
具身性 (Embodiment): 指的是智能体与其物理环境之间的相互作用，以及这种相互作用如何影响智能体的认知和行为。
奇点论 (Singularity): 一个未来主义概念，预言人工智能将超越人类智能，从而导致社会发生根本性变革。
超智能 (Superintelligence): 指的是远超人类智能水平的人工智能。
建构主义: 一种强调学习者主动建构知识的学习理论。

👇关注公众号后设🌟标，不错过第一手AI新鲜观点和动态

往期精选

http://mp.weixin.qq.com/s?__biz=MzA5NTU4NDM2MA==&mid=2650003545&idx=2&sn=c2cbd42cb63c79fc181496558db81255

瓜哥AI新知

紧追AI业界一手观点、访谈、动态，点滴构建AI底层认知

万字图文｜微软CEO纳德拉在Ignite2024主题演讲：发布Copilot UI+设备+技术栈三大平台战略

速递｜微软VP在Ignite大会中接受专访：微软AI代理已满足企业级应用、提供预定义的智能体+1800模型+1400连接器

全程图文｜黄仁勋在SC24大会宣布英伟达AI集群产品路线图、全行业应用、与谷歌合作量子计算

深度｜资深AI产品总监谈如何成为top5%AI产品经理：能用AI工具动手构建真实产品、拥有超凡能量、能在迷茫中享受探索的乐趣

AI新闻早报｜英伟达Blackwell芯片过热问题导致交付延迟

AI新闻早报｜月之暗面发布Kimi新数学模型k0-math，多项指标超O1

深度｜Perplexity用户增长主管揭秘用户暴涨的奥秘：专注用户留存、重视口碑传播、慎用付费推广

观点｜微软AI CEO苏莱曼：我们正处于AI技术过剩、技术突破多于实际应用，2025实现AI记忆

深度｜艾尔街资本《AI现状报告》作者专访：OpenAI和闭源模型占有压倒优势、投资英伟达比投资竞对赚钱得多

AI新闻早报｜马斯克再次起诉OpenAI及其合作伙伴微软

全程图文｜黄仁勋日本峰会主题演讲&对话孙正义：孙正义痛悔英伟达股票卖早了、与软银合作建设25艾字节AI超算

AI新闻早报｜OpenAI将于2024年1月推出名为“Operator”的自主AI代理

3万字实录｜谷歌前CEO施密特：AI时代公司经营的根本问题是如何用AI加速工作、AI带来剩余财富但改变不了人类的自私

2万字硬核｜Anthropic研究员克里斯：模型可解释性如同研究生物学、什么会刺激模型撒谎或作恶？

AI新闻早报｜Nvidia与软银深度合作开发日本最强超算、通义千问离职骨干因竞业被索巨额赔偿

3万字全文｜Anthropic安全对齐主管阿曼达接受莱克斯专访：人应该如何与AI对话、AI与人类会产生亲密关系吗？

红杉｜实时AI游戏Oasis掌门人迪恩：追逐裸金属级别的极致性能、定制专属CUDA内核和模型架构

AI新闻早报｜百度世界大会发布检索增强文生图技术iRAG和无代码开发工具“秒哒”

深度｜黄仁勋对话高盛CEO：每天睡3小时推动Q4批量交付Blackwell、将数百兆瓦级数据中心改造为全液冷

深度｜Perplexity CEO谈AI搜索快速迭代：产品试用代替评审会、每日查询量为核心驱动指标、广告模式探索中

AI新闻早报｜据传OpenAI新模型Orion进步不及预期、月之暗面创始人被投资人提起仲裁

5万字全文｜Claude之父阿莫迪接受Lex专访：2027部署千亿美元AI集群、支持数百万AI代理以人类百倍速度学习和行动

AI新闻早报｜OpenAI华人研究副总裁翁荔离职、AI初创公司Osmo实现气味数字化

深度｜Airbnb CEO切斯基解析“创始人模式”实操秘诀：CEO成为首席产品官、招聘高绩效人才、打造杰出组织

观点｜方舟基金掌门人木头姐伍德，谈懂王第二任期经济和高科技发展预测

观点速读｜Keras之父肖莱：规模不等于智能、模型会通过记忆作弊、智能是通过有限数据习得新技能

AI新闻早报｜谷歌推出带故事板的AI视频制作工具Vids、人形机器人创作的肖像画在苏富比超100万美元价格成交

万字全文｜奥特曼与YC总裁对谈OpenAI创业历程、预测未来公司可能是1人+10000GPU

AI新闻早报｜微软微软发布Magentic-One开源多智能体AI平台、OpenAI重金购得chat.com域名

AI新闻早报｜Nvidia推出AI机器人开发工具、Perplexity完成5亿美元融资

万字全文｜OpenAI和Anthropic两大产品官对谈：AI发展方向是自主性和异步性、当前模型受限于评估而非智能

全球顶级CEO圆桌讨论AI未来：不搞AI死路一条、2032年AI系统达到90%各行业顶级专家能力

AI新闻早报｜Llama现允许美政府用于军事用途、腾讯推混元3890亿参数开源模型

观点｜油管大V Asianometry直击AI创业泡沫：高估值低营收高成本、靠名人效应圈钱、投资人不怕泡沫破裂但员工担心饭碗

观点速读｜YC合伙人圆桌讨论：O1的强大对创业者是双刃剑、万亿参数模型是开启AGI的钥匙

AI新闻早报｜OpenAI O1正式版预发阶段意外泄露后紧急关闭，正待美国选举结束

万字全文｜OpenAI DevDay奥特曼专访：模型是贬值资产、AI按处理问题的计算量定价、从追求10%增长转向10x增长、

高端对话｜黄仁勋vs杨元庆：AI代理和机器人将成为产业世界两大基础、联想推Blackwell新架构AI服务器和车载AI

AI新闻早报｜AI实时生成游戏模型Oasis遭吐槽、OpenAI宣布推迟GPT5/Sora/DALL-E升级

a16z投资巨擘霍洛维茨：AI变革规模类似微处理器浪潮、新型创业者有物理学背景、注重系统属性胜过技术细节

OpenAI离职主管布伦达奇收封口费后接受专访：AI完全没有装“刹车”，人们应该多存钱准备提早（bei）退休

深度｜微软AI CEO苏莱曼：三年内前沿模型性能提升不会放缓、2025实现AI永久记忆、创业者应关注垂直小模型

AI新闻早报｜Cerebras展示“晶圆规模推理引擎”，提供2100token/秒推理速度

速递｜OpenAI CEO Altman和一众高管在Reddit上答网友问（奉上精选截图、字有点小包涵）

红杉专访｜前谷歌搜索老炮、Glean CEO谈企业搜索引擎和RAG技术栈构建实务：AI如何管理企业的知识

AI新闻早报｜OpenAI推出AI搜索、o1模型升级亮相伦敦Dev Day

Claude在computer use开的第一炮，可能炸出一条AI代理突围的新赛道

访谈实录｜Perplexity CEO与资深编辑激辩剽窃指控、瞄准搜索广告商业模式、还在为美国绿卡奔波努力

深度｜马斯克揭秘Neuralink：控制AI风险需突破人机交互带宽瓶颈，大脑输出带宽<1bit/秒

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉