作者 | Yann Le Cun(中文名:杨立昆) 卷积神经网络之父
转自 | AI 科技大本营
近日,华尔街日报找到了人称“CNN 之父”“人工智能三教父之一”的 Yann LeCun 做了场采访,采访内容是我们可以天天在 LeCun 的推特(X)上看到的东西:吐槽当前的 LLM 不够智能。目前在 Hacker News 上,这场采访内容的讨论热度高居不下。
LeCun 不仅是当今人工智能热潮的重要推手之一,更是众多专家中罕见的声音,因为现在有许多的 AI 专家被认为夸大了人工智能力量和潜在的风险。当其他知名学者宣称我们正接近拥有超越甚至取代人类智慧的计算机时,LeCun 却成为一个最有资格的怀疑论者。
如果你经常在 X 上浏览推文,并且关注了 LeCun,就会发现他是个相当心直口快的人,经常在社交媒体上与那些鼓吹生成式 AI 超人潜力的支持者们进行了激烈的交锋,其中包括埃隆·马斯克(Elon Musk)以及与他共享“AI 之父”美誉的两位同行 —— Geoffrey Hinton 和 Yoshua Bengio。特别是 Hinton,这位与 LeCun 相识近四十年的朋友,最近刚刚荣获诺贝尔物理学奖,并多次警告 AI 将带来的生存威胁 —— 其中让人最印象深刻的一次,莫过于 Hinton 有一年亮相了北京智源大会的荧幕,向到场的每一位中国嘉宾提醒 AI 的风险之处。
然而,LeCun 认为,尽管今天的 AI 模型很有用,但它们远远不能与我们的宠物相提并论,更不用说与人类相媲美了。
在这次采访中,LeCun 被问及是否应该担心 AI 会迅速变得如此强大以至于对我们构成威胁时,他幽默地回应:“你得原谅我说的法语,但那是彻头彻尾的胡说八道。”
“我行我素”的教父
LeCun 出生于巴黎北郊,他对 AI 的兴趣部分源自斯坦利·库布里克 1968 年的科幻经典《2001 太空漫游》中的 HAL 9000 这一反叛的 AI 形象。在从索邦大学获得博士学位后,他在著名的贝尔实验室工作过,那里诞生了从晶体管到激光等一系列重大发明。2003 年,他加入了纽约大学担任计算机科学教授,并在十年后成为当时还是 Facebook 的公司 AI 研究主任。
LeCun 的中文名是“杨立昆”。在比较早期的时候,中文技术圈不知道怎么翻译都会叫“严勒村”之类的,后来 LeCun 在一次演讲的 PPT 上展示了一张图,其中用毛笔书法赫然写着杨立昆三个大字,不仅向我们规范了自己法语名字的正确读音,还一举多得,取了个中文名字。
2019 年,LeCun 与 Hinton 和 Bengio 一同荣获了计算机科学界的最高奖项——图灵奖,这一荣誉使他们被称为“AI 教父”。该奖项表彰了他们在神经网络领域的奠基性工作,这一领域支撑了许多当今最先进的 AI 系统,从 OpenAI 的 ChatGPT 到特斯拉最近精彩亮相的自动驾驶汽车。
在现实生活中,LeCun 具有一种令人难以招架的魅力:他机智风趣,总是能直截了当地说出他对这个领域的真知灼见。尽管他已经 64 岁了,但仍给人一种既时髦又略带随性的印象,这与他过去作为巴黎人的经历以及现在作为纽约大学教授的身份非常契合。
他常戴着经典的黑色 Ray-Ban 眼镜,与 Meta 现在主打的 AI 驱动眼镜几乎一模一样。值得一提的是,LeCun 自己曾拥有一副 AI 驱动的 Ray-Ban 眼镜,但在一次航海时不小心掉进海里,从此失效了。航海是 LeCun 的一大爱好,体现了他对自然和冒险的热爱。
LeCun 曾经晒过自己和另一位“AI 教父” Yoshua Bengio 共同航海的照片
华尔街日报的记者表示,当他坐在纽约市某间 Meta 卫星办公室的会议室里时,LeCun 会不由自主地散发出一种温暖而自信的气息。他带着那种仿佛把你当成知心朋友的笑容发表尖锐的意见,让人感觉就像是在分享一个内部笑话。
凭借他的成就以及 Meta AI 研究实验室中的领导地位,LeCun 的批评往往显得格外有分量。
如今,LeCun 仍在纽约大学与他的博士生一起撰写论文,而在 Meta,他作为首席 AI 科学家,掌管着世界上资金最充裕的 AI 研究机构之一。他经常通过 WhatsApp 与首席执行官马克·扎克伯格交谈,后者正将 Meta 定位为对抗苹果、OpenAI 等科技巨头的 AI 繁荣的主要颠覆力量,通过发布开源大模型 Llama 系列获得了开发者社区的一片好评。
LeCun 认为 AI 是一项强有力的工具。在采访过程中,他列举了许多例子来说明 AI 将如何成为 Meta 极为重要的组成部分,并将其规模和收入提升至大约 1.5 万亿美元的价值。从实时翻译到内容审查,AI 在 Meta 的各个方面都发挥着重要作用。
AI 不如猫
LeCun 坚信当前的 AI 并没有任何实质性的智能,而且他认为许多领域的其他人,特别是在 AI 初创公司中的人,正以一种他觉得荒谬的方式推测其近期的发展。许多人寄希望于基于大语言模型的 AI,如 OpenAI 的模型,能够在短期内创造出所谓的人工通用智能(AGI),即广泛超过人类水平的智能。OpenAI 的 Sam Altman 其实九月份的时候才表示,我们可能在“几千天内”就能拥有 AGI。而埃隆·马斯克则曾经表示,这可能会在 2026 年实现。
今年春天,他因马斯克在 X 平台上发生了相当激烈的争吵 —— 事件起因是马斯克宣布 xAI 获得了 60 亿美元融资,并发了个招人公告,其中提到了“想加入 xAI,需要在追求真理道路上必须秉持最大的严谨,而不受流行趋势或政治正确性的影响。”
结果,马斯克的这句“追求真理”反而触怒了 LeCun,后者表示前者明明天天在 X 上发表阴谋论(指 AI 会在未来摧毁人类),怎么能说自己是在追求真理呢?
战争一触即发,马斯克和 LeCun 先是就双方的学术科研成就进行比拼:马斯克被认为是个「企业家」,而他则指责 LeCun 以前发表的论文都是“老掉牙”的东西:
“你自称科学家,又做过什么和科学有关的东西?”
“我今年发表了 80 篇技术论文。”
“那你还是再给点力吧!(Try Harder)”
“你又不是我老板,你管得着吗?”
紧接着,两人的争执就彻底一发不可收拾,从科学层面上升到了人身攻击与政治批判的级别,以至于接下来的数个月里,LeCun 都在不停地批判马斯克的政治观点。
然而,值得一提的是,随着 10 月 13 日星舰第五次试飞成功的新闻放出,LeCun 却一转常态,在马斯克的推文底下发表祝贺。
底下的评论区肯定炸锅了。热评问他:“你不是说马斯克没有科学成就吗?”
LeCun 却回答:“这确实不是科学(Science)。”
“那这是啥?”
“这是工程(Engineering)。”
可见,LeCun 还是部分认可了马斯克的(工程成就)。但也有人不这么认为:
除了马斯克,LeCun 其实也曾公开不同意自己的挚友 Hinton 和 Bengio 反复提出的关于 AI 对人类构成危险的警告。Bengio 曾经表示,虽然他同意 LeCun 的很多观点,但他们之间存在分歧,即公司能否确保未来的超人类 AI 不会被恶意使用或发展出自己的恶意意图。“我希望他是对的,但我认为不应该仅仅依靠公司之间的竞争和利润动机来保护公众和民主,” Bengio 曾说,“这就是为什么我认为我们需要政府介入。”
LeCun 认为这些言论可能是过早的。今年五月份的时候,OpenAI 研究员的离职引发了对控制超智能 AI 的重要性的讨论,而 LeCun 当即反驳道:“在我看来,在‘急切地找出如何控制比我们聪明得多的 AI 系统’之前,我们应该先有一个设计比家猫聪明的系统的初步线索。”
LeCun 喜欢用猫来做比喻。在今年早些时候的 World Governments Summit 上,他就做过完全相同的比喻。毕竟,猫具有对物理世界的心理模型、持久的记忆、一定的推理能力和计划能力,而这些特性在当前的“前沿” AI 中都不存在,包括 Meta 自身的产品。
自 1986 年以来一直认识 LeCun 的 Léon Bottou 曾说,LeCun “固执得恰到好处” —— 也就是说,他愿意倾听别人的观点,但在追求他认为正确的构建 AI 方法上有着坚定的决心。
LeCun 的前博士生 Alexander Rives(现在自己创办了一家 AI 初创公司),也曾表示自己的老师 LeCun 的挑衅是有深思熟虑的。“他有能力发现领域内思考问题时的空白,并指出这一点。”
LeCun 认为,真正的人工通用智能是一个值得追求的目标,这也是 Meta 正在努力的方向。“未来,当人们与他们的 AI 系统交流时,无论是智能眼镜还是其他设备,我们需要这些 AI 系统具备人类级别的特征,真正具备常识,并且表现得像一个人类助手。” 他说。
然而,创建这样一个有能力的 AI 可能需要数十年的时间,而且目前的主要方法无法实现这一目标。生成式 AI 的繁荣是由大型语言模型和其他类似系统推动的,这些系统通过海量数据训练来模仿人类的表达方式。随着每一代模型变得更加强大,一些专家得出结论,只需将更多的芯片和数据投入到未来 AI 的开发中,就会使它们越来越强大,最终匹配甚至超过人类的智能。这正是大量投资用于构建更大规模的专用芯片来训练 AI 的背后逻辑。
LeCun 认为,当前 AI 系统的问题在于其设计方式,而非规模大小。
“无论科技巨头在全球的数据中心中塞入多少 GPU,今天的 AI 都无法实现人工通用智能。” 他押注于研究工作方式根本不同的 AI 将为我们开辟通向人类级别智能的道路。这些假设的未来 AI 可能采用多种形式,但 Meta AI 正在进行的从现实世界中摄取视频的工作是目前让 LeCun 兴奋的项目之一。其理念是创建模型,以类似于幼小动物的方式通过视觉信息来构建世界模型。用于 ChatGPT 和其他机器人的大语言模型有一天可能只会在具备常识和类人能力的系统中扮演一个小角色,这些系统将使用一系列其他技术和算法来构建。