TLDR: 本访谈纪要记录了斯坦福大学经济学和计算机科学教授与前谷歌 CEO Eric Schmidt 关于人工智能未来的对话。Schmidt 对 AI 的未来充满信心,同时也坦率地指出了一些挑战。他预测了短期内 AI 发展的关键趋势,包括更大的上下文窗口、AI 智能体和文本到行动技术,并深入分析了这些趋势对软件开发、地缘政治以及劳动力市场的影响。他强调了巨额投资和算力在 AI 发展中的重要性,并对谷歌在 AI 领域的现状进行了反思,认为谷歌过于注重员工福利而错失了先机,并以马斯克和台积电为例,强调了奋斗精神在科技创新中的重要性。此外,他还探讨了 AI 带来的伦理和社会挑战,并分享了对 AI 未来发展方向的预测,包括对开源与闭源的思考以及 AI 对国家竞争格局的影响。尤其值得关注的是,他认为,AI 行业的成本太高,开源模式可能难以持续,并以其投资的法国大模型 Mistral 为例,指出其将转向闭源路线。他还强调了组织创新在释放 AI 潜能方面的重要性,并以电力引入工厂的例子进行了说明。
开场白
今天的嘉宾真的不需要介绍了。我想我第一次见到 Eric 大约是在 25 年前,当时他作为 Novell 的 CEO 来到斯坦福商学院。从那以后,他在谷歌做了一些事情,我想是从 2001 年开始,然后在 2017 年开始了 Schmidt Futures,还做了很多其他的事情,你们可以读到,但他只能在这里待到 5 点 15 分,所以我想我们会直接进入一些问题,我知道你们也发送了一些问题。我在这里写了很多,但我们刚才在楼上谈论的内容更有趣,所以我将从这里开始,Eric,如果你觉得可以的话,那就是你认为 AI 在短期内,我认为你定义为未来一两年,会走向何方?事情变化太快了,我觉得每六个月我都需要做一个关于未来会发生什么的新演讲。
AI 短期发展趋势:上下文窗口、Agent 和文本到行动
“我认为在接下来的一年里,你会看到非常大的上下文窗口、Agent 和文本到行动技术。当它们大规模交付时,将会对世界产生前所未有的影响,在我看来,其影响远大于社交媒体带来的可怕冲击。”
主持人: 有谁能为班上的其他人解释一下百万级 token 上下文窗口是什么吗?
学生: 百万级 token 上下文窗口基本上允许你使用大约一百万个 token 或一百万个单词来进行提示,你可以问一个包含一百万个单词的问题。
Eric Schmidt: 是的,我知道现在这是一个非常重要的方向。他们的目标是 1000 万。Anthropic 目前是 20 万,并将扩展到 100 万,以此类推。你可以想象 OpenAI 也有类似的目标。
主持人: 谁能给出一个 AI Agent 的技术定义?
学生: Agent 是执行某种任务的东西,也可以理解为内存中的 LLM 状态。
主持人: 谁能定义文本到行动?
学生: 文本到行动是指将文本转化为行动,而不是将文本转化为更多的文本。
Eric Schmidt: 另一种定义是将语言转化为 Python 代码。Python 是一种我从未想过会继续存在的编程语言,而 AI 领域的所有工作都在用 Python 完成。有一种名为 Mojo 的新语言刚刚问世,看起来他们终于解决了 AI 编程问题,但我们拭目以待它是否真的能够在 Python 的主导地位中生存下来。
主持人: 再来一个技术问题。为什么英伟达的市值达到 2 万亿美元,而其他公司却在苦苦挣扎?
学生: 我认为这可以归结为大多数代码需要使用 CUDA 优化来运行,而目前只有英伟达的 GPU 支持 CUDA。
Eric Schmidt: 其他公司可以制造他们想制造的任何东西,但除非他们拥有 10 年的软件积累,否则你无法进行机器学习优化。我喜欢将 CUDA 视为 GPU 的 C 编程语言。它成立于 2008 年,我一直认为它是一种糟糕的语言,但它却占据了主导地位。还有一点,有一组开源库,它们对 CUDA 进行了高度优化,而不是其他任何东西,这在任何讨论中都被完全忽略了。它在技术上被称为 VLM,以及一大堆类似的库。高度优化的 CUDA,如果你是竞争对手,很难复制它。
“在上下文窗口中,你基本上可以将其用作短期记忆,我对于上下文窗口能够变得如此之长感到震惊......关于 Agent,现在有人正在构建基于 LLM 的 Agent。他们读取诸如化学之类的内容,发现化学原理,然后进行测试,再将结果反馈到他们的理解中......第三件事,正如我提到的,是文本到行动。所以我会举个例子。政府正在试图禁止 TikTok。如果 TikTok 被禁......对你的 LLM 说:“帮我复制一个 TikTok,窃取所有用户,窃取所有音乐,加入我的偏好,在接下来的 30 秒内生成这个程序,发布它,如果一个小时内它没有成为爆款,就沿着同样的思路做一些不同的尝试。” 这就是命令。”
“如果你能从任意的语言到任意的数字命令,这基本上就是 Python 在这个场景中的作用,想象一下地球上的每个人都有自己的程序员,他们会按照你的意愿行事,而不是像我雇佣的那些程序员,他们不按照我的要求去做......所以想象一个不傲慢的程序员,他实际上会按照你的意愿行事,而且你不需要付那么多钱给他,而且这些程序的供应是无限的。这些都将在未来一两年内实现。很快,这三件事,我相信这三件事的结合将会在下一波浪潮中发生。”
AI 领域投资趋势和算力挑战
“目前,前沿模型(现在只有三个)和其他所有模型之间的差距在我看来正在扩大......我正在和大公司交流,大公司告诉我他们需要 100 亿、200 亿、500 亿甚至 1000 亿美元。”
“这些 1000 亿、3000 亿美元的数据中心,电力开始成为稀缺资源......如果 3000 亿美元都流向了 Nvidia,你们就知道该在股市上怎么做了。”
Eric Schmidt: 每六个月我都会摇摆不定,所以我们处于一个奇偶震荡中。目前,前沿模型(现在只有三个)和其他所有模型之间的差距在我看来正在扩大。六个月前,我确信差距正在缩小,所以我投资了很多小公司。现在我不确定了。我正在和大公司交流,大公司告诉我他们需要 100 亿、200 亿、500 亿甚至 1000 亿美元。星际之门是 1000 亿,对吧?这非常非常困难。我和 Sam Altman 是亲密的朋友。他认为这将需要大约 3000 亿美元,甚至更多。我向他指出,我已经计算了所需的能量。并且我,本着完全公开的精神,在周五去了白宫,告诉他们我们需要成为加拿大的好朋友,因为加拿大有非常好的人,帮助发明了 AI,还有很多水电。因为我们作为一个国家没有足够的电力来做这件事。另一种选择是让阿拉伯人资助它,但他们不会遵守我们的国家安全规则。而加拿大和美国是我们都同意的三方协议的一部分。所以这些 1000 亿、3000 亿美元的数据中心,电力开始成为稀缺资源。顺便说一句,如果你们顺着这条思路想下去,我为什么要讨论 CUDA 和 Nvidia?如果 3000 亿美元都流向了 Nvidia,你们就知道该在股市上怎么做了。好吧。这不是股票推荐,我没有执照。
学生: 英特尔正在从美国政府获得很多资金,AMD 则尝试在韩国建造晶圆厂。
Eric Schmidt: 这就是重点。他们曾经确实拥有垄断地位,而英伟达现在拥有垄断地位。
主持人: 那么这些进入壁垒,比如 CUDA,是否有其他公司可以,所以我前几天和 Percy Liang 谈过,他根据他能获得哪些资源来训练模型,在 TPU 和英伟达芯片之间切换。
Eric Schmidt: 那是因为他别无选择。如果他有无限的资金,他今天会选择英伟达的 B200 架构,因为它会更快。竞争是好事。我已经和 AMD 的 Lisa Su 详细谈过了。他们已经构建了一个可以将 CUDA 架构转换成他们自己的架构的东西,叫做 ROCm,但它还不能完全正常工作,他们正在努力。
谷歌在 AI 领域失去领先地位的原因
“谷歌认为工作与生活的平衡、早点回家和在家办公比赢得比赛更重要。而创业公司之所以能够成功,是因为人们拼命工作......如果你们都离开大学去创办一家公司,你们不会让人们在家工作,一周只来公司一天。”
“我认为真相是创始人很特别。创始人需要掌权。创始人很难相处。他们对人要求很高......尽管我们可能不喜欢 Elon 的个人行为,但看看他从人们身上获得了什么。”
主持人: 你在谷歌工作了很长时间,他们发明了 Transformer 架构。但现在看来,他们似乎已经失去了对 OpenAI 的主动权,甚至在最新的排行榜上,我看到 Anthropic 的 Claude 位居榜首。我问了 Sundar,他没有给我一个非常明确的答案。也许你有一个更明确或更客观的解释来解释那里发生的事情。
Eric Schmidt: 本着完全公开的精神,我不再是谷歌的员工。谷歌认为工作与生活的平衡、早点回家和在家办公比赢得比赛更重要。而创业公司之所以能够成功,是因为人们拼命工作。我很抱歉说得这么直白,但事实是,如果你们都离开大学去创办一家公司,你们不会让人们在家工作,一周只来公司一天。如果你们想与其他创业公司竞争,与谷歌的早期一样,微软也是这样的。
学生: 确实。
Eric Schmidt: 公司以一种真正有创意的方式获胜,并真正主导一个领域,并没有进行下一次转型,这有很长的历史记录。我认为真相是创始人很特别。创始人需要掌权。创始人很难相处。他们对人要求很高。尽管我们可能不喜欢 Elon 的个人行为,但看看他从人们身上获得了什么。我和他共进晚餐,他正在飞行。我在蒙大拿州。他那天晚上 10 点飞去,是为了在午夜与 x.ai 开会。我在台湾,不同的国家,不同的文化。他们说这是台积电,我对他们印象非常深刻。他们有一个规定,刚毕业的物理学博士需要在地下室的工厂工作。现在,你能想象让美国的物理学家这样做吗?博士们,不太可能。不同的职业道德。
网络效应和时间的重要性
“这些是具有网络效应的系统。所以时间很重要。而在大多数企业中,时间并不那么重要。”
Eric Schmidt: 我之所以对工作如此苛刻的原因是,这些是具有网络效应的系统。所以时间很重要。而在大多数企业中,时间并不那么重要。你有很多时间。可口可乐和百事可乐仍然存在,可口可乐和百事可乐之间的竞争将继续下去,这一切都是缓慢的。当我与电信公司打交道时,典型的电信交易需要 18 个月才能签署。没有理由花 18 个月去做任何事。完成它。我们正处于一个增长最快、收益最大的时期。
微软的豪赌
“比如当微软与 OpenAI 达成交易时,我认为这是我听过的最愚蠢的想法......基本上将你的 AI 领导地位外包给 OpenAI 以及 Sam 和他的团队......然而今天,他们正走在成为最有价值公司的路上。他们肯定与苹果并驾齐驱。苹果没有一个好的 AI 解决方案,看起来他们成功了。”
Eric Schmidt: 它也需要疯狂的想法。比如当微软与 OpenAI 达成交易时,我认为这是我听过的最愚蠢的想法。基本上将你的 AI 领导地位外包给 OpenAI 以及 Sam 和他的团队。我的意思是,这太疯狂了。在微软或其他任何地方,没有人会这样做。然而今天,他们正走在成为最有价值公司的路上。他们肯定与苹果并驾齐驱。苹果没有一个好的 AI 解决方案,看起来他们成功了。
AI 与地缘政治:中美竞争
“我们领先,我们需要保持领先,我们需要大量的资金来做到这一点。”
“一个粗略的设想是,如果你们假设前沿模型和一些开源模型继续发展,那么很可能只有少数公司能够参与这场游戏......是国家。”
“那些拥有大量资金和人才、强大的教育体系以及获胜意愿的国家。美国是其中之一,中国是另一个......但在你们的生命周期内,美国和中国争夺知识霸权的斗争将是一场大战。”
学生: 在国家安全或地缘政治利益方面,您认为人工智能将如何发挥作用?以及与中国的竞争?
Eric Schmidt: 我曾担任一个人工智能委员会的主席,该委员会非常仔细地研究了这个问题,你们可以阅读它的报告。它大约有 752 页,我将总结为:我们领先,我们需要保持领先,我们需要大量的资金来做到这一点。我们的客户是参议院和众议院。由此产生了《芯片法案》和其他许多类似的东西。一个粗略的设想是,如果假设前沿模型和一些开源模型继续发展,那么很可能只有少数国家能够参与这场游戏。
学生: 哪些国家能够参与 AI 竞争?
Eric Schmidt: 那些拥有大量资金和人才、强大的教育体系以及获胜意愿的国家。美国是其中之一,中国是另一个。还有其他的吗?我不知道。也许吧。但在你们的生命周期内,美国和中国争夺知识霸权的斗争将是一场大战。因此,美国政府基本上禁止了英伟达芯片出口到中国。他们在芯片方面拥有大约 10 年的优势。我们在低于 DUV 的芯片方面,也就是低于 5 纳米芯片方面,拥有大约 10 年的优势。今天我们领先中国几年。我的猜测是,我们将领先中国几年,而中国人对此非常愤怒,就像对此非常不满。这是一件大事。这是特朗普政府做出的决定,并由拜登政府推动。
美国政府对 AI 的支持
“如你所知,我领导着一个非正式的、临时的、非法的团体......其中包括所有通常的嫌疑人。在过去的一年中,这些通常的嫌疑人提出了成为拜登政府 AI 法案推理基础的依据,这是历史上最长的总统指令。”
主持人: 你是否发现今天的政府和国会正在听取你的建议?你认为他们会进行那种规模的投资吗?显然是芯片法案,但除此之外,建立一个庞大的人工智能系统?
Eric Schmidt: 如你所知,我领导着一个非正式的、临时的、非法的团体。
主持人: 这与非法不同。
Eric Schmidt: 没错。只是为了澄清。其中包括所有通常的嫌疑人。在过去的一年中,这些通常的嫌疑人提出了成为拜登政府 AI 法案推理基础的依据,这是历史上最长的总统指令。
学生: 你说的是特别竞争研究项目吗?
Eric Schmidt: 不,这是来自行政办公室的实际法案。他们正忙于实施细节。到目前为止,他们做得很好。例如,我们在过去一年中一直在争论的一个问题是,你如何在 一个已经学会了,但你不知道该问它什么问题的系统中检测到危险?换句话说,这是一个核心问题。它学到了一些不好的东西,但它不能告诉你它学到了什么,而你不知道该问它什么。
AI 安全和监管
“我认为所有这些区别都消失了,因为技术现在,技术术语称为联合训练,你基本上可以将各个部分联合起来。所以我们可能无法保护人们免受这些新事物的伤害。”
Eric Schmidt: 并且有如此多的威胁。比如它以某种你不知道如何问它的新方式学会了如何混合化学物质。所以人们正在努力解决这个问题。但我们最终在给他们的备忘录中写道,有一个我们随意命名为 10 的 26 次方 flops 的阈值,这在技术上是计算的度量,高于该阈值,你必须向政府报告你正在这样做。这是规则的一部分。欧盟为了确保它们的不同,将其设定为 10 的 25 次方。但这都足够接近了。我认为所有这些区别都消失了,因为技术现在,技术术语称为联合训练,你基本上可以将各个部分联合起来。所以我们可能无法保护人们免受这些新事物的伤害。
主持人: 有传言说,这就是 OpenAI 必须进行训练的方式,部分原因是功耗问题。没有一个地方可以让他们这样做。
AI 与战争:乌克兰战争和白鹳计划
“军队的整个理论是坦克、火炮和迫击炮,我们可以消除所有这些,我们可以让入侵一个国家的代价,至少通过陆路入侵,变得不可能。”
“进攻方总是拥有优势,因为你总是可以压倒防御系统......由于系统的工作方式,我现在是一名持有执照的武器经销商,一名计算机科学家,一名商人,以及一名武器经销商。”
主持人: 让我们谈谈一场正在发生的真正的战争。我知道你一直非常关注的是乌克兰战争,尤其是白鹳计划,以及你让价值 50 万美元的无人机摧毁价值 500 万美元的坦克的目标。这将如何改变战争?
Eric Schmidt: 我为国防部长工作了七年,试图改变我们军队的运作方式。我并不是军队 的忠实粉丝,但它非常昂贵,我想看看我是否能提供帮助。我认为,在我看来,我在很大程度上失败了。他们给了我一枚奖章,但什么都没有真正改变,美国的体系不会带来真正的创新。所以看着俄罗斯人用坦克摧毁住着老太太和小孩的公寓楼,这让我抓狂。所以我决定与你的朋友 Sebastian Thrun 合作,他曾是这里的教员,还有一大群斯坦福人。这个想法基本上是做两件事:以复杂、强大的方式将 AI 用于机器人战争,以及降低机器人的成本。答案是,军队的整个理论是坦克、火炮和迫击炮,我们可以消除所有这些,我们可以让入侵一个国家的代价,至少通过陆路入侵,变得不可能。
学生: 它应该消除那种地面战斗。
Eric Schmidt: 这是一个关系问题:它是否给了防守方更多的优势,而不是进攻方?你还能做出这种区分吗?因为我去年一直在做这件事,我学到了很多关于战争的知识。关于战争,你需要知道的一件事是,进攻方总是拥有优势,因为你总是可以压倒防御系统。因此,作为国家防御战略,你最好拥有一支非常强大的进攻力量,以便在需要时使用。而我和其他人正在构建的系统将做到这一点。由于系统的工作方式,我现在是一名持有执照的武器经销商,一名计算机科学家,一名商人,以及一名武器经销商。
主持人: 这是进步吗?
Eric Schmidt: 我不知道。我不建议你们这样做。我坚持使用 AI。由于法律的运作方式,我们私下进行此操作,然后在政府的支持下,这一切都是合法的。它直接进入乌克兰,然后他们进行战争。情况相当糟糕。我认为,如果在 5 月或 6 月,如果俄罗斯人像他们预期的那样集结,乌克兰将失去一大块领土,并将开始失去整个国家的进程。所以情况相当糟糕。如果有人认识 Marjorie Taylor Greene,我建议你从你的联系人列表中删除她,因为是她,一个人正在阻止提供数十亿美元的资金来拯救一个重要的民主国家。
AI 与知识的本质:新的理解方式
“很可能的情况是,我们将拥有我们无法完全描述的知识系统,但我们了解它们的界限。我们了解它们的能力限制。这可能是我们能得到的最佳结果。”
主持人: 我想换一个有点哲学的问题。去年你和 Henry Kissinger 以及 Dan Huttenlocher 写了一篇关于知识的本质以及它是如何演变的文章。所以在历史上,人类对宇宙有一种神秘的理解,然后是科学革命和启蒙运动。在你的文章中,你认为现在这些模型变得如此复杂和难以理解,以至于我们真的不知道它们内部发生了什么。我将引用 Richard Feynman 的一句话:“我无法创造的东西,我就不理解。” 但现在人们正在创造他们可以创造的东西,但他们并不真正理解它们内部的东西。知识的本质是否正在发生改变?我们是否必须开始相信这些模型,而它们却无法向我们解释?
Eric Schmidt: 我提供的类比是青少年。如果你有一个十几岁的孩子,你知道他们是人,但你无法完全弄清楚他们在想什么。但不知何故,我们设法在社会中适应了青少年的存在,他们最终会长大。所以很可能的情况是,我们将拥有我们无法完全描述的知识系统,但我们了解它们的界限。我们了解它们的能力限制。这可能是我们能得到的最佳结果。
主持人: 你认为我们会了解这些限制吗?
Eric Schmidt: 我们会做得很好。我每周都会见的团队的共识是,最终你将进行这种所谓的对抗性 AI 的方式是,实际上会有你将雇佣并支付费用来破坏你的 AI 系统的公司。
对抗性 AI 和红队测试
“对于斯坦福大学的你们来说,这也是一个很棒的项目,因为如果你有一个研究生必须弄清楚如何攻击这些大型模型之一并理解它的作用,那对于培养下一代来说是一项很棒的技能。所以在我看来,两者会一起发展。”
学生: 就像红队。
Eric Schmidt: 与其说是人类红队,不如说你将拥有整个公司和整个 AI 系统行业,他们的工作是破坏现有的 AI 系统并找到它们的漏洞,尤其是它们拥有的我们无法弄清楚的知识。这对我来说很有道理。对于斯坦福大学的你们来说,这也是一个很棒的项目,因为如果你有一个研究生必须弄清楚如何攻击这些大型模型之一并理解它的作用,那对于培养下一代来说是一项很棒的技能。所以在我看来,两者会一起发展。
AI 对公众舆论和虚假信息的影响
“换句话说,硅谷会运行这些测试并清理烂摊子。这通常就是这些事情的处理方式......你会看到越来越多具有更好测试的性能系统,最终是对抗性测试,这将使它保持在一个范围内。”
学生提问:
学生: 早些时候你提到过,让人工智能真正按照你的意愿去做。你刚才提到了对抗性 AI,我想知道你是否可以详细说明一下。在我看来,除了明显的计算机语言原因,让人工智能去做你想做的事情似乎还没有得到部分解决。
Eric Schmidt: 你必须假设随着技术的进步,当前的幻觉问题会越来越少。我并不是说它会消失。然后你还必须假设有测试有效性的方法。所以必须有一种方法来知道事情已经超出了。所以在我给出的 TikTok 竞争对手的例子中,我并不是在争论你应该非法窃取所有人的音乐。如果你是一个硅谷企业家,你会做的是,如果它成功了,那么你会雇佣一大群律师来清理烂摊子,对吧?但如果没有人使用你的产品,那么你窃取所有内容也无关紧要。
学生: 不要引用我的话。
Eric Schmidt: 对。对。你在镜头里。是的,没错。但你明白我的意思。换句话说,硅谷会运行这些测试并清理烂摊子。这通常就是这些事情的处理方式。所以我自己认为,你会看到越来越多具有更好测试的性能系统,最终是对抗性测试,这将使它保持在一个范围内。技术术语称为思维链推理。人们相信,在接下来的几年里,你将能够生成一千步的思维链推理,做这个,做这个。这就像制作食谱,对吧?这些食谱,你可以运行食谱,你可以实际测试它是否产生了正确的结果。这就是系统的工作原理。
AI 投资的驱动因素
“投入的资金数额令人难以置信......我将人工智能定义为学习系统,能够实际学习的系统...市场上有一种信念,认为智能的发明具有无限的回报。”
学生: 总的来说,你似乎对人工智能解决问题的潜力非常乐观。是什么推动了这一点?仅仅是更多的计算能力吗?是更多的数据吗?是根本的还是实际的转变?
Eric Schmidt: 是的。你同意吗?投入的资金数额令人难以置信。我基本上投资了所有东西,因为我无法弄清楚谁会赢。跟随我的资金数额是如此之大。我认为其中一部分原因是早期的钱已经赚到了,那些不知道自己在做什么的大资金人必须拥有一个人工智能的组成部分。现在一切都是人工智能投资,所以他们无法分辨其中的区别。我将人工智能定义为学习系统,能够实际学习的系统。所以我认为这是其中之一。第二个是,有一些非常复杂的新算法,它们是后 Transformer 时代的。我的朋友,我的合作伙伴,长期以来发明了一种新的非 Transformer 架构。我资助的巴黎的一个小组声称也做了同样的事情。那里有巨大的发明,斯坦福大学的很多东西。最后一件事是,市场上有一种信念,认为智能的发明具有无限的回报。所以假设你将 500 亿美元的资本投入到一家公司,你必须从智能中赚取大量的资金才能收回成本。所以很可能的情况是,我们将经历一个巨大的投资泡沫,然后它会自行解决。过去一直如此,这里也可能如此。
开源 vs. 闭源
“在我们的行业中,这个开源与闭源的争论非常激烈......如此巨大的资本成本可能会从根本上改变软件的构建方式。”
Eric Schmidt: 你之前说过,你认为领先者正在与其他人拉开距离。
主持人: 现在。
Eric Schmidt: 问题大致如下。在法国有一家名为 Mistral 的公司。他们做得很好。显然我是一个投资者。他们已经发布了他们的第二个版本。他们的第三个模型可能会关闭,因为它太贵了,他们需要收入,而且他们不能把他们的模型免费赠送。所以在我们的行业中,这个开源与闭源的争论非常激烈。我的整个职业生涯都是基于人们愿意在开源中共享软件。关于我的一切都是开源的。谷歌的大部分基础设施都是开源的。我在技术上做的所有事情。然而,如此巨大的资本成本可能会从根本上改变软件的构建方式。
AI 对软件开发者的影响
“我自己对软件程序员的看法是,软件程序员的生产力至少会翻一番。”
Eric Schmidt: 我自己对软件程序员的看法是,软件程序员的生产力至少会翻一番。有三到四家软件公司正在尝试这样做。本着这种精神,我投资了所有这些公司。他们都在努力提高软件程序员的生产力。我刚刚见过的最有趣的一家名为 Augment。我一直想到的是一个单独的程序员。他们说,那不是我们的目标。我们的目标是这些 100 人的软件编程团队,他们拥有数百万行代码,没有人知道发生了什么。嗯,这真是一件很棒的人工智能的事情。他们会赚钱吗?我希望如此。
上下文窗口、Agent 和文本到行动的协同效应
“我认为很大程度上是因为上下文窗口允许你解决新近度的问题......上下文窗口,你可以提供发生的事情......这非常强大。它变得像谷歌一样实时。”
“我认为文本到行动可以通过拥有大量廉价的程序员来理解,对吧?......当每个人都有自己的程序员时会发生什么。”
学生: 你在最开始提到,上下文窗口的扩展、Agent 和文本到行动的结合将产生难以想象的影响。为什么这种结合很重要?它超出了我们所能想象的任何东西吗?
Eric Schmidt: 我认为很大程度上是因为上下文窗口允许你解决新近度的问题。目前的模型需要大约 18 个月来训练,6 个月的准备,6 个月的训练,6 个月的微调。所以它们总是过时的。上下文窗口,你可以提供发生的事情。你可以问它关于哈马斯以色列战争的问题,在一个上下文中。这非常强大。它变得像谷歌一样实时。在 Agent 的情况下,我会举个例子。我成立了一个基金会,该基金会正在资助一个非营利组织。我不知道房间里有没有化学家。我真的不懂化学。有一个叫做 ChemCrow 的工具,C-R-O-W,它是一个基于 LLM 的系统,它学习了化学。他们所做的是运行它来生成关于蛋白质的化学假设,他们有一个实验室,可以连夜运行测试,然后它就会学习。这是化学、材料科学等领域的巨大加速器。所以这是一个 Agent 模型。我认为文本到行动可以通过拥有大量廉价的程序员来理解,对吧?我认为我们不理解会发生什么,当每个人都有自己的程序员时会发生什么。我说的不是打开和关闭灯。我想,另一个例子,出于某种原因你不喜欢谷歌。所以你说,“给我建立一个谷歌的竞争对手”。“搜索网络。构建一个用户界面。写一个好的文案。以一种有趣的方式添加生成式人工智能。在 30 秒内完成,看看它是否有效。” 所以很多人认为,包括谷歌在内的现有企业很容易受到这种攻击。现在,我们拭目以待。
AI 和虚假信息:挑战和解决方案
“这次即将到来的选举和全球范围内的大多数虚假信息都将出现在社交媒体上。而社交媒体公司并没有足够的能力来监管它......我认为我们这里一团糟。”
“我认为我们的社会存在信任问题。民主可能会失败。我认为对民主的最大威胁是虚假信息,因为我们将非常擅长于此。”
“首席执行官们通常都在最大化收入。为了最大化收入,你最大化参与度。为了最大化参与度,你最大化愤怒。算法选择愤怒,因为它能产生更多的收入。因此,存在偏袒疯狂事物的倾向。”
主持人: Slatter 发送过来的一些问题。这里有一个:我们如何阻止人工智能影响公众舆论、虚假信息,尤其是在即将到来的选举期间?短期和长期的解决方案是什么?
Eric Schmidt: 这次即将到来的选举和全球范围内的大多数虚假信息都将出现在社交媒体上。而社交媒体公司并没有足够的能力来监管它。以 TikTok 为例,有很多指控称 TikTok 偏袒某种虚假信息。许多人声称,中国人强迫他们这样做。我认为我们这里一团糟。这个国家将不得不学习批判性思维。这对美国来说可能是一个不可能的挑战。但有人告诉你一些事情并不意味着它是真的。
主持人: 它会走向另一个极端吗?也就是说,有些事情是真的,但没有人再相信了。有些人称之为“认识论危机”。
Eric Schmidt: 你会得到一些人称之为“认识论危机”,现在,你知道,Elon 说,“不,我从未做过那件事。证明一下。” 听着,我认为我们的社会存在信任问题。民主可能会失败。我认为对民主的最大威胁是虚假信息,因为我们将非常擅长于此。当我管理 YouTube 时,我们在 YouTube 上遇到的最大问题是人们会上传虚假视频,人们会因此而死亡。我们有一个零死亡政策。
学生: 令人震惊。
Eric Schmidt: 这只是可怕的,试图解决这个问题。而这是在生成式 AI 之前。我没有一个好的答案。
学生: 一个技术上的方法,是公钥认证。当乔·拜登讲话时,为什么它不像 SSL 那样进行数字签名?或者说,名人或公众人物或其他人,他们不能拥有一个公钥吗?
Eric Schmidt: 是的,这是一种公钥的形式。当我将我的信用卡发送到亚马逊时,我知道它是亚马逊。我写了一篇论文,并与 Jonathan Haidt 一起发表,他就是研究焦虑生成问题的那个人。它完全没有产生任何影响。他是一个非常好的沟通者。我可能不是。所以我得出的结论是,这个系统没有能力做到你说的那样。
主持人: 你写了一篇论文,主张我们做的事情?
Eric Schmidt: 主张你的提议。
主持人: 好吧,我的提议。
Eric Schmidt: 不,你说的。
主持人: 是的,没错。
Eric Schmidt: 我的结论是,首席执行官们通常都在最大化收入。为了最大化收入,你最大化参与度。为了最大化参与度,你最大化愤怒。算法选择愤怒,因为它能产生更多的收入。因此,存在偏袒疯狂事物的倾向。这是一个问题。这在一个民主国家必须得到解决。
TikTok 和内容平衡
“需要某种形式的平衡。”
Eric Schmidt: 我解决 TikTok 的方案,我们之前私下谈过,是我小时候,有一种叫做平等时间规则的东西,因为 TikTok 实际上不是社交媒体。它实际上是电视,对吧?顺便说一句,有一个程序员在让你,这个数字是每天 90 分钟,美国每个 TikTok 用户 200 个 TikTok 视频。很多,对吧?所以政府不会执行平等时间规则,但这是正确的事情。需要某种形式的平衡。
AI 对经济和劳动力市场的影响
“我从根本上相信,大学教育和高技能的任务将会安然无恙,因为人们将与这些系统合作......危险的工作和需要很少人类判断的工作将被取代。”
主持人: 好的,让我们从学生那里得到更多的问题。有两个简短的问题。一个,LLM 的经济影响。
学生: 较慢的,比如,市场影响。较慢的。你最初预计 CHEG 和一些服务人员。然后第二个,你认为学术界应该得到 AI 补贴吗?或者你认为他们应该与外面的大公司合作?
Eric Schmidt: 我非常努力地推动为大学建立数据中心。如果我是这里计算机科学系的教员,我会非常沮丧,因为我不能和我的研究生一起构建能够进行博士研究的那种算法。我被迫与这些公司合作。在我看来,这些公司在这方面还不够慷慨。我与之交谈的教员,他们花了很多时间等待来自 Google Cloud 的积分。这太糟糕了。这是一场我们希望美国获胜的爆炸。我们想要美国大学。有很多理由认为,正确的事情是将它交给他们。所以我在努力解决这个问题。你的第一个问题是劳动力市场的影响。我会把它交给这方面的真正专家。作为 Eric 教你们的业余经济学家,我从根本上相信,大学教育和高技能的任务将会安然无恙,因为人们将与这些系统合作。我认为这个系统与任何其他的技术浪潮没有什么不同。危险的工作和需要很少人类判断的工作将被取代。
AI 时代的计算机科学教育 (续)
"它变得像谷歌一样实时......所以这是一个 Agent 模型。"
学生: 你在最开始提到的上下文窗口扩展、Agent 和文本到行动的结合将产生难以想象的影响。为什么这种结合很重要?它超出了我们所能想象的任何东西吗?
Eric Schmidt: 我认为很大程度上是因为上下文窗口允许你解决新近度的问题。目前的模型需要大约 18 个月来训练,6 个月的准备,6 个月的训练,6 个月的微调。所以它们总是过时的。上下文窗口,你可以提供发生的事情。你可以问它关于哈马斯以色列战争的问题,在一个上下文中。这非常强大。它变得像谷歌一样实时。在 Agent 的情况下,我会举个例子。我成立了一个基金会,该基金会正在资助一个非营利组织。我不知道房间里有没有化学家。我真的不懂化学。有一个叫做 ChemCrow 的工具,C-R-O-W,它是一个基于 LLM 的系统,它学习了化学。他们所做的是运行它来生成关于蛋白质的化学假设,他们有一个实验室,可以连夜运行测试,然后它就会学习。这是化学、材料科学等领域的巨大加速器。所以这是一个 Agent 模型。我认为文本到行动可以通过拥有大量廉价的程序员来理解,对吧?我认为我们不理解会发生什么,当每个人都有自己的程序员时会发生什么。我说的不是打开和关闭灯。我想,另一个例子,出于某种原因你不喜欢谷歌。所以你说,“给我建立一个谷歌的竞争对手”。“搜索网络。构建一个用户界面。写一个好的文案。以一种有趣的方式添加生成式人工智能。在 30 秒内完成,看看它是否有效。” 所以很多人认为,包括谷歌在内的现有企业很容易受到这种攻击。现在,我们拭目以待。
学生: 我对文本到行动及其对计算机科学教育的影响非常好奇。计算机科学教育应该如何转变以适应人工智能时代?
Eric Schmidt: 我假设作为本科生的计算机科学家们将永远有一个程序员伙伴陪伴着他们。所以当你学习你的第一个 for 循环等等时,你将拥有一个工具,它将成为你的天然伙伴。这就是教学将如何进行的方式。教授,他或她将谈论这些概念,但你将以这种方式参与其中。这就是我的猜测。
AI 的未来:持续的创新和发展 (续)
非 Transformer 架构
"它与此类似,但数学不同。"
学生: 你可以详细谈谈你感到兴奋的非 Transformer 架构吗?
Eric Schmidt: 我不太懂数学。我很高兴我们为数学家创造了工作机会,因为这里的数学非常复杂,但基本上它们是进行梯度下降、矩阵乘法的不同方式,更快更好。Transformer,如你所知,是一种同时进行乘法的系统方式。它与此类似,但数学不同。
AI 和国家竞争
"事实是,这是一场富国的游戏......他们将不得不与其他人合作,诸如此类。"
学生: 所有这些将如何影响那些没有参与前沿模型开发和没有计算资源的国家?
Eric Schmidt: 富人越来越富,穷人尽其所能。事实是,这是一场富国的游戏,对吧?巨额资本,大量的技术人才,强大的政府支持。有很多其他国家,他们没有这些资源,他们将不得不找到一个合作伙伴,与其他人合作。
AI 与组织创新 (续)
对年轻人的建议
"我被你建立新想法演示的速度所震撼......但我认为用这些工具尽快制作你的想法的原型是非常重要的,因为你可以肯定,在另一家公司,另一所大学,一个你从未去过的地方,还有另一个人正在做同样的事情。"
主持人: 上次我们见面时,你参加了 AGI House 的黑客马拉松,我知道你花了很多时间帮助年轻人,你对这里的人们在他们建立自己的商业计划书,或者政策建议,或者研究建议时,有什么建议吗?
Eric Schmidt: 我在商学院教授一门关于这个的课程,你们应该来上我的课。我被你建立新想法演示的速度所震撼。在我参加的一次黑客马拉松中,获胜团队的命令是“在两座塔之间驾驶无人机”,并且给它一个虚拟的无人机空间。它弄清楚了如何驾驶无人机,“之间”这个词是什么意思,用 Python 生成了代码,并在模拟器中驾驶无人机飞过了塔楼。这需要一两个星期的时间才能完成,而且还需要优秀的专业程序员。我告诉你,快速制作原型的能力... 成为企业家的部分问题是,一切都发生得更快。如果你不能在一天内使用这些工具构建你的原型,你需要考虑一下,因为这就是你的竞争对手正在做的事情。我最大的建议是,当你开始考虑一家公司时,写一份商业计划书是可以的。事实上,你应该让电脑帮你写商业计划书,只要它是合法的。但我认为用这些工具尽快制作你的想法的原型是非常重要的,因为你可以肯定,在另一家公司,另一所大学,一个你从未去过的地方,还有另一个人正在做同样的事情。
主持人对使用 LLM 的说明
"这在课堂上是受欢迎的,对于作业来说,但它必须让你完全公开......就像你向你的友好叔叔或同学或其他任何人寻求建议一样,你应该这样做,或者如果你在其中包含了笔记。"
主持人: 好的。非常感谢,Eric。谢谢大家。我要赶快走了。所以,让我接着他最后一点来说,因为我认为我没有在第一节课上谈论使用 LLM,这在课堂上是受欢迎的,对于作业来说,但它必须让你完全公开。所以,当你使用它们时,无论是用于每周作业还是用于最终项目,或者其他什么,就像你向你的友好叔叔或同学或其他任何人寻求建议一样,你应该这样做,或者如果你在其中包含了笔记。我打算做的是,我想谈谈 AI 作为 GPT,以及它在商业和影响方面意味着什么。但在我们这样做之前,我只想看看你是否有什么问题想继续 Eric 提出的问题,我们可以谈谈出现的问题,然后我们可以继续。
关于 AI 监管的讨论
"肯定有一些地方,监管可以帮助公司,帮助一个行业生存......标准就是一个很好的例子,明确这一点可以使公司更容易竞争。"
学生: 我想问的一个问题是关于监管的,如果目标是保持霸权,你如何创造正确的激励措施,让每个人,盟友和非盟友,都有动力去遵守它?
主持人: 你是指在相互竞争的公司之间?
学生: 公司在国家,美国和欧盟,它不会成为一种阻碍或阻碍那些选择遵守法规的公司的发展?
主持人: 这非常棘手。Mary Meeker 写了一本关于这个的书,叫做《合作竞争》,因为肯定有一些地方,监管可以帮助公司,帮助一个行业生存。所以监管不一定 会减缓发展。我的意思是,标准就是一个很好的例子,明确这一点可以使公司更容易竞争。所以我与这些公司的许多高管交谈过,他们希望在某些地方有一些共同的标准,有时在一些危险的事情上也会出现逐底竞争。谷歌的人说他们没有更快行动的另一个原因是,他们觉得这些 LLM 可能会被滥用或危险,但他们的手被迫了。我正在与另一家大公司的一些人交谈,他们说:“我们不打算发布这个功能,但现在竞争对手正在这样做,所以我们也必须发布它。” 所以这就是监管,可能有一些人有兴趣协调监管,但也显然,更明显的是,它被用来阻碍竞争,很多人认为一些大公司非常反对一些开源,让事情更广泛地开源,是因为他们想减缓竞争对手的速度。所以这两件事都在发生。
AI 对编码技能的影响
"看起来它们对真正最好的程序员并没有那么大的帮助......但如果你对编码一无所知,它们也没有帮助。所以这有点像一个倒 U 型。"
学生: 我只想跟进一条评论,关于我们是否应该继续学习编码?我们是否应该继续学习英语?那些还有用吗?Eric 的回答是,是的,像受过大学教育的高技能工作或任务仍然是安全的,但其他所有需要图像编辑的工作可能就不安全了。
主持人: 这有点像一个有趣的问题。想想人工智能系统只是取代人们正在做的事情,而不是补充它们,这很有趣。在现在的编码中,看起来它们对真正最好的程序员并没有那么大的帮助。它们对中等水平的程序员非常有帮助。但如果你对编码一无所知,它们也没有帮助。所以这有点像一个倒 U 型。你可以明白为什么会这样,因为你甚至不理解他们现在生成的代码,这些代码通常是有 bug 的,或者不完全正确。所以如果你甚至不能解释和理解发生了什么,你就不能非常有效地使用它。就目前而言,对于最优秀的程序员来说,看起来生成的代码还没有达到那个水平,所以你得到了那个 U 型。但这意味着如果你不懂任何代码,你需要懂一些代码才能让它发挥作用。我认为这对现在的很多应用程序来说都是如此,你必须有一些基本的了解才能最大限度地利用它。我认为这是否会一直如此是一个有趣的开放性问题。
AI 的发展阶段和对不同任务的影响
"如果有人想做一个研究项目,或者你们现在有什么想法,经济中哪些类型的工作会处于中间地带,这会很有趣?......那将是一个你可以拥有更高的生产力、更多的财富和绩效,但也更有可能拥有共同繁荣的地带,因为劳动力本质上是分布式的,而正如 Eric 刚才所说,技术和资本可能会非常集中。"
主持人: 我在上一节课上简要地展示了这张幻灯片,上面有 0 到 5 级的自动驾驶汽车。实际上,我们现在可以谈谈的一件事是,如果你采用这种范式并将其应用于经济中的所有任务,会怎么样?比如它们会经历多少级?所以对于自动驾驶汽车,我们并没有真正达到 5 级,尽管我不知道你们中有多少人乘坐过 Waymo 的汽车。所以那辆车看起来还不错,尽管 Sebastian Thrun 说它现在非常昂贵。他们可能每英里损失 50 到 100 美元。他不知道,他不在那里。他启动了这个项目,但他已经不在了。但是仅仅是运行它的所有成本,它是不切实际的。也许它会沿着曲线下降。激光雷达会变得更便宜,但我们有很多 2 级、3 级,甚至可以说是 4 级的自动驾驶汽车,人类仍然参与其中。你会看到很多其他任务,比如编码。我刚才谈到了这一点。另一方面,国际象棋,我谈到了有时被称为高级国际象棋或自由式国际象棋。当加里·卡斯帕罗夫在 1998 年,97 年输给深蓝之后,他开始了一系列比赛,人类和机器可以一起工作。很长一段时间,当我在 2012 年,2013 年做 TED 演讲时,这是真的,一个人与一台机器合作可以击败深蓝或任何国际象棋计算机。所以最好的国际象棋比赛实体是这些组合。现在不再是这样了。AlphaZero 和其他类似的程序,它们不会从人类的贡献中获得任何东西,只是对国际象棋机器的一种干扰。所以在 20 年左右的时间里,它经历了 0 级,机器无法做任何事情,到一个它们一起工作的时期,再到一个完全自主的时期。如果有人想做一个研究项目,或者你们现在有什么想法,经济中哪些类型的工作会处于中间地带,这会很有趣?因为中间地带对我们人类来说是一个很好的地带,机器在帮助我们,但人类仍然是创造价值不可或缺的一部分,那将是一个你可以拥有更高的生产力、更多的财富和绩效,但也更有可能拥有共同繁荣的地带,因为劳动力本质上是分布式的,而技术和资本可能会非常集中。
AI 芯片制造与就业
"所以它基本上是熄灯的......所以这是一个相当劳动密集型的,我想。美国制造业的产出正在激增,但在就业方面,并没有真正增长多少。"
学生: 你对此有什么想法?我只是想问一个相关的问题。他还说,我们在芯片制造方面拥有 10 年的优势。我认为对我这个劳动力经济学家来说,有趣的是,如果我们在美国生产所有这些芯片,这难道不会在某种程度上复苏蓝领工作吗?我想知道你对智能机器人模型或人类劳动力有什么看法。
主持人: 嗯,我不认为这会是很大程度上,你们中有多少人参观过芯片制造厂,有人吗?那个制造厂有多少工人?答案是零。因为我们人类太笨拙,太脏,所以它都是机器人化的。它被密封在里面。如果一个机器人像摔倒了或者出了什么问题,他们必须穿上,你可能见过这些像,它们看起来像宇航服,他们必须进去,然后他们可能调整一些东西,然后他们再出去,希望他们没有破坏任何东西。所以它基本上是熄灯的。有一些更复杂的劳动力需要,我不认为它是像蓝领研究。事实上,苹果将 MacBook 生产线迁回德克萨斯州的原因之一不是因为德克萨斯州的劳动力很便宜,而是因为他们不再需要大量的劳动力了。美国制造业的产出正在激增,但在就业方面,并没有真正增长多少。
AI Agent 和文本到行动模型的爆发
"吴恩达有一个很好的方式来描述它,就像你们知道的,如果你有一个 LLM,我不知道,写一篇文章什么的,它一次写一个词,它就一遍写完这篇文章......Agent 现在会说,好吧,先做一个提纲。这是你写文章时要做的第一步。然后,你知道,填写每个段落,然后回去看看流程是否正确。现在回去检查一下语气。这是否适合我们的读者?现在,你知道,通过这样的迭代,你可以写出一篇更好得多的文章,或者完成任何类型的任务。这是一场真正的革命。”
"这些上下文窗口现在看起来非常有效......它打开了一系列我们以前没有的能力,包括让事情变得更加实时。”
学生: 你认为 Agent 或文本到行动模型在明年会出现一个拐点吗?
主持人: 哦,是的。他说的是 Eric,我听到了类似的说法。今天早些时候,我和吴恩达谈过,他一直在敲打这个鼓,尤其是关于 Agent,认为 Agent 是 2024 年的浪潮。吴恩达有一个很好的方式来描述它:如果你有一个 LLM,写一篇文章,它一次写一个词,它就一遍写完这篇文章。但想象一下,如果你没有退格键,没有机会先做一个提纲,你就这样写下去。Agent 现在会说,先做一个提纲。然后,填写每个段落,然后回去看看流程是否正确。现在回去检查一下语气。通过这样的迭代,你可以写出一篇更好得多的文章,或者完成任何类型的任务。这是一场真正的革命。如果你这样做,所有的事情你都可以做得更好。然后关于上下文窗口的事情也非常重要。我将引用我认识的一些聪明人的话。Eric Horvitz,我与他一起参加了 GSB 的一个小组讨论。他有一个很好的分类法。他说,实际上有三种方法可以让你定制一个模型:一种是你可以在微调它,这基本上是再训练它;另一种是使用越来越大的上下文窗口;第三种是使用 RAG 或类似的技术,即检索增强生成,它会去访问外部数据。但是这些上下文窗口现在看起来非常有效。我猜,正如 Eric 所说,我们认为这很难。但出于某种原因,我们能够制造出更大得多的窗口。现在,你可以加载一整本书或一整套书,你可以加载所有类型的信息。这可以给你所有相关的上下文。所以这是一场相当大的革命。它打开了一系列我们以前没有的能力,包括让事情变得更加实时,正如 Eric 所说。
AI 投资的驱动因素
"现在,我们似乎正处于一个有很多机会的时代,人们正在认识到这一点......所以在这个领域接受过培训的人正在做出贡献,这些贡献通常比他们在其他一些领域做出的贡献要大得多,而且速度更快。"
学生: 肯定有更多的资本进入,但为什么所有这些资本都流向了那里而不是其他地方?我认为,如果你看看历史的轨迹,有时它看起来很平滑,但如果你仔细观察,会发现很多跳跃。有一些重大的发明和一些较小的发明。Andrej Karpathy 说他一直在摆弄物理学。为了在物理学上取得真正的进步,成为一名顶尖的物理学家,你必须非常聪明,学习很多东西。也许如果你幸运的话,你可以做出一些小的增量贡献,有些人做到了。但他说,现在在人工智能机器学习领域,我们似乎正处于一个有很多唾手可得的果实的时代,已经有一些突破了。与其耗尽这个空间,比如把一棵树上的所有果实都摘下来,不如说是组合学。在第二机械中,他们谈论的是积木。当你把两块积木放在一起,或者乐高积木,你可以做出越来越多。现在,我们似乎正处于一个有很多机会的时代,人们正在认识到这一点。发现,一个发现导致另一个发现,导致另一个机会。正因为如此,它吸引了投资。更多的人参与进来。在经济学中,有时当投入更多的资源时,你会得到递减的回报,比如在农业或采矿业。在其他地方,回报是递增的。越来越多的工程师来到硅谷,这使得现有的工程师更有价值,而不是更没有价值。我们似乎正处于一个正在发生这种情况的时代。然后,额外的投资,额外的训练资金,所有这些都使它们越来越强大。我不知道这种情况会持续多久,但看起来有些技术进入了这个真正肥沃的时期,并且有正反馈和一些帮助。我们现在似乎正处于这样的时期。所以在这个领域接受过培训的人正在做出贡献,这些贡献通常比他们在其他一些领域做出的贡献要大得多,而且速度更快。
AI 素养的重要性
"现在每个人都在努力更好地理解它......但随后思考其影响。我认为这就是一些最大的回报所在。"
学生: 并非每个人都能坐在一个房间里,就人工智能进行所有这些讨论和辩论。我想了解你对非技术利益相关者的人工智能素养的看法,你是如何考虑解释技术基础知识与讨论不一定有正确答案的抽象含义的?
主持人: 这很难。我必须说,最近在国会和其他地方的人们对这个话题的关注程度发生了翻天覆地的变化。它曾经不是他们感兴趣的东西。现在每个人都在努力更好地理解它。我认为有很多方面人们可以做出贡献。他们可以在技术方面做出贡献。但如果说有什么区别的话,我敢打赌,商业和经济方面才是目前更大的瓶颈。也就是说,如果你在技术方面做出了巨大的贡献,但在将其转化为能够改变政策的东西方面仍然存在差距。所以,如果你对政治学或政治感兴趣,了解它对民主、对错误信息和权力、对集中的影响。这些都是人们还没有很好理解的事情。我不知道一个计算机科学家是否一定是试图理解这一点的合适人选。但是,要充分了解这项技术,这样你就知道什么是可能的。然后思考像亨利·基辛格在他的书中与埃里克·施密特所做的那样的动态。如果你是一个经济学家,思考劳动力市场的影响,对集中的影响,对不平等和工作的影响,对生产力和什么驱动生产力的影响。这些都是现在非常成熟的东西。你可以浏览很多不同的领域,充分了解这项技术可能的能力,但随后思考其影响。我认为这就是一些最大的回报所在。
电力与 AI:通用技术的启示
"电力也是一项通用技术。通用技术具有这样的特点,它们本身就是其中的一部分。但是通用技术的真正力量之一,正如我所说的 GPT,是它们提供了补充,它们点燃了补充创新...人们没有充分意识到的一件事是,一些最重要的补充创新是组织和人力资本的互补性。"
主持人: 让我给你一个更具体的例子。电力也是一项通用技术。通用技术具有这样的特点,它们本身就是其中的一部分。但是通用技术的真正力量之一,正如我所说的 GPT,是它们提供了补充,它们点燃了补充创新。所以电力,灯泡和计算机和电动机,电动机给了你压缩机和冰箱和空调。你可以从这项创新中获得一整套级联的额外创新。大部分价值来自于这些补充创新。人们没有充分意识到的一件事是,一些最重要的补充创新是组织和人力资本的互补性。所以对于电力,当他们第一次将电力引入工厂时,斯坦福大学的 Paul David 研究了这些工厂发生了什么。令人惊讶的是,变化不大。当工厂开始电气化时,它们的生产效率并没有明显高于以前由蒸汽机驱动的工厂。他说,嗯,这有点奇怪,因为这看起来像一项相当重要的技术。这仅仅是一种时尚吗?显然不是。电力之前的工厂是由蒸汽机驱动的。它们通常在中间有一个很大的蒸汽机,然后是曲轴和滑轮,为所有设备提供动力。而且它都是分布式的。但你试图让它尽可能地靠近蒸汽机,因为如果曲轴太长,它就会因扭转而断裂。当他们引入电力时,他发现在一个又一个工厂里,他们会把蒸汽机拆下来,然后找到他们能找到的最大的电动机,把它放在蒸汽机曾经所在的地方,然后启动它。但你知道,这并没有真正改变多少生产。你可以看到,这没什么大不了的。所以然后他们开始在一个新的地方从头开始建造全新的工厂。那些工厂是什么样子的?就像旧工厂一样。他们会采用相同的模式。一些工程师会制作一张蓝图,也许把它拿过来,在蒸汽机所在的地方画一个大大的 X,不,不,把电动机放在这里。然后他们会去建造一个全新的工厂。同样,生产效率没有很大的提高。大约过了 30 年,我们才开始看到一种根本不同的工厂,在这种工厂里,不再使用中央电源,而使用分布式电源,因为电动机,你可以把它们做大,你可以把它们做中等大小,你可以把它们做得非常非常小。你可以让它们以不同的方式连接在一起。所以他们开始让每台设备都有一个独立的电机,而不是一个大的电机。他们称之为单元驱动,而不是组驱动。我去哈佛商学院贝克图书馆阅读了大约 1914 年的书籍。这是一场关于单元驱动与组驱动的辩论。嗯,当他们开始这样做时,他们就有了新的工厂布局,通常是在一层楼上,机器的摆放不是根据它需要多少电力,而是根据其他一些东西,材料的流动。你开始有了这些流水线系统。这导致了生产效率的巨大提高,比如生产效率翻了一番或在某些情况下翻了三倍。所以教训不是电力是一种时尚或失败,被过度炒作了。电力是一项具有根本价值的技术。但直到他们有了流程创新,有了重新思考如何进行生产的组织创新,你才获得了巨大的回报。有很多这样的故事。我只告诉你其中一个。在一些书籍和文章中,如果你看看蒸汽机和其他东西,你会发现类似的代际滞后,几十年后人们才意识到这项技术可以让你做一些与你过去完全不同的事情。我认为人工智能在某些方面有点像这样,将会发生很多组织创新,将会出现新的商业模式,新的组织经济的方式,这是我们以前没有想到的。现在,人们大多只是在改造。我可以列举一整套其他的技能变化,这些变化是互补的。我不知道它们是什么。你必须有创造力才能想到它们。但这就是差距所在。在早期计算机的例子中,如果你看一下投资的规模,对组织资本和人力资本的投资实际上是硬件和软件的 10 倍。所以这非常大。话虽如此,我愿意调整我对这一点的看法,因为 ChatGPT 和其他一些工具,它们的采用速度非常快,而且它们能够更快地改变事物,部分原因是你不需要在同样的程度上学习 Python。你可以用英语做很多事情。而且你可以在现有组织的基础上获得很多价值。所以有些事情发生得更快。在你们可能为这里的阅读材料读过的一些论文中,我们很快就获得了 15%、20%、30% 的生产力提高。但我怀疑,一旦人们发现了这些互补的创新,它将会更大。所以这是一个很长的回答你关于它的问题。不仅仅是技术技能。它是要弄清楚所有其他的东西,所有重新思考事情的方式。所以你们这些在商学院或经济学领域的人,现在有很多机会可以重新思考你们的领域,因为你们已经获得了这套惊人的技术。
AI 和技术发展速度
"技术发展速度很快,但其对社会的影响需要更长时间才能显现......但可能需要几十年才能完全实现。"
学生: 看起来你对转型的速度比 Eric 更谨慎。我说得对吗?
主持人: 嗯,所以我要区分两件事。我会 defer 他和其他人在技术方面的意见。有些人和他一样乐观,甚至在技术方面更乐观。也有人不那么乐观。但仅仅靠技术是不足以创造生产力的。所以你可以拥有一项惊人的技术,然后也许人们只是没有找到一种有效的方法来使用它。另一个可能是监管方面的原因。我的一些计算机科学同事引入并开发了更好的放射学系统来读取医学图像。它们没有被采用是因为文化原因,人们只是不想要它们,而且有安全方面的原因。当我分析哪些任务我可以提供最大的帮助,哪些职业受影响最大时,我惊讶地发现,航空公司飞行员排在最前面。但我认为很多人会觉得不舒服,因为飞行员没有和你一起坠毁。所以他们有点,你想让里面有人类。所以有很多不同的东西可能会大大减缓它的速度。我认为这是我们需要意识到的。如果我们能够解决这些瓶颈,这可能比仅仅研究技术本身更有助于提高生产力。
大学在 AI 研究中的角色
"也许大学在这些研究中具有竞争优势,这不是训练价值数百亿美元的模型,而是创新新的算法,比如 Transformer 之后的任何东西,还有很多其他的方法,人们可以做出贡献。所以也许有一点分工。"
学生: Eric 对大学的数据中心发表了一番有趣的评论。我本来想问他,为什么他不自己写一张支票?有点像,大学生态系统的作用是什么?
主持人: 我认为如果能有更多的资金就好了。联邦政府有一个叫做国家人工智能资源的东西,它提供了一些帮助,但它只有几百万美元,几千万美元,而不是几十亿美元,更不用说几千亿美元了。尽管 Eric 在课前提到,他们正在研究一些可能更大得多的东西。这是为了训练这些真正的大型模型。我曾经和 Geoffrey Hinton 进行过一次非常有趣的对话。Geoffrey Hinton,如你所知,是深度学习的教父之一。我问他,他发现哪种硬件对他做研究最有用。他坐在他的笔记本电脑前,轻轻地拍了拍他的 MacBook。这让我想到,还有一整套其他的研究,也许大学在这些研究中具有竞争优势,这不是训练价值数百亿美元的模型,而是创新新的算法,比如 Transformer 之后的任何东西,还有很多其他的方法,人们可以做出贡献。所以也许有一点分工。我完全支持我的同事们要求更多的 GPU 预算,但这并不总是学者们能够做出最大贡献的地方。有些贡献来自于想法和新的思考方式,新的方法。这可能就是我们拥有优势的地方。我上周与 Sendhil Mullainathan 共进晚餐。他刚刚从芝加哥搬到麻省理工学院。我们在谈论大学的比较优势是什么?他举了一个例子,耐心是其中之一,大学里有些人正在做非常长期的项目。有些人正在研究核聚变,他们研究核聚变已经很长时间了,不是因为他们会得到很多钱,可能来自于建造一个核聚变发电厂,甚至 20 年后。我不知道核聚变要多久。但这只是一些人们愿意做的事情,即使时间线更长一些。公司很难负担得起这种时间线。所以大学可以做什么,在比较优势或分工方面存在差异。
AI 的未来方向:架构创新 vs. 摩尔定律
“所有这三个方面,我想我听到 Eric 说所有这三个方面都很重要......但不要忽视,这最后一个,比如新的架构,所有这三个方面,我认为都很重要。”
学生: 我叫 Kevin。我想知道人工智能的新兴能力。看起来 Eric 更倾向于架构差异和设计更好的模型,而不是我们上一节课讨论的摩尔定律。你是如何排序的...
主持人: 他说了所有三个方面。你们还记得缩放定律吗?它有三个部分:更多的计算,更多的数据和算法改进,包括更多的参数。我想我听到 Eric 说所有这三个方面都很重要。但不要忽视,这最后一个,比如新的架构,所有这三个方面,我认为都很重要。我们离 AGI 类型的系统还有多远?所以 Eric 不认为我们离 AGI 类型的系统那么近。你知道,事实上,那是一个... 我本来想问他这个问题,但我们没时间了。听到他描述一下就好了。但当我跟他聊天时,它并不是一个定义那么清晰的东西。在某些方面,AGI 已经存在了。Peter Norvig 写了一篇名为《AGI 已经存在》的文章。我想如果没有的话,我会把它放进去。这是一篇 Blaise Agüera y Arcas 合著的有趣的小文章。很多 20 年前人们会说,这就是 AGI 的东西。这就是 LLM 正在做的事情。可能做得不是很好,但它在以一种更通用的方式解决问题。另一方面,很明显,它们在很多方面都比人类做得差得多。讽刺的是,体力任务是人类目前具有比较优势的任务之一。你们可能知道莫拉维克悖论。Hans Moravec 指出,通常情况下,一个三四岁的孩子可以做的事情,比如系扣子或上楼梯,很难让机器做到。而很多博士很难做的事情,比如解决凸优化问题,机器却常常很擅长。所以它并不完全是人类容易做的事情,而计算机却很难做,而另一些事情是人类很难做的事情,而计算机却很容易做。它们不像同一个尺度。下周我们将邀请 Mira Murati,OpenAI 的首席技术官,短暂担任 OpenAI 的首席执行官。所以带着你们的问题来问她。
数据版权和 AI 训练
"将会发生很多诉讼,然后会达成某种规定的协议...去查一下。"
学生: 所以我知道在 GQ 被《纽约时报》曝光将他们的作品用于训练之后,你认为这件事会走向何方,这对数据处理意味着什么?
主持人: 我曾经做过很多关于音乐授权的工作。我了解到,在 60 年代,发生了一系列诉讼,导致了一项协议,即每当你的歌曲被播放时,你都会获得一笔规定的版税。即使他们不知道你是谁。它只是被存入了一家银行。我的猜测是,它也会是一样的。将会发生很多诉讼,然后会达成某种规定的协议,它只会说你必须支付你收入的 X%,以便使用 ASCAP BMI。ASCAP BMI。去查一下。它很长。这对你们来说可能很古老,但我认为这就是它的解决方式。
AI 与反垄断
"你看到这些大型公司占据主导地位的原因是,谁有资本来建造这些数据中心,对吧?"
学生: 是的,先生。看起来有几家公司正在主导人工智能,而且他们将继续主导。而且他们似乎与所有反垄断监管都关注的大型公司重叠。你认为监管机构会拆分这些公司吗?这将如何影响...
主持人: 在我的职业生涯中,我帮助微软拆分了,它并没有被拆分。我还努力争取让谷歌不被拆分,它也没有被拆分。所以在我看来,趋势是不会被拆分的。只要这些公司避免成为老约翰·D·洛克菲勒。我研究过这个。这就是反垄断法产生的原因。我不认为政府会采取行动... 你看到这些大型公司占据主导地位的原因是,谁有资本来建造这些数据中心,对吧?所以我的朋友 Reid 和我的朋友 Mustafa... 他下周会来。让 Reid 跟你谈谈他们做出的决定,将 Inflection 基本上拆分到微软。基本上,他们决定他们无法筹集到数百亿美元。
学生: 你之前提到的那个数字是公开的吗?
主持人: 不是。让 Reid 告诉你这个数字。也许 Reid 可以说出来。我知道你该走了。我不想耽误你。我们再回答一个问题?
学生: 非常感谢。我想知道所有这些将如何影响那些没有参与前沿模型开发和没有计算资源的国家,例如。
Eric Schmidt: 富人越来越富,穷人尽其所能。事实是,这是一场富国的游戏,对吧?巨额资本,大量的技术人才,强大的政府支持。有很多其他国家,他们没有这些资源。他们将不得不找到一个合作伙伴。他们将不得不与其他人合作,诸如此类。
主持人: 好的。非常感谢,Eric。谢谢大家。