11月4日,最新的访谈,OpenAI 的 CEO Sam Altman 与 20VC 的 Harry Stebbings 深入讨论了 OpenAI 的未来发展方向、AI 代理的潜力、开源与商业模式、模型的规模法则及局限性、人才战略、领导力反思以及对未来 AI 格局的展望等。展现了 Sam Altman 对 AI 发展趋势的深刻洞察和 OpenAI 的清晰战略规划。
我看完访谈后,干满满,现在列出来大家一直都关心的问题,访谈中都有解答:
GPT-4之后,OpenAI要憋什么大招?
主持人: 大家好!欢迎来到 OpenAI 开发者日!我是 Harry Stebbings,来自 20VC。今天很荣幸能采访 Sam Altman。Sam,欢迎你!非常感谢你接受我的采访。
Sam Altman: 谢谢你的邀请。
主持人: 我们收到了很多观众的提问,所以我想直接从这些问题开始。展望未来,OpenAI 的发展方向是会推出更多像 GPT-3.5 这样的模型,还是会朝着更大、更强的模型发展?
Sam Altman: 我们会全方位改进模型,但推理能力是我们目前最重要的战略方向。我认为强大的推理能力将解锁许多我们期待已久的功能,比如让 AI 为科学研究做出贡献,编写高度复杂的代码,从而极大地推动社会进步。大家可以期待 GPT 系列模型的快速迭代和改进,这将是我们未来工作的重中之重。
主持人: 另一个重要的问题是,OpenAI 未来是否会为非技术人员开发无代码工具,让他们也能轻松构建和扩展 AI 应用?
Sam Altman: 毫无疑问,这将会实现。我认为第一步是先让程序员的工作效率更高,但最终,我们将提供高质量的无代码工具。现在市面上已经有一些无代码工具,但它们还不足以让你仅凭无代码就创建出一家完整的初创公司。要达到那样的水平还需要一段时间。
主持人: OpenAI 在当前的技术栈中占据着特殊的位置。OpenAI 未来会涉足技术栈的哪些部分?如果一个创业公司花费大量时间优化自己的系统,这是否是一种资源浪费,因为最终 OpenAI 可能会主导应用层?创始人应该如何看待这个问题?
Sam Altman: 我们的目标是不断改进我们的模型。如果你的业务只是为了弥补现有模型的一些小缺陷,那么当我们的模型足够强大,不再存在这些缺陷时,你的业务可能就失去了价值。但如果你构建的业务能够从模型的持续改进中受益,那么这将会是一个巨大的机会。想象一下,如果有人告诉你 GPT-4 将会非常强大,能够做到现在看起来不可能的事情,那么你就会从长远角度来规划你的业务。
主持人: 之前我们采访过 Brad Gerstner(风险投资人),你当时提到,对于某些细分市场,OpenAI 的发展可能会对他们产生影响。从创始人的角度来看,哪些公司可能会被 OpenAI "碾压",哪些公司不会?作为投资者,应该如何看待这个问题?
Sam Altman: AI 将创造数万亿美元的价值,它将催生全新的产品和服务,让以前不可能或不切实际的事情成为现实。在某些领域,我们希望模型足够强大,让你无需费力就能实现目标。但在其他领域,通过构建卓越的产品和服务,这项新技术将变得更加强大。
早期,大约 95% 的初创公司似乎都在赌模型不会变得更好,这让我感到惊讶(现在已经不惊讶了)。当时 GPT-3.5 刚刚推出,而我们已经看到了 GPT-4 的潜力,我们知道它将会非常强大。如果你构建的工具只是为了弥补模型的缺陷,那么随着模型的改进,这个缺陷会变得越来越无关紧要。
我们常常忘记几年前模型的表现有多差。当时,人们更倾向于开发弥补模型缺陷的产品,而不是去构建像 AI 教师或 AI 医疗顾问这样更具变革性的产品。
我感觉当时 95% 的人都在赌模型不会改进,只有 5% 的人相信模型会变得更好。现在情况已经反过来了,人们已经理解了改进的速度,也了解了我们的发展方向。所以这个问题已经不再那么突出了,但曾经是我们非常担心的,因为我们预见到那些努力的公司可能会面临困境。
主持人: 你提到了数万亿美元的价值创造。孙正义(软银集团创始人兼首席执行官)曾表示,AI 每年将创造 9 万亿美元的价值,这将抵消他认为所需的 9 万亿美元的资本支出。你对这个观点怎么看?
Sam Altman: 我无法精确估计具体的数字。如果我们能大致估算出数量级就已经足够了。显然,这需要大量的资本支出,也显然会创造巨大的价值。每一次重大的技术革命都是如此,而 AI 显然是其中之一。明年对我们来说将是关键的一年,我们将进入下一代 AI 系统的时代。
你提到了无代码软件代理的开发,我不知道这需要多长时间,但如果我们想象一下,如果每个人都能轻松描述他们需要的整套企业级软件,这将为世界解锁多少经济价值?现在这还无法实现,但当我们达到这个目标时,想象一下这种价值将会有多大。如果你保持同样的价值产出,但让它变得更便捷、成本更低,这将产生巨大的影响。我认为我们将会看到很多类似的例子。医疗和教育领域也是如此,它们都代表着数万亿美元的市场。如果 AI 能够在这些领域推动新的解决方案,我认为具体的数字并不重要,重要的是它确实会创造难以置信的价值。
主持人: 我们来谈谈开源。你如何看待开源在 AI 未来中的角色?在讨论是否应该开源某些模型时,OpenAI 内部是如何讨论的?
Sam Altman: 开源模型在 AI 生态系统中扮演着重要的角色。现在已经有一些优秀的开源模型。我认为同时提供优质服务和 API 也非常重要。我觉得所有这些东西作为一个产品组合是有意义的,人们可以选择最适合他们的方式。
主持人: 除了开源,我们还可以通过代理向客户提供服务。你如何定义“代理”?在你看来,代理是什么,不是什么?
Sam Altman:我认为代理是可以执行较长时间任务,并且在执行过程中几乎不需要监督的程序。
主持人: 你认为人们对代理的理解存在误区吗?
Sam Altman: 我觉得与其说是误解,不如说是我们还没有真正理解代理在未来世界中的作用。人们经常举的例子是让 AI 代理帮忙预订餐厅,它可以使用 OpenTable 或直接打电话给餐厅。这确实可以节省一些时间,但我觉得更有趣的是,代理可以做一些人类无法做到的事情。比如,我的代理可以同时联系 300 家餐厅,找出最适合我的菜品,或者提供特殊服务的餐厅。对人类来说,这几乎不可能,但如果代理之间都是 AI,它们可以并行处理,这个问题就不存在了。虽然这个例子很简单,但它展示了代理可以超越人类带宽的限制。
更有趣的代理不是帮你预订餐厅,而是像一个非常聪明的资深同事,你可以和它一起完成一个项目,它可以独立完成一个需要两天甚至两周的任务,只有在遇到问题时才会联系你,并最终呈现出一个 excellent 的成果。
主持人: 这种代理模式是否会改变 SaaS(软件即服务)的定价模式?传统上 SaaS 通常按席位收费,而现在代理实际上是在替代人工。你如何看待未来的定价模式,当 AI 代理成为企业员工的核心部分时?
Sam Altman: 我只能猜测,我们真的不知道。我可以想象这样一个世界:你按使用的计算资源付费,比如你需要 1 个 GPU、10 个 GPU 或 100 个 GPU 来处理你的问题。定价不再按席位甚至代理数量收费,而是根据计算量来收费。
主持人: 我们是否需要为代理任务构建专门的模型?
Sam Altman: 的确需要大量的基础设施和支持来支撑代理的运行,但我认为 GPT-3.5 已经指明了方向,即一个能够执行复杂代理任务的通用模型。
主持人: 很多人认为模型是贬值资产,模型的商品化趋势非常明显。你如何看待这种观点?尤其是随着训练模型的资本密集度越来越高,这是否意味着只有少数公司才能承担这样的成本?
Sam Altman: 模型确实是贬值资产,但说它们不值训练成本是完全错误的。更重要的是,在训练模型的过程中会产生正向的复利效应,你学到的东西可以帮助你更好地训练下一个模型。我认为我们从模型中获得的实际收入证明了投资的合理性。当然,并非所有公司都能做到这一点。现在可能有太多公司在训练非常相似的模型,如果你稍微落后,或者没有一个让产品具有粘性和价值的产品,那么可能更难获得回报。我们很幸运拥有 ChatGPT,数亿用户在使用我们的模型,所以即使成本很高,我们也可以通过大量的用户来分摊成本。
主持人: 你如何看待 OpenAI 的模型在未来如何保持差异化?你最想在哪些方面扩大这种差异?
Sam Altman: 推理能力是我们目前最重要的关注点。我认为这将解锁下一个阶段的大规模价值创造。我们也会在多模态模型方面开展工作,并添加一些我们认为对用户至关重要的功能。
主持人: 你如何看待推理和多模态工作?面临的挑战是什么?你希望实现什么?
Sam Altman: 我希望它能够顺利进行,尽管这确实需要一些努力。例如,婴儿和幼儿在语言能力还不强的时候仍然能够进行相当复杂的视觉推理,所以这显然是可能的。
主持人: 在新的 GPT-3.5 推理时间范式下,视觉能力会如何扩展?
Sam Altman: 在不剧透的情况下,我预计图像模型将会快速发展。
主持人: OpenAI 如何在核心推理方面取得突破?我们是否需要将强化学习作为路径推进,或者使用变换器之外的新技术?
Sam Altman: 这包含两个问题:我们是如何做到的,以及大家最关心的问题:变换器之后是什么?我们如何做到这一点是我们的核心技术机密。
模仿一个已知可行的东西很容易,但模仿的难点在于,你需要有信念知道某些东西是可能的。所以当一个研究实验室做成了一件事情,即使你不知道他们是怎么做到的,模仿起来也不算难。你可以看到 GPT-4 被复制了,我相信 GPT-3.5 也会被复制。
但真正困难的是我们团队最引以为豪的部分,那就是我们能够一次又一次地去做一些全新的、未经验证的事情。很多组织,无论是在 AI 研究还是其他领域,都在谈论这种能力,但只有少数组织能够真正做到。在某种意义上,我认为这是人类进步的重要推动力。所以,我退休后的一个愿望是写一本书,总结我在建立这种组织文化方面的经验,这种不只是简单模仿别人所做事情的组织文化。
主持人: Sam,你认为人的才能是如何被浪费的?
Sam Altman: 世界上有很多非常有才华的人,因为在不合适的公司工作,或者生活在不支持优秀公司的国家,或其他各种原因,无法充分发挥他们的潜力。
我对 AI 最兴奋的地方之一是,它可能帮助我们更好地发挥每个人的潜能,而我们目前在这方面做得远远不够。我相信世界上有很多潜在的优秀 AI 研究人员,只是他们的生活轨迹有所不同。
主持人: 在过去的一年中,你经历了难以置信的高速增长。你提到退休时可能会写书,如果回顾你在过去十年中的领导变化,你认为自己在领导方面的最大改变是什么?
Sam Altman: 对我来说,这几年最不寻常的事情是变化的速度。一个正常的公司从零到一亿美元收入、从一亿到十亿、从十亿到百亿是需要时间的,而我们却要在两年内完成这一切。我们从一个研究实验室转型成一个真正服务大量客户的公司。这种迅速的转变让我失去了学习的时间。
主持人: 有哪些是你本来想花更多时间学习的?
Sam Altman:我觉得其中一件事情是如何让公司专注于增长 10 倍而不是仅仅增长 10%。从一个收入数十亿到百亿的公司,需要非常多的改变,而不是简单地重复上周的事情。快速增长带来的挑战是,我们没有时间去掌握基础知识,我低估了在这种极快的增长环境下,需要付出多少努力去追赶和不断推进。
公司内部的沟通、信息共享、结构化管理、在规划方面如何平衡短期需求和长期发展,这些都非常重要。例如,为了确保公司在一两年内的执行能力,我们需要准备计算资源、办公空间等。在这种快速增长的环境中,规划是非常具有挑战性的。
主持人: Keith Rabois(风险投资人)之前提到过,他从 Peter Thiel(PayPal 联合创始人)那里学到,要雇佣 30 岁以下的年轻人,因为这才是打造伟大公司的秘诀。你如何看待这个建议:通过雇佣非常年轻、充满活力且雄心勃勃的人来建立公司,这是否是唯一的方法?
Sam Altman: 我创建 OpenAI 时大约 30 岁,不算太年轻,但似乎也还行(笑)。所以这是一个可以尝试的路径。
主持人: 问题是,你如何看待雇佣 30 岁以下的年轻人?年轻人充满活力和野心,但经验不足;或者选择有经验、已经做过的人才?
Sam Altman: 显而易见的答案是,雇佣两类人都可以成功,就像我们一样。就在今天采访前,我还在和别人讨论一位刚加入团队的年轻人,可能二十出头,工作表现非常出色。我在想,我们是否可以找到更多像他这样的人,这些年轻人带来了新鲜的视角、活力等等。
但另一方面,如果你要设计人类历史上最复杂、成本最高的计算系统之一,那么我不会轻易把赌注放在一个刚入行的年轻人身上。因此,两类人才都需要。我认为关键在于保持高标准的人才水平,而不是一味地偏向某个年龄段。
我特别感谢 Y Combinator(创业孵化器),因为它让我认识到缺乏经验并不意味着没有价值。有很多在职业生涯起步阶段的高潜力人才,他们可以创造巨大的价值,我们社会应该为这些人下注。这是一件好事。
主持人: 回到日程上来。Anthropic 的模型有时被认为在编程任务上表现更好。对此你怎么看?你认为这个评价公平吗?开发者应该如何选择 OpenAI 或其他提供商?
Sam Altman:他们的确有一个在编程方面表现出色的模型,他们的工作令人印象深刻。我认为开发者通常会使用多种模型,我不确定随着领域的不断发展会如何变化,但我认为未来 AI 会无处不在。我们目前谈论 AI 的方式可能有些不合适,我猜测我们会从谈论“模型”转变为谈论“系统”,但这需要时间。
主持人: 关于模型扩展的问题,你认为模型的规模法则还能持续多久?过去大家一直认为它不会持久,但似乎它比人们预想的更持久。
Sam Altman: 不深入讨论细节,核心问题是:模型能力的提升轨迹是否会像目前这样持续下去?我相信会的,并且会持续相当长时间。
主持人: 你曾经对这一点有过怀疑吗?
Sam Altman: 我们确实遇到过一些我们无法理解的行为模式,也经历过一些失败的训练过程,尝试过各种新范式。当我们快到达一个范式的极限时,我们必须找到下一个突破点。
主持人: 最难应对的挑战是什么?
Sam Altman: 当我们开始研究 GPT-4 时,有一些问题让我们非常苦恼,我们真的不知道该如何解决。最终我们解决了这些问题,但确实有一段时间我们不知道该如何推进模型。此外,GPT-3.5 的转变以及推理模型的概念,是我们很长时间以来一直非常期待的,但实现这一目标的研究之路是漫长而曲折的。
主持人: 在这种漫长而曲折的过程中,如何保持团队的士气?当训练过程可能失败时,你如何维持团队士气?
Sam Altman: 我们团队中的很多人都充满热情,致力于构建通用人工智能(AGI),这是一个非常激励人心的目标。没有人认为这会是一条轻松的成功之路。有一句名言,大意是“我从不祈祷上帝站在我这边,而是祈祷我能站在上帝那边”。投身于深度学习的感觉就像是在支持正确的事业,虽然过程中会有挫折,但最终似乎总会有所进展。对这种信念的坚定信仰对我们帮助很大。
主持人: 一个有点奇怪的问题,我最近听到一个名言:生活中最重的不是铁或金,而是未做的决定。对于你来说,哪一个未做的决定最让你感到沉重?
Sam Altman: 这个问题每天都不一样,没有一个特别大的未做决定。当然,有些大的决策,比如我们会选择哪一个产品,或者我们要如何设计下一代计算机,这些确实是重要且具有风险的决定。我可能会拖延这些决定,但多数情况下,挑战在于每天都会出现一些 51% 对 49% 的难题,这些决定之所以到我这里就是因为它们接近五五开,我可能不比其他人更有把握做出更好的选择,但我还是得做出决定。问题的核心在于决策数量,而不是其中某一个决定。
主持人: 当遇到 51% 对 49% 的决策时,你是否有固定的人可以咨询?
Sam Altman: 没有,我认为依赖一个人在所有事情上并不是正确的方式。对我来说,更好的方式是找到 15 或 20 个在特定领域有很好的直觉和背景知识的人,在需要时咨询最佳的专家,而不是依赖单一的顾问。
主持人: 关于半导体供应链问题,你对半导体供应链和国际紧张局势有多担心?
Sam Altman: 我无法量化这个担忧的程度,但答案肯定是担心。它可能不是我最担心的,但在我所有的担忧中大概排在前 10%。
主持人: 我可以问问你最担心的是什么吗?
Sam Altman: 总的来说,我最担心的是我们整个领域在尝试做的所有事情的复杂性。虽然我认为一切都会顺利解决,但这确实是一个非常复杂的系统。
复杂性在各个层面上都存在,比如在 OpenAI 内部也是如此,在每个团队中也是如此。举个例子,刚刚提到半导体,要平衡电力供应、正确的网络决策、获得足够的芯片,还要考虑可能存在的风险,以及研究进度是否能够与之匹配,以便不会完全措手不及,也不会浪费资源。整个供应链让人想象成一条管道,但其实每一个层次的生态系统复杂性超出了我在其他任何行业中见过的情况。某种程度上,这就是我最担心的。
主持人: 你提到这是你前所未见的复杂性,很多人把这次 AI 浪潮与互联网泡沫做比较,谈到那种兴奋和热情。我认为不同之处在于人们投入的资金量。Larry Ellison(甲骨文公司联合创始人)说进入基础模型竞赛的起点成本是 1000 亿美元。你同意这个说法吗?你看到这个消息时的反应是什么?
Sam Altman: 不,我认为成本不会那么高。但这里有一个有趣的点:大家喜欢用过去的技术革命来类比新的革命,让它看起来更熟悉。我认为整体来说这不是一个好习惯,但可以理解为什么大家会这么做。我还觉得人们选择的 AI 类比案例尤其不合适。互联网显然和 AI 很不一样。
你提到一个关于成本的例子,无论是否真的要花 100 亿还是 1000 亿才具备竞争力,互联网革命的一个定义性特点是,实际上很容易起步。另一个类似互联网的特点是,对许多公司来说,AI 只是互联网的延续:其他人会构建这些 AI 模型,你可以使用它们来开发各种出色的东西,把它当成一种新的技术构建方式。但如果你想构建 AI 本身,那就完全不同了。
另一个常见的类比是电力,但我认为这在很多方面并不适用。我最喜欢的类比,尽管我认为人们不应该太认真地使用类比,是晶体管。它是物理学的新发现,具有令人难以置信的扩展性,很快就渗透到各个领域。我们可以想象出现多个“AI 定律”,告诉我们它会以多快的速度改进。整个科技行业都从晶体管中受益,我们使用的产品和服务中包含大量晶体管,但你并不会觉得它们是“晶体管公司”。这是一个非常复杂且昂贵的工业流程,围绕它形成了庞大的供应链。基于这种简单的物理发现,带来了长期的经济增长,即使大多数时候人们并没有意识到它的存在,只是觉得“这个东西能帮我处理信息”。
主持人: Sam,我想和你做一个快速问答环节。我会说出一个简短的陈述,你马上给我你的想法,好吗?假如你今天是一位 23 或 24 岁的年轻人,考虑利用现有的基础设施,你会选择做什么?
Sam Altman: 某种 AI 支持的垂直领域,我会以 AI 教育为例,开发最佳的 AI 教育产品,让人们可以学习任何领域的知识。类似的可以是 AI 律师、AI CAD 工程师等。
主持人: 你提到写书。如果你写书,会取什么名字?
Sam Altman: 我还没想好名字。我还没仔细想过这本书,只是觉得它的存在会激发很多人的潜力。可能会和“人类潜力”这个主题有关。
主持人: 在 AI 领域,有什么大家没有关注却应该投入更多时间的方向?
Sam Altman: 我希望看到的,是一种可以理解你整个人生的 AI。它不一定要无限量的上下文,但希望有某种方式,让你拥有一个了解你的全部数据、并能够辅助你的 AI 代理。
主持人: 过去一个月内,有什么事让你感到惊讶吗,Sam?
Sam Altman: 是一个我无法透露的研究结果,但它令人震撼。
主持人: 你最尊敬的竞争对手是谁?为什么?
Sam Altman: 其实我尊重这个领域的每一个人,整个领域内都充满了杰出的人才和卓越的工作。我不是故意回避问题,只是到处都可以看到有才华的人做着非常出色的工作。
主持人: 有特定的某一个吗?
Sam Altman: 并没有特别的一个。
主持人: 你最喜欢的 OpenAI API 是哪个?
Sam Altman: 新的实时 API 非常棒。我们现在有一个庞大的 API 业务,里面有很多好东西。
主持人: 你今天在 AI 领域中最尊敬的人是谁,Sam?
Sam Altman:我想特别提一下 Cursor 团队。有很多人在做出色的工作,但 Cursor 让人印象深刻。他们用 AI 带来了非常神奇的体验,为人们创造了很多价值。很多人没能拼凑出所有的要素,而他们做到了。我特意没有提到 OpenAI 的人,否则这份名单会很长。
主持人: 在延迟和准确性之间的权衡上你怎么看?
Sam Altman: 需要一个可以调节两者之间的旋钮。就像现在你希望我快速回答问题,我尽量不花几分钟思考,这时候延迟就显得重要。如果你要我做出一个重大发现,你可能愿意等几年。答案是,这应该是用户可控的。
主持人: 当你想到领导力中的不安全感时,这是每个人都有的东西,但我们很少讨论。你认为自己在哪个领导力方面最需要改进,作为领导者和 CEO 你最想提升的是什么?
Sam Altman: 最近这一周,我觉得我比以前更不确定我们的产品战略细节应该是什么。我总体来说觉得产品是我的弱项,现在公司正需要我提供更清晰的产品愿景。我们有一个很棒的产品负责人和团队,但这是我希望自己更擅长的领域,最近尤为强烈地感受到这一点。
主持人: 你雇佣了 Kevin Scott(OpenAI 的首席技术官),我认识他很多年了,他很优秀。Kevin 的哪些特质让他成为世界一流的产品领导者?
Sam Altman: “纪律”是我想到的第一个词。
主持人: 具体来说是指什么?
Sam Altman: 他非常专注于优先事项,知道该拒绝什么,能够站在用户的立场上思考为什么要做或不做一件事,真的非常严谨,不会有天马行空的想法。
主持人: 展望未来五年和十年,如果你有一支魔杖,可以描绘出 OpenAI 的五年和十年愿景,会是怎样的?
Sam Altman: 我很容易描绘出未来两年,但如果我们猜对了,并且开始制造一些超强的系统,比如在科学进步方面帮助我们,这会带来不可思议的技术进步。我认为五年后我们会看到科技进步速度惊人,甚至超出所有人的预期,社会上可能会觉得“AGI 的时刻来了又走了”,科技进步的速度让人目不暇接。我们会发现很多新东西,不仅是 AI 研究,还包括其他科学领域。
另一方面,我认为社会的变化其实相对有限。例如,如果你在五年前问人们计算机是否会通过图灵测试,他们大概会说不会。如果你告诉他们会,他们会认为这将给社会带来巨大的变革。我们确实大致通过了图灵测试,但社会的变化并没有那么剧烈,就像它“呼啸而过”一样。
这就是我对未来的预期:科技进步不断突破所有预期,而社会的变化则较为缓慢,这是我认为好的和健康的状态。从长远来看,当然会有巨大的变化,但在五到十年内不会那么迅速。
主持人: 你太棒了,我本来准备了一份问题清单,但没有完全按照提纲走。谢谢你包容我在各种问题之间的跳跃。感谢大家的参与,我很高兴能在这里见到大家。Sam,感谢你促成了这次活动,非常感谢你。
关注《森林聊AI商业》公众号
了解 AI 如何塑造商业的未来