👇关注公众号后设🌟标,掌握第一手AI新动态
本文内容整理自OpenAI CFO Sarah Friar接受ARK Invest Youtube频道专访,公开发表于2024年12月12日。原始内容参考:https://www.youtube.com/watch?v=SImm15uF_3Q
内容提要: OpenAI首席财务官莎拉·弗赖尔接受ARK Invest访谈
本文主要围绕OpenAI的商业模式、AI技术发展趋势以及未来发展方向展开,核心观点如下:
AI的巨大市场潜力: ARK Invest预测,到2030年,人工智能基础模型层的价值将达到15万亿到20万亿美元,主要基于AI将知识工作者生产力提高4-5倍的估算。OpenAI作为主要竞争者,1500亿美元的估值是合理的。 OpenAI的定价策略和商业模式: OpenAI采用“好-更好-最好”的定价策略,提供免费、付费Plus版和高端Pro版ChatGPT,捆绑销售其高端模型(如O1推理引擎和Sora视频生成引擎)。Pro版每月200美元的高价,基于用户节省工作时间的价值来衡量其性价比。 OpenAI更关注毛利率而非收入,并积极探索降低成本的方式(摩尔定律,提高计算效率)。 AI成本的快速下降: AI训练和推理成本的下降速度远超摩尔定律,每年分别下降75%和85%-90%,这使得快速迭代和产品更新成为可能,也对资本配置策略提出了挑战。 AI并非炒作周期: 与会者认为当前AI发展并非泡沫,而是真正的技术革命,类似于云计算的转变,正处于早期阶段,未来增长潜力巨大。 OpenAI的资本配置策略: OpenAI将资本投入到下一代模型的研发(如O1、O2),并积极探索与其他领域(如芯片、机器人)的合作,以加速AGI的实现。 公司利用其AI原生属性和庞大的用户群,积极进行前瞻性投资。 AI对市场格局的影响: AI将改变市场集中度,可能打破MAG-6(市值最大的六家科技公司)的垄断地位,促进市场广泛扩张,但这种扩张可能体现在现有公司对AI的投资和应用上,而非完全诞生新的巨头。欧洲的监管环境对AI发展存在一定的阻碍。 AI的未来发展方向: OpenAI正探索构建更智能、更直观的AI系统,这包括:
使用自然语言作为主要交互界面; 根据任务即时生成操作系统; 根据任务动态调整用户界面; 减少对传统应用程序层的依赖; 探索基于价值的定价模式。
OpenAI CFO Sarah Friar简介
莎拉·弗赖尔(Sarah Friar)是人工智能公司OpenAI的首席财务官,她是一位在科技和金融领域拥有丰富经验的资深高管。在加入OpenAI之前,弗赖尔曾在支付公司Nextdoor担任首席财务官,并曾在Square(现Block)担任首席财务官多年,对公司上市和财务战略有着深入的理解。
弗赖尔的职业生涯始于麦肯锡咨询公司,这为她提供了扎实的商业分析和战略规划能力。在Square期间,她为公司的快速增长和最终上市做出了重大贡献,展示了她在管理大型复杂组织和应对快速变化的市场方面的能力。 她的经验不仅局限于财务管理,还涵盖了运营、战略和投资者关系等方面。
访谈全文
布雷特·温顿: 欢迎收听FYI,您的创新播客。我是布雷特·温顿,ARK Invest首席未来学家。我们今天有一个精彩的节目。我和凯西——我们无所畏惧的领导者——将与OpenAI的首席财务官萨拉·弗莱尔进行对话。我们将涵盖很多方面,讨论他们如何定价产品以及如何分配资金。萨拉暗示她不知道如何评估公司的价值,但我们有自己的想法。
当我们投资OpenAI时,我们从两个不同的角度出发。首先,我们认为价值链中的基础模型层到2030年将价值15万亿到20万亿美元。我们得出这个结论的依据是,我们认为人工智能软件通常会将知识工作者的生产力提高四到五倍。知识工作的工资总额为30万亿美元,这意味着为企业带来的生产力提升价值120万亿美元。我们认为整个软件栈将从中获得大约10%的生产力提升作为收入。大部分收益将归企业所有,最终也将惠及消费者。这部分中的一部分会流向人工智能基础模型提供商,以合理的现金流倍数计算,我们认为这些公司的价值在15万亿到20万亿美元之间。
因此,在此背景下,OpenAI是占据这一地位的主要候选者,1500亿美元是一个不错的估值——约1500多亿美元的后期估值。你也可以从收入产生和收入增长来看待这个问题,并说以市销率来看,OpenAI实际上与公共投资组合中许多软件即服务公司至少一到两年的未来表现相当。有多种方法可以评估这一投资;我们的信念取决于人工智能将继续加速发展,并为各种角色的人们提供更强大的性能。
我们于12月2日与萨拉进行了这次谈话。此后,OpenAI启动了为期12天的“Shipmas”(圣诞节期间的软件发布活动),这是一个对其产品进行新更新的一系列发布。在我录制这段引言时,“Shipmas”进行到第四天。您可能在第五、第六甚至第七天收听这个节目,所以对于无法评论第五或第六天的情况,我深表歉意。然而,他们已经向我们暗示了他们将如何为这些高端产品定价,我们在采访中与萨拉对此进行了一些讨论。
您可以使用ChatGPT中的免费GPT版本,也可以为企业用户使用ChatGPT Plus,它可以无限制地访问他们更高端的模型。就在本周,他们宣布推出ChatGPT Pro,它并非像Plus那样每月20美元,而是每月200美元。他们现在正在采用“好-更好-最好”的定价策略。
Pro的价格点之所以有趣,是因为它可以让您访问O1模型,这是他们的推理时间计算模型,从本质上来说,它是世界上最好的逻辑推理引擎,即使对于更长的推理时间也是如此。用户评论表明它非常适合编码以及更复杂的逻辑任务。他们还加入了Sora,他们的视频生成引擎,在这个Pro版本中每月提供500个生成的视频。
您可以想象他们正在捆绑销售,并且在他们未来的产品发布中,这种情况很可能会持续下去——将对他们最好的产品的无限或几乎无限的访问权限捆绑到每月200美元的套餐中。我们将看看用户的接受度如何,但每月200美元似乎很贵。但是,如果您每月节省两小时的工作时间,每小时100美元,那么它就能收回成本。
我们思考软件定价;如果您节省10小时的工作时间,每小时收入100美元或200美元,那么您可能愿意每月支付200美元购买该软件。所以,人工智能领域正经历一个激动人心的时刻。事情发展迅速。我希望您喜欢与萨拉的谈话。它确实阐明了OpenAI作为一个组织是如何运作的,以及它是如何看待定价、资本和产品的。
感谢您收听FYI,您的创新播客。您好,欢迎收听FYI,您的创新播客。今天与我们一起的是OpenAI的首席财务官萨拉·弗莱尔,当然还有我们无所畏惧的领导者,ARK Invest的首席执行官兼首席投资官凯西·伍德。萨拉,我想,你受教育背景是工程冶金学,但你从高盛转到Salesforce,然后成为Block(以前称为Square)的首席财务官,以及Nextdoor的首席执行官,然后担任OpenAI的首席财务官。凯西,你一路都在某种程度上与她并肩前行。你们在职业生涯中是如何互动的?
凯西·伍德: 嗯,你知道,我不得不查一下萨拉在高盛的时候。她于2000年加入高盛,当时正值科技和电信泡沫的顶峰,并在那里待到2011年。我以为我认识萨拉,她比我年轻得多,但我以为我也经历过那个泡沫时期。我觉得我们经历了一切。
所以我们认识很久了,在Alliance Bernstein认识的。当然,当她在高盛的时候,我们曾与萨拉进行过咨询。我们持有她所有股票的一部分原因,就是因为她在那里。如果她在那里,我们就知道这家公司正在做一些有趣、新颖、不同且规模庞大的事情,比如Salesforce。
我还记得当时与你和马克·贝尼奥夫就软件即服务进行斗争。人们就是不明白。每当拉里·埃里森有机会时,甲骨文都会抨击它。我们很早就关注到了它,我们的原始研究让我们回到了萨拉那里,我们基本上确定了当时Square(现在的Block)的用户群在低收入地区。我们将它的用户群与地图叠加在一起,每个人都喜欢这样。这让我们获得了一些知名度。
在Nextdoor,我们在互联网上做本地广告,当时萨拉是首席执行官,当然,对广告来说这是一个充满挑战的时期。然后是OpenAI——哇,我想,她终于到家了。这就是我对她说的话:好吧,她加入OpenAI后,终于到家了。
这就是我们认识彼此的时间。她一直领先于我们,或者我们步调一致。所以我们又见面了。
萨拉·弗莱尔: 这是真的。如果可以的话,我只想说一分钟。首先,我喜欢我们共同认识Sig Sigalas。我必须说出Sig的名字,上帝保佑她。她是我在华尔街最喜欢的人之一。
但是当凯西真正出现时,她绝对是你想要知道她在想什么的投资者。和她打电话总是很高兴,因为问题总是出乎意料。我喜欢伟大投资者这一点。所以,我认为这个播客正是因为这个原因会很有趣。
但我认为她和我都喜欢一开始就处于不受欢迎的位置,因为人们还不理解他们。或者有时它们变得不受欢迎,因为它们以炒作的方式出现,然后需要一段时间才能符合现实。
但我认为我们都经常在大型科技转变方面达成一致,谢天谢地,很多次都对了。让我们希望人工智能也是其中之一。我相当有信心。
凯西·伍德: 是的。在我们开始评估这个绝佳机会之前,我想先谈谈我们一直被问到的一个问题:这是否只是一个炒作周期?这是否是科技和电信泡沫破裂的轮回?我知道您对此有一些有趣的观察。所以在交给Brett之前,我们不妨先从这些谈起。
萨拉·弗莱尔: 我认为就技术而言,绝对不是这样。就我们朝着AGI(通用人工智能)前进的态势而言,甚至就我们今天所处的阶段而言,这一切都是真实的。我的意思是,如果你还没有体验过使用ChatGPT,我不知道你在做什么。它能够简化你的生活,从一些非常简单的任务开始,比如,“我今晚应该做什么饭?”或者,“我这个周末和我读大二的女儿坐在一起,她需要写一封求职信”,诸如此类的事情,它让生活轻松许多,感觉像是革命性的。
我认为这仅仅是它处于早期阶段的表现,而它最终会变成什么样,我们拭目以待。我相信这将是下一个重大的平台转变,就像我坚信向云计算的转变一样。我曾去纽约会见投资者,并遭到诸多反对,他们认为银行、政府、电信公司等等永远不会将他们的数据放在云端。
因此,Salesforce的市值绝不可能超过100亿美元。我觉得,当你听到人们谈论规模法则失效或世界上没有足够的电力来做到这一点时,你也会听到类似的声音。不,我们正处于一场巨大平台转变的真正开始。估值方面,我不清楚,我把它留给你们大家。我已经退出那个圈子了。
但我确实很喜欢一位投资者提供的一个数据点(我相信Cathie也做过同样的分析),他说Netscape出现两年后,也就是你第一次真正能够浏览互联网,甚至有了这个概念之后,今天我们认为是互联网驱动型企业的市值中,只有大约2%存在于那时。我认为我们正处于那个早期阶段。ChatGPT刚刚过了一岁生日,本周末刚刚度过两周年。我现在看待投资的方式也类似。
布雷特·温顿: 我喜欢您将AI与云计算进行类比,人们将AI比作许多不同的技术,例如互联网的出现、计算机的出现,甚至是蒸汽机的出现。然而,AI也有一些明显不同的特性。与互联网相比,它服务成本高昂,提供令牌给用户的边际成本远高于向互联网用户提供比特的边际成本,至少在平台层面上是这样。这将如何影响OpenAI的商业模式和资本配置策略?例如,从首席财务官办公室和企业战略的角度来看,您是如何考虑这个问题的?
萨拉·弗莱尔: 这是一个很好的问题,我没有完美的答案。但作为一个起点,在我与团队合作时,我们通常关注的是毛利率,而不是收入。这有点像Square,Square过去有GPV(总支付额)的概念,甚至在那之前是总收入,然后再扣除所有手续费等等。如果你围绕GPV或总收入建立你的业务,你很容易偏离轨道。所以,你必须始终关注利润率,特别是毛利率。我认为,当我考虑在这里建立定价模型时,有很多相似之处,我们必须关注毛利率。
同时,我不希望我们过于纠结于今天的成本结构就是明天的成本结构。成本结构方面有很多积极的变化。首先,我们都是摩尔定律的受益者。作为一名冶金学家,或者像你说的材料科学家,我过去在大学时代花了很多时间思考硅。但摩尔定律依然有效。我认为第二点是我们都在学习如何提高计算效率。我们实际上是一家只有两岁的公司,却拥有这样的规模,我们现在才真正开始学习如何以真正高效的方式提供计算服务。在这方面,我们的毛利率越来越好。
然后,我认为第三点是,在某些地方,为了保持竞争力或创造普及性,你会真正关注利润率。你希望人们使用它。例如,当我们第一次推出GPT-4并拥有GPT-4的API时,今天向开发者提供GPT-4的成本,与我们现在拥有4o mini的成本相比,只有百分之一。作为首席财务官,你很少会看到成本下降如此之多。我们实际上以一种我们甚至不试图从中获利的方式来定价,因为我们希望世界上每一个开发者都能使用它,回到普及性这一点。我们了解到,当客户使用我们的API时,我们会得到良好的评价,而这些评价会推动产品发展。所以这里有一个良性循环。
总的来说,作为首席财务官,我一直在寻找以前的模板来借鉴。我意识到今天的情况并不代表明天,而且你必须经常考虑未来。最后,我正在考虑利润率,同时需要关注它对你的商业模式意味着什么,它也可以作为一个有趣的竞争优势点。我认为在我们构建商业模式的过程中,有很多低垂的果实。
凯西·伍德: 我们分析师进行的最有趣的分析之一,由Brett和各个研究主管领导,正是关于你所说的成本下降。我们使用了莱特定律,莱特定律是摩尔定律的近亲。摩尔定律是时间的函数,莱特定律是单位的函数。通过这项分析,**我们了解到AI训练成本每年下降75%。我的意思是,我们从未见过这样的情况。如果我没有记错的话,它比摩尔定律快三到四倍。而AI推理成本每年下降85%到90%**。所以,再次强调,这太不可思议了,我们从未见过这样的情况。
萨拉·弗莱尔: 我忍不住要说,另一个方面是,你正处于一个全新技术产业的早期阶段。人们很快就将事情固定下来,因为你刚才提到了“推理”,“推理类”,所以人们脑海中会认为我们正在建设这些数据中心,会有用于推理的数据中心、用于研究的数据中心,以及用于推理的芯片等等。
但现实是,我认为我们今年在所有计算效率方面取得的一个重大突破是认识到即使在这两件事之间也有很大的可替代性。这种认识推动了更高的复合效率,因为你不仅越来越接近GPU的100%满负荷使用率,而且你还在学习哪些特定的研究任务实际上在历史上我们称之为“推理计算机”的设备上运行得更好。
例如,我提到的4o Mini主要是在Azure称之为“集群容量”的设备上完成的。它们不是在AI超级计算机上完成的。再说一次,我们仍在学习。即使戴着首席财务官的帽子,我的目标也不是要把人们局限在既定的模式中。随着技术的不断发展,允许更大的灵活性至关重要。
布雷特·温顿: 是的,我的意思是,成本每四到五个月减半。所以,如果你制定了一个针对该指标不灵活的策略,你几乎会立即处于劣势。而且,考虑到O1模型所代表的推理时间计算量,这是另一种方法,你可以用训练能力来换取推理能力,你实际上是在实时运行模型,以便为用户提供比你原本需要更大的资本支出才能获得的更好的结果。在这种情况下,你如何看待资本配置?因为这实际上就像你的资本支出配置在某种程度上与你的运营支出配置竞争一样。你如何知道,比如,我需要多少台电脑来服务产品,而不是投资于未来的产品?
萨拉·弗莱尔: 是的,我的天哪,如果你身处OpenAI内部,你会知道我们现在正为此投入大量的精力和算力。部分原因是我们能够回顾历史,说,好吧,我们在创建ChatGPT 3和3.5时需要多少算力?然后,为了达到ChatGPT 4,我们必须考虑投资什么?
我认为好消息是,4代及其衍生版本(4o等等)仍然占据着我们绝大部分的营收。所以好消息是,在你投资多年之后,你非常能够继续收获这项投资的成果。虽然我认为我们的周期正在缩短,但我认为并非如此,因为我们在另一方面达到了2.5亿多用户。但是,你知道,地球上有70亿人口,对吧?
这是人类智能;用你的例子来说,这是电力。所以,我认为我们只是触及了有多少人想要使用它的表面。我认为4o投资周期的产出将比大多数人想象的要持久。
现在,当我们进入O1时,我们现在有能力说,好吧,训练O1需要我们做什么?我们可以预测未来,并说,好吧,对于我们想要在2027财年发布的模型,我们知道我们需要提前做好准备,例如打好地基、浇筑混凝土、准备好数据中心的框架,以便我们能够开始用设备填充数据中心,以推动我们在2027财年及以后能够做到的事情。
存在不匹配的情况,但你可以参考一些之前的经验。另一个层面是如何思考通往AGI的路径?从聊天机器人到推理,我们知道我们作为前沿组织又回到了智能体,我认为这将是2025财年的重点。然后是如何从智能体过渡到为个人完成日常多任务的自主任务的智能体,再到真正进行创新的智能体。
要回到你的问题,Brett,我认为作为一名财务人员,数学计算会变得很困难,因为你必须想象一个尚不存在的产品。你必须想象这个产品的客户,他们可能愿意支付的价格,以及你将占据多少市场份额。由此,你可以推导出你的总收入。然而,我认为我们可以进行一些比例推断,从而让我们有信心进行今天的投资,回到你关于资本配置的观点。
我认为还有一点是,作为OpenAI,我们具有AI原生属性,这与微软、谷歌或亚马逊等上市公司(即大型云服务提供商)有所不同,对吧?对于我们来说,知道作为一家私营公司,我们可以全力以赴,这是一个巨大的优势。这就是我们每天都在做的事情。投资者并不是给我们钱让我们在资产负债表上赚钱;他们是让我们在这个周期中真正获胜。我们可以比大型云服务提供商更努力地向前倾斜。
他们可能拥有大量的资产负债表资源,所以我们也必须创建资产负债表来进行投资。但我认为我们拥有更多权限,因为我们在周期的哪个阶段,我们的关注点,事实上我们现在拥有比任何人都多的用户,以及我们今天拥有给予我们资本的投资者类型。
凯西·伍德: Brett,这让我们想起,或者让我想起我们所说的颠覆性创新与持续性创新。你谈论的是真正的颠覆性创新。大型云服务提供商在很大程度上是持续性创新。我们在内部进行了一场很好的辩论。我认为你刚才所说的话会促使我们思考,等等,这确实是真正的颠覆性创新。你需要专注于它,并全力以赴地推动它,因为它发展得太快了。
MAG-6(此处指市值最大的六家科技公司)应该在广泛的指数中占据如此不成比例的份额,从而推动指数本身,这一现象在人工智能打破我们甚至无法想象的各种记录的时代是显著的。
你认为,对大型云服务提供商或MAG-6的押注,这种市场集中度,是否会让位于市场的广泛扩张,就像在安全避险时期之后通常会发生的那样?我应该说,这就像90年代互联网在90年代初期和中期兴起时一样,出现了一种真正的变革运动。这需要一段时间,但随后它以许多初创公司和大量的并购的形式迅速发展,这受到了联邦贸易委员会(FTC)的阻碍。然而,我认为这种情况将会改变。
萨拉·弗莱尔: 是的,我的天哪,你刚才所说的内容有很多方面可以深入探讨。首先是关于MAG-6,总的来说,这确实是一种转变,它确实认识到规模是有价值的。显然,英伟达凭借其芯片迄今为止已经取得了巨大的成功。这已经吸引了竞争进入这个领域,无论是谷歌的TPU技术,AMD还是其他公司。我怀疑市场力量将允许对谁是芯片制造商进行一些最终的区分。但我认为英伟达不会继续攀升吗?不会,因为,再次强调,我认为我们只是处于这种转变的开始阶段。也就是说,确实感觉市场应该有所拓宽。
然而,谁又能说这种拓宽不是基于人工智能的采用者呢?你真的能证明一个在其行业中率先行动的公司开始占据该行业更多经济租金吗?所以这并不是真正押注于,你知道,下一个冉冉升起的新兴科技公司,你知道,那家公司将上市,我不知道,成为一家芯片提供商或存储提供商之类的东西。相反,如果我在考虑芯片制造,如果这些公司正在使用智能体软件来制造更好的芯片呢?它们会发展得更快吗?
考虑一下这个角度:如果我是一家快消品零售商,大力投资人工智能呢?我的意思是,我不会完全谈论我自己的情况,但我担任沃尔玛的董事会成员,我对道格和他的团队愿意加大资本支出的印象非常深刻。这实际上是关于使商店、配送中心和整个供应链更高效。当你将人工智能融入其中时,他们是否愿意投入所需资金?我不是特别指明这一点,因为我不认为道格公开讨论过这个问题,但让我们假设他们非常愿意投入。
你开始看到经济租金积累在那些采取了三年到五年长期投资观点的公司身上。我认为这在银行业可能是正确的,坦率地说,在标准普尔500指数的很大一部分领域也可能是正确的。医疗保健是另一个行业。在我与客户交谈时,感觉经济的各个领域都受到了影响。
我能再给你一个想法吗?当我考虑全球投资组合时,我经常与我的丈夫(他也是一位投资者)就此进行辩论。你如何看待美国投资与欧洲或世界其他地区的关系?在一个投资这些平台的能力被认为是主要竞争优势的地方,我担心欧洲缺乏投资——无论是电力、数据中心,以及在事物甚至尚未发明之前就过于强调监管。
我这个周末一直在讨论这个问题。例如,如果你观察美国股票与欧洲股票,你可以认为,由于估值倍数的差异,你可能最好购买欧洲公司。然而,当我倾听公司及其投资意愿时,这就是我发现自己真正对这个周期接下来走向何方感兴趣的地方。市场的这种拓宽可能反映的是一个部门的拓宽,而不仅仅是更多类似于下一个谷歌或下一个亚马逊的公司。
凯西·伍德: 是的,我认为,嗯,我们也从像Palantir这样的公司那里学到了一些经验,他们一直在将员工撤出欧洲,因为在那里工作几乎是不可能的,除非你感觉,好吧,我们将因为无意中触犯了一些隐私法规而被罚款,相当于我们收入的4%,而我们甚至都不知道。所以他们实际上,他们在公开的财报电话会议上说过,我们正在将员工从欧洲调往美国,在那里他们没有那么多负担。
萨拉·弗莱尔: 我认为欧洲各国政府可以大力发展AI。而且我认为,如果你广泛地看待欧盟,它规模巨大——人口比美国还多。你们现在有一个重新拥抱科技的绝佳时机。是的,在任何转变中,法规和正确的安全措施都是绝对必要的。但关键在于找到一种更平衡的方式。
我刚在巴黎参加了我们在欧洲第一个大型据点的开幕式。我要大力赞扬法国政府。他们真的在大力发展人工智能,并在法国催生了一些非常有前景的公司。他们都在说关于创新的正确话语,所以这并非不可能做到。然而,这需要,你知道,需要决心。
这就像我们沃尔玛董事会的讨论一样,对吧?我们今年投资的任何东西,或者在我的OAI董事会会议上,都不会在2027财年和2028财年之前看到真正的成效。如果有什么不同的话,政府应该比公司有更长远的眼光。
凯西·伍德: 我记得在互联网早期,法国是先行者。我印象非常深刻。所以我一直关注着他们。我们收到了越来越多的来自欧洲和英国的问题:等等,为什么我们不能在这里发展风险投资文化呢?所以解决方案的一半在于理解问题。我认为他们正在觉醒。我同意你的看法。这是一个伟大的时刻,但他们会抓住它吗?我对互联网的遭遇感到非常惊讶,你知道,一旦互联网真正发展起来,法国人并没有真正发挥主导作用。
布雷特·温顿: 我认为你也可以这样解读:欧洲复杂的监管环境使其变得困难。它使得在欧洲发展业务变得具有挑战性,甚至比其他地区更难,而且在欧洲运营也很困难。人工智能系统的一个有趣功能是,它们可以作为一把万能钥匙,以自动化方式解锁官僚障碍。例如,我只是想让有人为我编写一个程序,自动点击“允许 Cookie”按钮,这样它就永远不会再出现。这意味着我不再需要关注欧洲的这项法规了。
某种程度上,神秘的基础设施可以通过运行你计算生活的特定于AI的操作系统来解决。回到OpenAI,你提到使用AI的公司应该能够做得更好。投资AI的公司确实应该能够改进其运营。关于OpenAI有很多传闻,也许是建造他们自己的芯片或浏览器,甚至开发他们自己的设备。
此外,还有人形机器人投资。在此基础上,你阐述了如何在下一代模型上进行资本分配。但是,还需要考虑更广泛的战略潜在资源分配决策。这些如何融入其中?你如何评估这些投资是否适合OpenAI的战略?
萨拉·弗莱尔: 是的,我的意思是,我会首先说,看看我们的灵魂,我们是一个研究实验室,而研究人员,谢天谢地,他们天性就非常好奇。事实上,我刚刚完成了我们的研究规划备忘录,对吧?我们正在规划2025财年的计划。在最后,他们引用了爱因斯坦关于好奇心是一朵需要精心照料的小花,但最重要的是需要自由的绝妙名言。我完全曲解了这句话。但这就像,哦,我喜欢这个。然而,好奇心伴随着你所谈论的一切,地平线上总是有有趣的新事物。
我认为,当我们看待一个新的机会时,首先,从战略上来说,这是否会加速我们实现AGI的道路?这总是我们必须首先回答的问题。而且有一点需要注意的是,例如,如果它是在研究芯片,这是否允许我们以更大、更快、更好、更便宜的方式进行计算,对吧?这将是一个研究它的理由。关于机器人技术,是否可以收集到目前无法收集到的更多数据,从而真正进一步改进你的模型,对吧?你知道,我们正在学习如何使用合成数据。我们正在学习从选择加入向我们提供评估结果的客户的API中获得评估结果。我们知道,当这些数据反馈到模型中时,模型会得到本质上的改进。
目前对我们有利的一点是,我们在建立这个庞大的客户群方面遥遥领先,而且这个客户群正在以惊人的速度继续增长。这确实促使我们尽可能快地保持这些飞轮的运转,因为更多的数据会导致更好的模型,更好的模型会导致更多客户;更多客户导致更多数据,以此类推。所以,首先是战略上,它是否会加速我们走向AGI?第二,权衡是什么?就像你会反复听到我说的这句话:如果我们这样做,我们不应该做什么?因为我们生活在一个资源有限的世界里。
然后我认为第三个问题总是,如果我们有能力筹集大量资金,我们是否应该筹集更多资金来做这件事?因为我们现在有能力做到。我知道这听起来不像一个好的CFO框架,但这确实是我一直思考的第三件事:如果我们没有限制,谁可能会在此时此刻施加限制?我们拥有一批令人惊叹的想要来这里工作的优秀人才。你会发现,对机器人技术感兴趣的人和对芯片感兴趣的人,他们本身就创造了一个好奇心蓬勃发展的社区。
所以,长话短说,我更倾向于让更多花朵盛开,但我作为CFO,总是想着专注。我确保我们不会同时进行太多事情,以至于我们在任何事情上都没有取得成功。这意味着有时我们会进行合作。你提到了硬件,媒体上肯定也有关于我们可能已经达成的合作的报道。我认为这是一个例子,有时我们决定不自己做,但我们希望建立强大的合作伙伴关系,这样我们至少可以推动某些事情在世界上的发展,并确保如果它真的快速发展,我们也可以从中受益,无论是从数据角度还是财务角度。
凯西·伍德: 我有个问题,可能有点跑题。如果你还有其他问题,Brett,请随意提出。但市场上的竞争态势非常激烈,这也驱动了大量的支出。我们一直在跟踪模型相对于基准的性能,观察它们向OpenAI的结果或性能逼近的速度。甚至开源模型的改进速度可能也快于闭源模型。您是如何看待这个领域的竞争以及整体竞争的?
萨拉·弗莱尔: 是的,我认为有几点。首先,我们努力专注于目标,对吧?对我们来说,如何实现AGI,而不是被外界的噪音所干扰?也就是说,我们非常重视评估和模型比较。我们每天、每周都在关注这些,一直在讨论。事实上,我知道我们的研究团队非常希望通过下一代推理模型O1,以及后续的O2等等,来证明我们可以真正大幅超越这些整体统计数据。坦白说,当您开始看到这些模型在博士水平及以上任务中的出色表现时,就会明白。
我认为关于开源方面的第二个观点很有意思。有一种理论认为,随着我们走到前沿,到达真正的边界,我们将开始看到重大的发展。我刚刚观察到一位外部研究人员,我不想透露他们的位置,但他们在美国的一个实验室工作,该实验室绝对处于该领域的领先地位。他们演示了如何使用O1(不是O1预览版,而是O1)进行研究。这对我来说特别引人注目,因为他正在对金属施加如此强烈的冲击,以有效地释放电子,从而产生能量冲击波,最终思考如何实现核聚变。他向我们介绍了他的发现:这个答案达到了研究生水平,这个答案可以得到博士生的支持,这个答案显示出拥有博士学位和十年经验的人的知识水平,等等。
那一刻,你意识到人工评估变得多么重要。它们很昂贵,因为你是在要求世界上最优秀的人才花时间来评估你的模型。开源真的能够为此提供资金并做到这一点吗?我知道这是我们在考虑2025财年时投入大量时间和精力关注的一个领域。这引发了一个问题,即在这一点上,谁能够真正保持领先地位(因为这代价高昂),与那些可能足以胜任一系列更广泛任务但可能达不到您期望的尖端水平的开源模型之间是否存在差异。
当技术发生变化时,您需要走在前沿。您必须这样做,因为您甚至不知道自己即将发现什么。如果您只是表现尚可,在我看来,这在科技领域从来都不是一个好位置。当市场成熟时,这可能是可以接受的,因为那时您会有更多选择,人们可能不愿意支付那么多,但在突破性创新的关键时刻,我一直都是全力以赴地追求第一名。我甚至不会在第二名上分配20%的资源。我只是非常相信第一名,因为它更容易在超高增长的基础上实现倍数增长。如果增长不多,要达到显著的倍数增长真的很难。
布雷特·温顿: 我可以问一个关于这个轶事的问题吗?研究人员强调的不同例子,是同一个模型的不同推理时间吗?
萨拉·弗莱尔: 是的,实际上,他是在进一步提示模型。模型保持着状态。所以模型知道最初的前提是什么,比如什么类型的金属,施加了什么类型的力。然后他只是通过每个提示来推动它更深入地挖掘。
所以关于推理模型的另一件事是,它保持状态,这与您只是使用4o不同。就像每个问题都稍微有点新问题一样。顺便说一句,这也是我们在所有这些模型中学习到的另一件事,即个性化的力量可以创造粘性,也可以创造更好的人工智能式答案。
这就像如果我每天上班都第一次见到我的执行助理;对我们两个人来说都会是一次非常令人沮丧的经历。他与我一起工作七八年积累下来的状态,意味着他比我更了解我自己。我热爱并珍视这一点。这意味着他的答案要好得多。
当我们考虑模型以及它们如何完成越来越多的个人任务以及专业和创新任务时,我认为随着时间的推移,它们能够保持状态的能力也将成为一个重要的区别因素。
布雷特·温顿: OpenAI目前内部使用什么进行评估?你们有自己定制的评估方法吗?因为许多基准测试似乎令人沮丧地,可以说是有限的,带有偏差的。
萨拉·弗莱尔: 是的,我的意思是,我们确实会查看外部基准,并关注意见领袖的观点,并使用这些基准。但是,是的,在内部,我们肯定,你知道,对于编码之类的事情,我们会以某种方式寻求我们自己员工的帮助。
我们会走向世界,在人工数据方面与这些一流的评估者一起工作,无论是物理学还是生物学方面的一流评估者,但也可能是,我不知道,罗马尼亚语之类的,对吧?它变得非常具体,并且您希望确保模型给出正确的答案。
我们还记得,对吧,即使是普通的ChatGPT评估。就像通常情况下,你会看到,你会得到两个答案,你可以选择其中一个。顺便说一下,我们也学会了平衡这一点,因为当你被要求查看两个答案时,这有点像一个人工的时刻。
人类实际上倾向于选择更冗长的答案,因为我们会想,哦,这看起来很棒。看看它多么博学。但是,如果每次你都得到一个超级冗长的答案,它实际上并没有那么有用。因此,我们正在学习所有这些平衡,例如接收输入,但确保我们不会过度训练模型朝着一个方向发展。你知道,在这个过程中有很多学习。
布雷特·温顿: 人工智能的一个如此截然不同的特点似乎确实是,你发布的产品,你并不确定它的能力。例如,在Photoshop中,你决定添加一个新的菜单项。这是经过讨论的。就像,“哦,这是菜单项。”然后,你知道,它经过测试,你知道它在发布时会做什么。也许它有bug。但在这里,你需要用户群来尝试这个东西,以弄清楚它实际上能做什么。
萨拉·弗莱尔: 所以,当我对客户这么说的时候,总觉得有点不真诚,但我一直在努力去适应它,并找到一种表达方式。他们会说,嗯,我应该购买全套的ChatGPT吗?有什么用例吗?我跟首席财务官谈过。他们说,我们能购买用于结账或进行采购招标之类的用例吗?我一直说,别那样做。你实际上想要全套的ChatGPT,但随后让我们来帮助你,或者你知道,越来越多的精品店开始提供这方面的帮助。
你应该举办黑客马拉松。你应该与员工进行更开放式的焦点小组讨论,比如你的财务部门或营销部门等等,因为他们想出的东西在很多方面比我们给你Photoshop的按钮更有创意,对吧?也就是说,我认为首席技术官和首席信息官显然会说,好吧,展示成果吧,对吧?这里真的需要一个真正的概念验证。向我展示Klarna是如何使用它来进行客户服务的,或者摩根士丹利是如何使用它来进行财富管理的,或者,你知道,像Paradigm或Moderna这样的公司是如何使用它来进行疫苗部署的,等等。
但我认为如果过于狭隘地看待这一点,我们将完全错过这项技术的用途。再次回到你的电力例子,如果你进来并说电力只是用来点亮灯泡的,我们全国可能到处都是灯泡,但你可能会错过这项技术最终被用于的其他所有用途。
凯西·伍德: 鉴于你之前从事过软件即服务(SaaS)行业,你刚才描述的更像是针对每个公司进行定制化,对吧?随着这项技术的成本降低,这种情况会越来越普遍。因此,我们有一个假设,即技术栈将会略微偏离软件即服务(SaaS),转向基础设施即服务(IaaS)和平台即服务(PaaS)。这似乎就是你刚才所说的,对吧?
萨拉·弗莱尔: 是的,布雷特,我认为,你之前描述的那种“官僚主义之上的额外一层”,我对此思考良多,这与未来计算领域的发展方向息息相关。软件股票在这一年中一直深受其扰,主要原因是人们担心,如果深入一层,所有的智能都集中在顶层,那么你可能会被吞并。这会影响你的品牌、你的用户界面,所有的一切。人工智能似乎能够也应该成为顶层的一层,尤其是在技术足够智能,能够快速搜索和检索组织内部信息的时候。
当你进入到那个智能代理层时,你实际上是让它去执行一项任务,但它能够访问我们今天所想到的各种应用程序。这就提出了一个问题:我们是否根本不需要应用程序层?如果应用程序层只是充当一个转换层,将数据转换回数据湖,那么是否有办法去除中间商?虽然这需要很长时间,但这个智能层确实有一些引人入胜之处。
另外,我曾经与我们一位非常优秀的研发人员会面,讨论我们在25财年是否应该为医疗、金融和教育等不同行业创建定制化的用户界面。我建议我们甚至可以根据他们正在执行的任务创建定制化的用户界面。他疑惑地看着我,并指出这些模型已经非常智能,可以根据你想要完成的任务即时创建用户界面。
这个概念真的让我大开眼界。虽然我们现在还没有达到那个程度,但想象一下,一个用户界面不是由静态的比特和字节构成,这些比特和字节是为了让按钮变成蓝色或以某种外观打开而设计的。今天,如果你使用Canvas,例如,它知道你是在编码还是在写作。这是两个基本的起点。但如果它能够识别出我正在CRM系统中写作或在类似Photoshop的应用程序中编辑照片呢?这对这一层最终意味着什么?我不知道。
凯西·伍德: 我可以插一句吗?因为我们已经了解了这个概念,也许它和你说的不太一样,那就是Palantir,它是在所有这些遗留软件之上的一个智能层,随着时间的推移,它会取代这些软件的角色,仅仅因为它会更高效。我认为,是的,这感觉就是事情会如何发生,或者至少是事情发生的一种方式。
萨拉·弗莱尔: 是的。我认为用户界面会变成自然语言,对吧?这才是更有趣的地方,对吧?作为一名首席财务官,我上班后会说:“嘿,我们今天的所有用户指标怎么样?”我实际上并没有对任何人这么说。我会打开我的仪表盘,然后查看,然后跟踪我的事情。但是如果一切都只是更自然的语言呢?这会变得非常有趣。这始终是一个伟大的承诺,对吧?你知道的,当我开始做软件分析师时,TIBCO(信息盒公司),对吧,它将成为消除所有底层内容的那一层。布拉德刚刚去世了,他就像,“哦,我的上帝,她现在正在谈论TIBCO。”它只是另一个抽象层。但我认为,技术经常让人们感到排斥的原因是它不直观。我认为多模态做得很好,会变得非常有趣。
布雷特·温顿: 是的。而且我认为,任何面向消费者或企业的技术都可以灵活地发展,超越用户随时间的推移使用它的能力。例如,即使是iOS,这个神奇的消费者界面,也有很多小的旋钮可以调整,但我对它们都没有什么用,因为我需要学习所有这些。但是,我无法关闭每个工作日周末都会自动响起的闹钟,因为我不记得如何在用户界面中返回到那个设置。
人们有很多与技术相关的挫败感,我把这些归类为世界受到软件强烈影响的概念。在我们生活中所有这些小工具之间,我们缺乏软件界面层来使它们能够有效地协同工作。
思考人工智能的一种方法是,它充当所有这些技术,整个技术栈的新操作系统层。借助人工智能,任何会说某种语言的人都能够与之交互,并让它至少大致完成他们想要做的事情。相比之下,更改iOS的设置现在感觉就像重新编程录像机一样。希望我们永远不必再学习如何做这件事,因为应该有一层可以简化这个过程。
萨拉·弗莱尔: 确实如此。在产品开发中,有一个叫做“工作目标”(Jobs to be Done)的产品开发框架。它就像,工作是什么?你不需要一个10英寸的钻头。你需要一个墙上的洞来挂一个相框。克莱顿·克里斯坦森是它的设计者。我认为我们正越来越多地回到这一点。就像,我实际上想完成的工作是什么,而不是我该如何学习编程所有这些东西?
凯西·伍德: 在我们结束之前,我必须提到,你与查理·罗伯茨进行过一次谈话,他是我们风险投资团队的负责人。他提到你提到过根据需要即时生成操作系统的想法,这可能与我们刚才讨论的内容有关。是这样吗?是的。好的。这就是你描述它的方式。是的,这就是我所说的。
萨拉·弗莱尔: 我认为是这样的:它启动,完成任务,然后关闭。作为人类,对吧,我们一天到晚经历各种各样的时刻。例如,我可能会为我的团队准备演讲稿,开发一个Excel模型来概述我的资本配置,或者进行一些编码。我的财务主管一直在寻找使用Python脚本缩短结算时间的方法,这样我们就不会将CSV文件转储到Excel中,等等。
如今,世界上没有任何软件拥有像这样的动态用户界面。这才是真正让我感兴趣的地方。正如你所说,布雷特,我认为我们经常认为我们有很多可用的技术,但实际上,我们仍然没有。很大一部分人被排除在技术进步之外,这不仅仅是因为财富差距(尽管这肯定是一个方面),更多的是因为有效使用技术的能力。
例如,许多年龄较大的人发现技术具有挑战性。我的母亲患有黄斑变性,这影响了她的视力,使她难以与各种设备互动。相反,今天的孩子们可以轻松自如地使用技术。当我的孩子们试图通过触摸屏幕来更改电视时,我觉得很有趣,这反映了他们在一个触摸屏只是常态的世界中长大。
如果技术能够变得更加直观,我们将赋予世界更大的利用人类智能的能力。这不是我们通向人工通用智能(AGI)的途径吗?对吧?
布雷特·温顿: 没错,没错。我们正在汽车领域为人们节省大量手动操作车辆的繁琐工作。在日常生活中,我们也在解决那些笨拙、无法正常工作、无法满足你需求的问题,这并不是因为其能力不足,而是因为界面存在误解、故障或设计不良。完全正确。作为首席财务官,你该如何定价?我们可能会说,“好的,这个神奇的工具,我每个月给你1000美元。”那么,你如何在25财年为一个能够提供这种神奇的、消除所有技术体验摩擦的代理定价呢?
萨拉·弗莱尔: 哦,这就是我今天早上一直在折磨我们一位定价人员讨论基于价值的定价的地方。是的,因为有些任务你无法根据获得答案所需的时间、使用情况甚至代币来定价,因为它对他们来说可能是一个几乎无价的任务时刻,可能只需要几秒钟和很少的计算量。我认为我们公司现在需要更多构建模块,对吧?我们有我们的订阅模式,但是我们可以转向更多基于用量的模式吗?
我们该如何考虑,我刚才说过我不想创建自定义用户界面,但是我怎么知道你正在执行的任务的质量或价值呢?我应该能够知道这一点。然后我甚至会感兴趣,我们能否使用遗传技术来动态地进行定价?为什么不呢?它在定价方面可能比我们大多数人都聪明得多。
但就像我想要的那种感觉一样,我实际上不会给你一个很好的答案。然而,我想要的感觉是,当软件即服务和云计算出现时,它实际上真正成就了我的职业生涯,因为我花了一个整个夏天的时间自学这些递延收入模型,构建这些瀑布图,并证明对于这些公司来说,将会有这样一种他们经历的低谷,然后到达另一边。
这太痛苦了。没有人相信你可以通过订阅方式付费使用软件。正如你在本次通话一开始指出的那样,Cathie,甲骨文不遗余力地解释了为什么永久许可证是最好的商业模式。所以我认为我们还没有彻底改变这一点。
但我猜我很乐观,因为我认为我们才刚刚开始学习如何“吃自己的狗粮”或“喝自己的香槟”,让这些模型帮助我们开始思考定价问题。我认为这将是一个循序渐进的过程。我们已经从基本的订阅模式开始,我认为我们希望随着时间的推移考虑更多基于用量的模式。
在企业中,我们正在考虑越来越多的端到端解决方案,以允许人们进行实验。但是,是的,我认为我们一两年后还会进行这样的讨论。我会说,看,我告诉过你我们才刚刚开始。
凯西·伍德: 当我们评估OpenAI时,我们试图说,好吧,让我们想象一下,如果这可以取代四名工程师,为了定制我们自己的软件以用于我们自己的业务并提高效率,我们愿意支付多少钱?而且,你知道,Brett,我认为你抛出了1000美元,或者我们读到了一些东西说1000美元或2000美元一个月。对于这种工程师来说,这将是便宜的。
萨拉·弗莱尔: 没错。是的,我的意思是,作为一名前任CEO,每次你与任何团队坐下来,也许只是因为我在一家科技公司,瓶颈总是工程师的获取。就像要么我们没有足够的钱去雇佣足够的工程师,要么我们有足够的钱,但我们无法足够快地将他们纳入流程。因此,如果你可以突然生成一个代理软件工程师,我的意思是,这感觉像是对任何业务来说都是一种令人难以置信的倍增力量。我认为这对于客户来说有很多价值,但也能够反馈给OpenAI或生态系统,以便继续进行再投资。
凯西·伍德: 大多数人习惯于这样的模式,好吧,每月25美元,随着他们增加更多价值,价格会略微上涨。我们这里说的是一个阶跃函数,对吧?
布雷特·温顿: 谢谢你,Sarah。分配数十亿美元芯片资金之际,请留下一个信息,当我们12个月后再次进行这样的讨论时,代理很可能已经发布,它们将出现在世界上。我们将期待什么?或者你认为下一次谈话的重点是什么?
萨拉·弗莱尔: 我想对听众说的是,首先,我们才刚刚开始。你还没有被甩在后面,但我们正处于开始阶段,但你需要跳上这辆车,因为这列火车已经启动并正在加速。我会告诉每个人都要认真思考你如何将人工智能融入你自己的业务,也融入你的生活中,因为我认为这通常始于个人层面,但你如何将其用于专业领域呢?无论你处于什么水平,你现在都需要将其翻两番,然后去做。我很高兴在12个月或24个月后谈论人工智能如何解决世界上最棘手的问题,以及我们将看到的科学突破。
凯西·伍德: 我可以再补充一点吗?这是我们开始的地方。Sarah,很多人可能不明白对Sig Sigalis的引用。Sig Sigalis是Jenison Associates的创始人之一。我在Jenison工作了18年。他是我导师,给了我在事业上的大突破。他非常相信你,Sarah。实际上,他给了很多女性在我们行业的大突破,尤其是在她们与技术有关的时候。所以我知道他多么欣赏你,Sarah。而且我认为我们在去年左右失去了他。所以我们会想念他,但我们会为他继续前进。没错。
萨拉·弗莱尔: 没错。我们正在传承这种精神。谢谢你,Cathie,成为如此的榜样。
凯西·伍德: 哦,谢谢你。还有你,Sarah,谢谢你。并祝贺你取得的所有成功。我们为你感到兴奋。完美。
布雷特·温顿: 与Sarah和Cathie的谈话真是令人着迷。我确实经常在个人和职业生活中使用ChatGPT。正如Sarah所说,我鼓励你们所有人这样做。没有什么比尝试这项技术更能理解其实际能力和当前局限性的地方了。
正如本集中所述,我们认为人工智能的性能提升大约每四到五个月每美元投资翻一番。从业务结果可以看出,资金正在涌入,以资助额外的研发工作并增强模型的能力。在接下来的12到24个月里,看到这些系统变得多么强大将会非常令人兴奋。
在大约两到三年内,我们相信这些系统的性能将提高100到1000倍。思考这个问题的一种方法是将第一代iPhone与今天的iPhone进行比较,在CPU处理速度方面,今天的iPhone大约比第一代iPhone强大100到1000倍。
非常感谢您收听FYI,即“为了您的创新”播客。请在您习惯使用的任何播客平台上点赞和订阅。去尝试尽可能多的AI系统,并请下周再次收听。
参考资料: https://www.youtube.com/watch?v=SImm15uF_3Q,公开发表于2024-12-12
关注公众号后设🌟标,掌握第一手AI新动态