“云计算的本质是用软件替代软件,而生成式 AI 是用软件替代服务”
本篇文章是红杉资本 2024 AI Ascent 大会的总结和分析,重点探讨了生成式 AI 的商业机遇和挑战。生成式 AI,具备生成和推理能力,因此具有巨大的商业价值。
文章通过比较云计算的商业化路径,突出了 AI 应用的惊人商业化速度。同时,文章也指出了 AI 应用在日活用户比例和次月留存率等核心运营数据上的问题,而这也是未来的机遇。
因为只要有用户在使用,AI 应用就能通过快速迭代来满足用户更多的需求,并使其变成高频应用。
此外,文章还提到了 AI 在客服,法律服务,软件工程等领域的实际应用案例。
新的机遇
生成式 AI 同时具备生成(Create)、推理(Reason)能力,这意味着基于此构建的软件第一次有了类人交互(Interact)界面,因此蕴藏着巨大的商业机会。让我们通过与最近一轮技术浪潮:云计算进行类比。虽然这个类比不够精确,但足以让我们看到未来的增长潜力。云计算带了新的业务模式(分时租用)、新的应用程序(SaaS)以及人们与技术交互的新方式(随时随地访问)。让我们将时针拨回到 2010 年。在云转型早期阶段,整个市场的规模是 3500 亿美元,其中只有 60 亿是云软件。截止到去年,软件市场的规模翻番来到了 6500 亿,随着云软件的快速渗透和普及,云软件的市场份额达到了 4000 亿美元,是 13 年前的 60 多倍,多么惊人的增速!云计算本质上是软件替代软件。而生成式 AI 是用软件替代服务,而这是十万亿美元的市场规模。前所未有的机遇,其中会诞生多少独角兽企业,无需多言,在座各位自行体会。历史不会完全重复,但有相似的韵脚。让我们看看最近几轮技术变革,是如何相互作用,又是如何引领潮流,让技术飞入寻常百姓家。为什么我们要去回顾这段历程?因为技术变革并不是一蹴而就,而是叠加了前几轮技术变革的势能。人工智能的概念并不新鲜,它可以追溯到 20 世纪 40 年代。但要把这些先贤们的想法、梦想变为现实,并成为惠及大众的方案和产品,离不开强大的算力、海量的数据、可靠的网络以及移动的设备。所以,从现在到未来 10 年甚至是 20 年,都将是人工智能的白金时代。因此,我们对这个尚未证实的假设坚信不移并身体力行。我们还是将视角往回拉,去看看在云计算以及移动互联网时代,那些乘风而起的独角兽们。最有趣的不是图片的右半部分,重要的不是我列的这几家企业的 logo,而是这部分的空白。这大片空白同时意味着:前景广阔、机会多多。不得不佩服投资人的乐观精神以及“画饼能力”,主题宏达,逻辑清晰,推理严谨,这个愿景我是信了。
近一年回顾
截止到今天,GPT4 正式对外发布正好满一周年。在这一年里,生成式 AI 的发展一日千里,让人目不暇接,以至于我们不敢停下脚步,生怕错过了这波浪潮。此时此刻,让我们先按下暂停键,一起来回顾一下近一年 AI 的发展历程。总的来说,经过一年的快速发展,AI 已经无处不在,并真实改变了我们日常的工作和生活。Klarna 智能客服机器人在接入 OpenAI 的前四周内,就处理了 230 万客服对话,承接了 2/3 的客户咨询量,相当于 700 个全职客户经理的工作。据统计,全球有数千万个呼叫中心坐席,可以想见这里的市场有多大。关于客服机器人场景,还有翻车的案例。前不久加拿大航空就因为智能客服的「瞎说」导致他们输掉了一场官司。在将 AI 推广到线上环境时,那些涉及外部用户支持的服务尤其要谨慎。
https://www.forbes.com/sites/marisagarcia/2024/02/19/what-air-canada-lost-in-remarkable-lying-ai-chatbot-case/?sh=1bce92be696f
在一年前,法律服务并成为最不先进的行业之一,是最不愿意承担的风险的行业。而现在像 Harvey 公司提供的产品,正在自动化了律师的工作,让他们从繁重、琐碎的事物中解脱出来。在法律行业,腾讯乐享在旷真律所的实践案例值得大家一看。通过 AI 问答,让律所员工可以更高效地获取历史判例,助力员工成长,打造学习型组织。
在一年前,用 AI 写代码还在理论阶段,而一年后却变成了现实,并一跃成为了一个可媲美人类的 AI 软件工程师。截止到 2024 年 4 月底,Github Copilot 已经积累了 180 万的付费用户,ARR 突破了 2 亿美元。尽管 Github Copilot 仅仅是一个代码助理,但它实实在在帮助软件工程师提高了编码效率和质量。
过去一年生成式 AI 应用创造的收入突破了 30 亿美元,且不包含 Google、 Azure、AWS 这些云服务商获得的 AI 相关收入。
单看数字的绝对值并不大,但横向对比 SaaS 的商业化路径后,AI 应用仅用了 1 年时间就做到了 SaaS 10 年才达到的收入规模。由此可见 AI 应用惊人的商业化速度。在这里红杉分析师再次用到了类比手法,使得听众对这个收入增速体感更深。不过还有几点值得注意:1)这 30 亿美元有一半是来自 OpenAI 贡献;2)30 亿美元的收入,背后对应了超过 500 亿美元以上的资本投入,这个投入规模之巨大是当年 SaaS 所不能及的。
ChatGPT 是我们最熟悉的 AI 应用, 但并不是用户唯一使用的 AI 应用。当我们深入分析 AI 应用的活跃用户数和收入规模时,不管是 C 端还是 B 端应用,初创公司还是科技巨头,他们的产品都与不同行业的客户建立了深度连接,并找到了产品市场契合点(PMF)。越来越多的基础大模型不断涌现,并拿到了近 8 成的融资金额,而我们之前预计的应用层的寒武纪大爆发并没有如期到来。随着 Inflection 团队被微软收编,基础大模型也进入到了残酷的淘汰赛阶段,也许 2024 年才是 AI 应用大爆发的元年,让我们拭目以待。
过去一年,虽然生成式 AI 应用在用户和收入规模上取得了惊人的成绩,但当我们深入去看这些应用的日活用户比例、次月留存率这些核心的运营数据时,会发现相关的指标远落后于移动互联网应用。这既是问题,也是机会。问题在于大部分用户可能是抱着尝鲜的目的使用产品,机会在于只要有用户在使用,AI 应用就能通过快速迭代来满足用户更多的需求,并使其变成高频应用。当我们采访用户为什么他们不经常使用 AI 应用时,得到最多的反馈是:用户期望与现实的差距太大,这极大地打击了用户进一步探索并使用产品的信心。随着基础大模型持续迭代,模型的基线智能水平不断地提升,将极大加速 AI 应用 PMF 的进程。对比 X 上惊艳的产品 Demo 以及实测视频的卖家秀,就能体会到期望与现实的落差有多大了。但这不意味着团队要等到大模型成熟后才开始做 AI 应用,否则真的到了那一天,相比于已经积累的大量用户场景和数据、模型精调经验的同行来说,你的竞争优势在哪里呢?
让我们再来回顾一下 iPhone App Store 上的应用变迁。在 iPhone 最早一批商家的应用中,尽是一些诸如:喝啤酒、变魔术、翻杯盖、手电筒之类的简单好玩的应用。它们要么演变成了系统内置应用,要么变成了无关紧要的玩具,消失在了历史长河中。直到 2010 年后(距离 iPhone 发布过去了 3 年时间),才出现了 Instagram 和 DoorDash 这类高活跃应用。这些产品花费不少时间,来围绕智能手机的全新能力(地理位置、相机)来构建原生的移动端产品。我们很难确定谁会成为 AI 时代的 Instagram,但是同样的剧本已经在上演了。手电筒应用后面变成了系统内置应用,同时预示着目前大多数的大模型「套壳」应用,未来将成为基础大模型的标配功能。大家还记得汤姆猫的应用吗?
我们已经看到了一些开始崭露头角的初创公司,但显然比这张 PPT 提到的几个用例要丰富得多。正如前文提到的 Klarna 案例,客户支持是企业应用中最早一批完成 PMF 验证的赛道,Klarna 的成功绝非个例,这是系统性的机会。AI 陪聊(AI friendship)是最令我们惊讶的领域,我们花费了几个月的时间思考才搞清楚这里面的门道。从实际的数据来看,这类产品的用户粘性很高。最后是企业知识管理,后面我们会听到 Glean 和 Dust 关于企业级知识管理的分享(难道是闭门分享?没有找到相关信息呢),我们认为 AI 正在为企业知识管理开启新的大门。关于企业知识管理,在 AI 加持下,这里的机会和策略值得单独来一篇文章来阐述。
最后,我们对 2024 年 AI 的发展做几个展望和预测。- 从助手(Copilots)到代理(Agents)。Copilot 定位还是一个工具需要你给予明确的指令,而 Agents 将具备更多的自主意识,像一个同事(Cowork)一样,帮助你完成完整闭环的现实工作流程。我们已经看到了 Agents 在软件工程、客户服务等领域的发挥的作用,后续吴恩达教授会对此做更加深入的讲解。
- 规划(Planning)和推理(Reasoning)。现有的大语言模型一个主要问题在于,它们只是基于统计概率对文本做预测,而不是在做推理和规划。最新的研究正在尝试为大模型赋予真正的规划能力,并有望在明年让 AI 具备执行更高阶认知任务的能力,比如规划和推理。稍后 OpenAI 的 Noan Brown 会详细讲解。
- 可靠性(Reliability)和鲁棒性(Robustness)。从消费级应用到真正的企业级应用(比如医疗、国防等),人们对 AI 可靠性的要求会越来越高。所幸的是,一系列新的工具和技术(例如:RFHL、向量数据库),正在帮助大语言模型在特定场景下将可靠性提高到 99.999% 水平。
- 原型(Prototyping)到产品(Production)。在 2024 年,我们将看到大量 AI 应用从原型阶段走向生产环境。这意味着你不仅要优化响应延迟和成本,还需要关心模型以及数据的所有权问题。同时也预示着计算资源将开始从预训练转向推理,来满足更多用户日益增长的生成任务需求。
未来会怎样
Sonya 重点介绍了生成式 AI 当下的进展和最新的状态,接下来这一部分我们将从更加宏观的视角来看 AI 对整个社会更广泛的影响。
技术有很多种类型。有像电话这样的通信革命,也有像火车这样的交通革命,还有联合收割机带来的粮食生产革命。这类技术革命遵循着这样一种范式:从人类使用工具开始,到人机协同助手,最终转变为人类与机器网络的合作。接下来我们讨论的两个预测,都与这层合作密切相关。范式革命(Pattern Revolution),直译过来是模式革命,考虑到陆奇多次在公开场合用得是范式革命这一概念,为了保持一致,因此讲 Pattern Revolution 翻译成:范式革命。关于这部分的细节,请参考陆奇一年前的分享《新范式 新时代 新机会》,五星推荐。
https://miracleplus.feishu.cn/docx/Mir6ddgPgoVs3KxF6sncOUaknNS
镰刀,作为人类的工具已经被使用了上万年;1831 年发明的机械收割机,作为单一的机械系统、人机协同的助手使用了 100 多年;而今天,我们生活在联合收割机的时代,这是一个由数以万计的联合收割机组成的复杂机械网络系统。我试着从 AI 视角来重新理解这个机械网络。Agent(代理),就像机械系统中的单台机器一样;Reasoning(推理),就像是这些机器之间的拓扑结构和信息传递方式。本质上,我们正在 AI 底层能力之上构建更加复杂的抽象层。软件开发一开始是专业人士通过手工方式用纸笔完成逻辑运算,这个过程没有机器参与。后来我们进入到了机器辅助时代,不仅有计算机这类硬件设备,还有图形化的集成开发环境(IDE)来加速软件开发。而现在,我们正在进入一个新的时代,在这个时代中,这些系统在复杂的网络中协同工作,构建复杂的工程。在这里,Agent(代理)一起工作生成代码,不是一次生成一个,而是并行不悖、和谐一致。类似的范式革命同时在「写作」领域上演。写作早期是一个纯手工的过程,随着时间的推移,我们有了键盘、手写本这类软硬件工具来帮助我们提升写作效率。到现在,我们用的不只是一个 AI 助手,而是一个助手网络(network of assistants),当我在工作流中使用这个网络时,它们会同时调用 GPT-4、LLaMA、Claude 等多个底层模型,它们不仅互相协作,还会相互博弈,并最终呈现一个最优的结果。这就是我们看到的未来。那这场范式革命对我们意味着什么?用经济学语言来讲就是:显著的成本降低。下图左半部分显示的是标普 500 公司产生 100 万美元营收所需的工人数量正在极速地下降。这个趋势还在继续,好消息是这不意味着我们可以做得更少,而是我们可以做得更多。幸运的是,在过去所有涉及到这类技术范式变革的领域,成本都显著降低了。例如计算机软硬件、电视机。但是,对于社会发展至关重要的几个领域:教育、医疗、住房,它们的价格增速远远高于通货膨胀的速度。这是我对 AI 作为一场成本驱动生产力革命的第一个结论,它将帮助我们在几个社会关键领域中用更少的资源,做更多事情。不仅是成本数字的下降,而且是成本结构的变化。陆奇在《新范式 新时代 新机会》的演讲中提到了一个纸质地图到 Google 地图转换的案例,更形象地解释了成本变化带来的新机会。
https://miracleplus.feishu.cn/docx/Mir6ddgPgoVs3KxF6sncOUaknNS
就在一年前,英伟达的黄仁勋在公开场合曾做过这样一个预测:在未来,像素不再是被渲染,而是被生成出来的。如何理解黄教主这句话所表达的意思?而“任何视觉信息都将被生成”这句话又意味着什么?让我们从字母「a」开始。在过去,「a」被机械的存储在计算机中,它的 ASCII 码值是 97,并用一组像素点(零一像素矩阵)来记录它的字形。而现在,用来描述字母「a」的是一个具有多维点(Multidimensional Point)的概念(Concept),它既不是一个码值,也不是一组像素点(对应到计算机工程视角,指的应该就是 Embedding 向量化的过程)。在未来,对于大模型来说,字母「a」不仅仅是多维点以及如何获取并渲染出可视化的图像,而是通过上下文理解字符的整体含义,它是多维的。令人惊讶的是,这反映了人类的思维方式。我们不会把字母「a」记录成一组像素点,而是将其视为一个抽象概念。坦白讲对于这段的理解还有一些不太明确的地方,尤其是关于多维空间(Multidimensional Space)。出于文章的完整性考虑,还是对这部分的演讲内容做了翻译,过程中加入了个人的理解,如有不正确的地方,欢迎大家指正探讨。
现在,正如 Klarna 在客户支持中做得那样,我们已经开始把 AI 集成到具体的业务流程和 KPI 中。他们有明确的 KPI,并通过优化信息检索系统来提升客户体验。伴随着新的交互方式,在未来,当万物皆可生成时,整个公司可能会像神经网络的运行方式。让我举个更加具体的例子。这是一幅简化后的客户服务流程图。客服部门有一些关键绩效指标,包含了:文本转语音、语言生成、客户个性化等能力,这些能力又形成子流程和子优化目标,最终形成一张完全连通的图。从语言生成到客户服务的终极目标。通过抽象,客户支持流程将由神经网络来管理、优化和改进。类似的还有企业获客流程。从基于 AI 的语言生成到增长引擎再到广告定制和优化,这一切都将相互影响,使得整个公司能像神经网络一样运行。这将催生「个人公司(Person Company)」的崛起,「个人公司」不是为了让个人做得少,而是为了让个人能做得多,解决更多问题,创造更好的社会。那未来会如何演进?很明显是由在座各位来决定,你们正在创造未来。我个人对未来非常兴奋,因为我相信 AI 将帮助我们在社会最核心的领域,降低成本并提高效率。这就是今天把大家召集在一起的原因,一起去探讨如何利用 AI 带来的技术革命,去化繁为简,去创造更光明的未来。参考链接
红杉 AI 大会:AI 最大的机会之一,是用软件取代服务
Sequoia convened leaders in AI for a day of conversations, talks and demos.
https://www.sequoiacap.com/article/ai-ascent-2024/