当 OpenAI、Anthropic、Google 和 Meta 继续扩展推理层,开发出越来越强大的推理机器时,未来会如何?我们会走向“一个模型统治所有”的局面吗?生成式 AI 市场早期曾有一个假设:某个单一的模型公司将变得极其强大,足以整合所有其他应用。然而,到目前为止,这一预测有两点是错误的。首先,模型层依然存在激烈的竞争,最前沿的技术不断被超越。虽然有人可能通过自我博弈,实现模型的持续自我改进,并因此引发“突飞”,但目前我们还没有看到这样的迹象。相反,模型层的竞争如刀尖上的较量,自从上次开发者大会以来,GPT-4 每个 token 的价格下降了 98%。其次,除了 ChatGPT 外,模型尚未在应用层掀起巨大的波澜。现实世界充满复杂性。顶尖的研究人员并没有兴趣去了解每个垂直行业的端到端工作流程的繁琐细节。他们更倾向于停留在 API 这一层,这既有吸引力,也更加经济合理。而开发者则可以处理现实世界的复杂性。对应用层来说,这是个利好消息。复杂的现实世界:定制化认知架构 作为科学家,你规划并执行目标的方式与作为软件工程师时截然不同。即便是软件工程师,在不同公司中工作方式也会大不相同。尽管研究实验室不断推动通用推理的极限,我们依然需要特定领域和应用场景下的推理来交付有效的 AI 代理。现实世界的复杂性要求大量特定领域和应用场景的推理,而这些推理无法通过通用模型高效实现。
6、“销售工作”的意思是什么?
Sierra 就是一个很好的例子。B2C 公司将 Sierra 集成到他们的网站上,负责与客户交流。Sierra 的工作是解决客户问题,它按每次解决问题的数量来收费,这里并不存在“按席位收费”的概念。你有一个需要完成的任务,Sierra 完成了这个任务,获得相应的报酬。对许多 AI 公司而言,这就是他们的“北极星”。Sierra 的优势在于,当它无法解决问题时,能优雅地将问题转交给人工处理(即升级到人工客服),但并非所有公司都有这样的幸运。现在出现的趋势是,首先将 AI 作为辅助驾驶(human-in-the-loop)部署,并通过这些使用机会逐步积累经验,最后实现全自动化部署(无人工参与)。GitHub Copilot 就是一个典型案例。新一代自主型应用 随着生成式 AI 推理能力的提升,一类全新的自主型应用开始涌现。这些应用层公司的形态是怎样的呢?有趣的是,它们与传统的云计算公司看起来有所不同:
云计算公司主要针对软件利润池,而 AI 公司则瞄准服务利润池。
云计算公司通过按席位收费,而 AI 公司按成果收费。
云计算公司倾向于无缝的自下而上分发,而 AI 公司则越来越多地采用自上而下的高接触、高信任交付模式。
我们看到,在知识经济的各个领域,一批新兴的自主应用正快速涌现。以下是一些例子:
Harvey:AI 律师
Glean:AI 办公助手
Factory:AI 软件工程师
Abridge:AI 医疗记录助手
XBOW:AI 渗透测试员
Sierra:AI 客户支持代理
通过大幅降低这些服务的边际成本(与推理成本的急剧下降同步),这些自主型应用正在不断扩展,并创造出全新的市场。举个例子,XBOW 正在开发 AI 渗透测试员。“渗透测试”是模拟的网络攻击,旨在帮助公司评估其安全系统。在生成式 AI 出现之前,企业只会在特定情况下(例如为了满足合规要求)雇佣渗透测试员,因为人工渗透测试十分昂贵,这是一项需要高度专业技能的人工工作。然而,XBOW 展示了其基于最新推理 LLM 的自动渗透测试,其性能与最优秀的人类渗透测试员相媲美。这不仅大大扩大了渗透测试的市场规模,还为各种规模的公司提供了持续渗透测试的可能性。
这一领域对战略投资者的吸引力较小,但对风险投资者而言更有前景。在云计算转型时期,大约有 15 家年收入超过 10 亿美元的公司诞生在这一层。我们预计 AI 转型期间也会有类似的情况发生。
应用程序
对风险投资来说,这是最令人感兴趣的一层。在云转型期间,大约有 20 家应用层公司达到了 10 亿美元以上的年收入;在移动转型期间,也有约 20 家类似的公司诞生。我们认为,在 AI 转型中也会出现同样的趋势。
9、结束语
在生成式 AI 的下一个阶段,我们预计推理研发的成果将快速且深入地渗透到应用层。过去,很多认知架构依赖于巧妙的“解锁”技术;而随着这些能力逐渐深度嵌入到模型中,自主应用程序的复杂性和稳健性将会迅速提升。在研究实验室中,推理和推理时计算将继续成为未来的重要议题。随着新的扩展法则的出现,新的竞赛已经开始。但在特定领域中,获取真实世界的数据并构建领域和应用特定的认知架构仍然是一个巨大的挑战。这意味着,在解决现实世界中多样化问题时,“最后一公里”的应用提供商可能更具优势。展望未来,多代理系统,如 Factory 的“机器人”,可能会成为建模推理和社会学习过程的主流方式。一旦 AI 能够执行工作,我们将能组建团队,让“工人”完成更多任务。我们所期待的,是生成式 AI 的“第 37 步”时刻——就像 AlphaGo 在与李世石对战的第二局中出人意料的那一步棋。当一个通用 AI 系统展现出超越人类的思考和决策时,那一刻便会到来。这并不意味着 AI 将“觉醒”(AlphaGo 并没有),而是 AI 在感知、推理和行动的模拟过程中,能够以全新的方式进行探索。这或许就是通用人工智能(AGI),但如果是这样,它并不会是单一的奇迹,而是技术发展的下一个阶段。