自主 AI Agents的崛起:解析市场格局

文摘   科技   2024-07-22 16:25   美国  

在人工智能的广阔天地中,"Agent"是一个核心概念,指代的是能够自主执行任务、做出决策,并且能够在其环境中感知并作出反应的智能系统。这些AI Agents可以是简单的软件形式,如个人助理和聊天机器人;也可以是复杂的自主机器人,如自动驾驶汽车和先进的制造机器人。随着技术的进步,它们的智能程度和应用范围正在迅速扩大。

AI Agents的发展历程见证了从规则驱动到学习驱动的演变。最初,这些系统主要依赖固定的程序指令来操作。然而,随着机器学习和深度学习的兴起,现代的AI Agents能够通过观察和经验自我优化,适应新的挑战和环境。这种能力使得它们在数据分析、用户交互、自动化任务处理等多个领域展现出了巨大的潜力。

Aura Ventures 发表了一篇关于AI Agent的详尽文章,深入剖析了这一领域的最新进展和未来发展方向,希望对你有所启发。

本文来自: https://medium.com/aura-vc/investment-thesis-debundling-the-market-landscape-the-rise-of-autonomous-ai-agents-ae618e5ff07e


01

引言

人工智能的世界正以惊人的速度发展。Agents 的引入证明了这一领域正在走向成熟。
Agents 是能够感知其环境、做出决策或采取行动,并实现特定目标或目的的系统。
Agents 市场预计将从 2023 年的 50 亿美元增长到 2028 年的290亿美元,年复合增长率为43%。最近对该领域的兴趣引发了"Agents 是人工智能夏天的郁金香"这一说法。


Source: Star-history.com


它们将是the next big thing。
Octane AI "公司联合创始人 Ben Parr 对此发表了自己的看法:"Agents 代表着新一轮的革命浪潮,不仅将改变科技行业,更将影响整个商业世界。我预测,在未来十年内,将会出现多家完全由自主智能代理运营的市值超过十亿美元的公司。"



02

Agents 相比 LLMs 提供了能力上的阶跃式变化

Agents 在执行高度复杂任务和解决问题方面的卓越能力,为我们开启了许多单靠大型语言模型( LLMs )无法实现的全新应用场景。

教育科技领域就是一个很好的例子:我们正在从传统的一对多教学模式转向一对一个性化辅导。在这种模式下,充当导师角色的 Agent 能够不断调整和优化学习体验,根据每个孩子的独特需求提供高度定制的课程内容。据 Cornell University 的研究显示,这种方法极大地提升了学习效果。

目前,业内广为人知的 Agents 框架主要有两种:
一是SWYX提出的框架,该框架将智能代理类比于人脑的工作方式;二是Lillian Weng最近提出的框架,这个框架更加深入,详细探讨了智能代理在记忆、工具使用、规划和行动等方面的各个子组件。这两种框架都为我们理解和开发Agents提供了重要的理论基础。


Source: SWYX and Lilian Wang, 2023


无论是SWYX还是Lillian Weng的框架,都强调了智能代理在任务分解、环境适应、交互能力和记忆存储方面的关键作用。这些功能在智能代理的运作过程中形成了一个持续循环的工作流程:
1. 目标设定与任务规划:智能代理首先被赋予明确的目标,然后将这些宏观目标细化为可执行的具体任务。
2. 动态适应能力:智能代理能够从过往经验中学习,并根据环境变化灵活调整自身行为。这种自适应能力使得其性能能够随着时间推移而不断提升。
3. 多维度交互与执行:智能代理具备与多种外部因素进行交互的能力,这包括与其他智能代理协作、调用各种工具,以及与人类用户互动。例如,它们能够自主浏览互联网获取信息。
4. 响应感知与处理:智能代理能够处理和解读各种数据输入,并基于这些信息做出合理的决策。
5. 记忆存储机制:智能代理拥有存储长期和短期记忆的能力,这使得它们能够建立起持续性的知识积累。
这个循环过程使得智能代理能够不断学习、适应和优化,从而在复杂多变的环境中有效地完成各种任务。



03

“God Mode Agent Stack” 的解绑和 Agents as a Service

随着 Agents在节省人类宝贵的时间和金钱资源方面展现出巨大潜力,市场对它们的需求必将持续增长。基于这一趋势,我们提出了两个前瞻性观点,这些观点受到不同因素的驱动:
观点 1:God AI Agent 技术栈的解绑
最终,"God Mode AI Agent 技术栈"(暗指通过整合多个工具/API 跨各种用例的一个 AI主宰一切的概念)将被解绑。我们的观点是这个领域将会分散。这个观点背后是"AI fleets(多个AI舰队)"的概念。对这个市场采取赢家通吃的方法可能被视为反竞争的。Multi-agent systems(MAS)的兴起和力量也推动了这一发展。
观点 2:Agents as a Service
支持 Agents 部署的基础设施层仍处于初期阶段,大多数 Agent 框架(如BabyAGI)仍是实验性的开源项目。随着对Agents需求的增长,这些基础设施的标准化和成熟化将成为必然。我们预计,每个细分领域都将逐步实现产品化,转变为可直接使用的应用程序或 API。未来,人类将能够像使用产品一样创建或雇佣 Agents 。例如,AI 自主工作者 Katherine 就是一个典型案例。据Theeuf报道,"Katherine为Visla公司工作,在 Upwork 平台上竞标文案工作。她在争取工作方面已经取得了显著的成功。"这个例子生动地展示了AI Agent在实际工作中的应用前景。



04

新兴的Autonomous AI Agent市场地图

尽管这是一个新兴领域,我们已经确定了自主AI代理市场的三个关键层面,这些层面与我们的投资策略高度契合。



Aura Ventures Emerging AI Agent Landscape Map

我们将按照成熟度的顺序,详细解析市场地图的每个组成部分:


AgentOps

这个领域由七个核心组件构成,它们共同形成了可模板化的"框架",未来有望在专门的市场平台上进行分发。早期的概念验证包括 Teenage-AGI、Baby-AGI 和 AutoAGI 。

🧠智能 — 代理的"大脑",由 LLMs 驱动,负责任务创建、规划和上下文,它们理解并生成自然语言,拥有广泛的世界知识,并能学习。LLMs通过API或开源方式使用,HuggingGPT 、 Falcon 和 GPT-4 等是较为先进的代表。一些特定领域的数据即服务(DaaS) 初创公司和模型中心也属于这一类别,如提供心理健康数据API的Sahha 。在这个领域,分发优势、成本控制、社区壁垒和模型质量将是制胜关键。

📃代理记忆 — 获取、存储、保留和检索数据,可分为短期、长期和感官记忆。向量数据库和embedding框架的普及是这方面的关键。主要参与者包括Pinecone和Chroma ,以及像 Perplexity AI 这样具有集成优势的Text to SQL的初创公司。

🔌工具和插件 — 创建、修改和利用外部对象来做超出LLM限制的事情。外部工具可以显著扩展模型能力,例如浏览器扫描和桌面启用。目前,这些实用程序主要以提示和技能库的形式存在,值得关注的有SLAPA(一个自学习API系统)和Relevance AI(以用户体验和低代码创建代理链著称)。GPT也在创建插件市场。我们将会看到更多模型无关的平台和能够横向整合的平台参与其中。

👨‍👩‍👧多代理通信模式 — 由多个AgentOps组件构成的复杂agent系统,需要专门的服务来优化它们之间的交互,这为多代理学习、反思和解释创造了可能。这些目前主要以提示技术的形式存在。例如,CoT提示 (Wei et al, 2022)和Reflexion(Shinn & Labash 2023)。我们预测这个细分市场将成熟,能够将这些模式产品化的参与者将会脱颖而出。

🔮多代理playgrounds和协议 —这一组件旨在解决agent网络之间的通信协议问题。业内需要一个类似于 If This Then That,但专门针对agents的平台。目前这方面的实验已经在本地进行了概念验证,例如 CAMEL,它有三个代理交互,比如一个交易机器人:用户agent是股票交易员,AI助手是py编码器,特定任务agent充当经理。其他包括PumaMart 和模拟人物游戏Generative Agents。E2B 是这个领域的一个新兴参与者。

👮‍♂️监控、安全和预算 — 这一组件负责监控整个系统的安全性,包括智能、记忆、工具和插件、通信和协议等方面。同时还需要实施资金使用限制。目前业内仍在探讨是在工具层面还是代理层面进行监控更有效。无论如何,能够通过全面监控、安全管理和跨平台预算控制来优化agents的参与者将在竞争中胜出。

🤝AgentOps 市场 — HuggingFace传统上一直是模型分发的主要平台,现在有机会创建一个类似的产品用于agents,类似于 Smol-ai Developer所做的,它为AI工程师提供简单的用户界面,帮助他们为特定任务选择最佳的代理基础设施。


Applications

Agents将"成为产品"。随着格局的成熟,我们将看到许多agents被产品化并通过闭源或开源模型实现商业化。根据e2b的分析,目前约有一半的智能agent采用闭源模型,主要针对特定的应用场景,而另一半则采用开源模型。
在这个新兴市场中,主要有两类产品正在形成:
🧑 通用型agent — 这类产品旨在为个人用户提供前所未有的数据驱动智能服务,使高级智能能力得以普及。它们的设计理念围绕"用户要完成的工作"展开,病毒式传播、建立分发优势的能力,以及专注于可防御大型科技公司的特定领域将是取胜的关键。目前个人编程助手是最常见的应用,例如GitWit和GPT-Engineer 。此外个人生产力工具和智能助理领域也在快速发展,代表产品包括Embra AI(面向MAC用户的个人助理)和 Dust(生产力助理)。
🏢 行业特化型agent(虚拟劳动力)— 这些是经过上下文特定业务规则或数据微调的垂直化用例。对于雇主来说,这能显著降低成本并提升产出(减少全职员工数量)。我们预计,向AgentOps下游移动的现有人工智能公司在这个市场上将具有优势,他们的技术栈更具防御性。而反应敏捷的在位者也有可能胜出。这种需求正在快速增长,例如, Curious Thing AI 公司开发的语音 AI 支持机器人 Lucy 已经受到全球客户的青睐。其他早期参与者还包括YC孵化的Flint(教育科技领域)、BrainFish(销售领域)和Dialogue (设计领域)。


Services

🚀 自建智能agent平台

这个领域正吸引大量参与者。这些平台提供低代码或无代码解决方案,使企业或个人用户能够轻松创建和部署智能agent。要在竞争中脱颖而出,用户体验(UX)、客户支持和针对特定用例(如B2B、B2C、不同行业)的定制化能力将会是关键。这类平台面临的主要挑战是客户留存(即LTV:CAC),它们的策略将从"不惜代价获取用户"转向"不惜代价留住用户"。提高用户粘性的关键在于集成能力和用户体验(如支持服务)。代表性公司包括:Relevance AI、XpressAI、SuperAgentAI 和 AgentRunnerAI。

💸 智能agent市场
随着智能agents的快速发展,将会出现专门的应用市场来分发这些产品。我们认为B2C领域更可能依赖这种市场模式,B2B领域很可能会更直接(Google几乎是所有B2B SaaS公司的marketplace,我们预计AI应用会类似)。目前,一些现有平台已开始扮演这个角色,如GitHub和Fiverr(令人惊讶的早期采用者)。同时,新兴平台也在崛起,NexusGPT专注于自由职业智能agent市场,MindOS覆盖范围更广。未来,我们可能会看到针对特定行业或功能领域的AI员工"套装"或"舰队"作为产品出售。

🎮 多智能代理监控平台
这是一个新兴的开放类别,为多个智能agent提供统一的控制和监控界面。这类平台有望在企业和个人层面都找到应用场景。要在这个领域取得成功,关键在于能够以平台无关的方式构建集成和API。虽然这个领域还处于萌芽阶段,但Alphakit.AI已经成为先行者,它允许用户在手机上监控个人智能agent。



05

令人兴奋的五个预测

我们对Agent技术栈中能提供长期价值并深度嵌入的机会感到兴奋。以下是我们的五个预测:

Five predictions we are excited about at Aura

1. AgentOps 交付中的空白领域
AgentOps 实际上是 AI 工程师技术栈的产品化。目前,AgentOps 的各个层面仍处于萌芽状态,并且主要是开源实验,在多agent协议、通信架构和监控/安全方面尤其明显。对于前两个领域,我们认为拥有分销优势和卓越用户体验的现有企业有机会胜出。这个市场可能会出现"赢家通吃"的局面,能够达到网络效应或易于集成的玩家将获胜。值得关注的是垂直行业和现有平台生态系统如何竞争,如OpenAI vs Google。关键问题是:是否会有一个参与者从传统的"工具提供"模式转向进一步开发新兴领域,还是这个空间将留给现有平台。我们对这个快速变化的领域的机会感到非常兴奋。


2. 应用层的机会
应用层会出现噪音,高度垂直化或具有强大产品主导增长(PLG)理念的参与者将会胜出。Agent"原生"初创公司的快速自学习机制将使它们能够颠覆传统 SaaS 市场。"独立开发者"现象推动了这一独特机会。我们对将这种趋势与"智能"相结合,并整合定制化基础设施来实现特定目标的机会感到兴奋。在这个市场中,有两种方式可以"取胜":
a) 通过将智能agent嵌入工作流程的垂直行业应用。例如,金融科技公司正在采用 FinGPT并将其与内部知识产权数据结合。
b) API “Agents as a Service”模式。随着AI应用逐渐成为提升效率和准确性的基本要求,初创企业将迎来绝佳的市场切入机会。这个领域将由PLG驱动。
目前提供"数据即服务"(DaaS) API的企业,如 Sahha,正在向"Agent即服务"(AaaS)迈进。Sahha 的神经科学部门负责人 Gurleen 强调了公司的核心战略:"我们致力于构建具有情境awareness的数据优势,这将是实现个性化AI医生服务的关键"。来自Curious Thing AI的David 表示技术知识产权对这两个领域都至关重要。"单机 LLM 是一个重要趋势,找到新的高效调优和训练方法将是关键。"


3. 聚合器和agent交易平台的需求
基于市场解构的理论,聚合器和交易平台将变得重要。由于agents的天然特性它们将更快地达到网络效应,并且随着更多用户与agents互动,还将推动防御性飞轮。早期采用将出现在营销、设计师和销售agents的市场中。因此,零工经济是一个关键机会。SLAPA 是这种聚合器的一个很好的早期例子。在这个领域,胜出者将是那些能够提供定制化智能agents、具备类似"产品搜寻"功能、易于集成或善于构建强大社区护城河的企业。


4. 对平台无关的智能agents监控的需求
agent平台化和监控将出现新的空白领域。这一新兴领域的出现源于市场碎片化和对AI 监管的迫切需求。能够追踪数据来源和流向的初创公司将成为关键,尤其是在解决agents运行问题时。要在这个领域脱颖而出,企业需要具备多平台集成能力、独特的分销优势、强大的社区基础和卓越的用户体验。这可能成为发展"AI 免疫系统"的重要一步,催生一批全新类型的创新企业。


5. 区块链在 AI 基础设施中的应用扩散
区块链技术将在AI基础设施中发挥重要作用,特别是在推动上述三个因素的发展方面。为了降低"可扩展性"和伦理风险,类似于"DeFi"的"DeAgents"概念可能会出现。区块链可以为开发者提供一个去中心化、透明和安全的平台来共享数据、代码和资源。创建易于上手和集成的定制解决方案的参与者将有机会在这里取得成功。


06

信任、技术和政策的成熟度将决定采用速度

信任、技术和政策三个因素的成熟度将决定从增强决策的AI co-pilots,到执行任务的智能agents,再到更加完善的agent fleets的发展速度 — 并朝着"原始 AGI"迈进。

“预测AI Agents的进展需要评估其附加价值和容错度。附加价值越高,容错度越高,我们就可以预期AI Agents在某个行业或功能中越快成为主流。” ——Ayala 创始人 George


Adoption curve cycle for AI Agents



07

三大关键因素深度解析

信任:尽管人工智能技术日新月异,但在处理复杂任务时,人类的角色仍然不可或缺。关键在于如何在AI自主性和人类监督之间取得恰当的平衡。社会对AI的信任度虽然会逐步提升,但具体速度仍难以预测。特别是在从"只读"向"可写"功能转变时,将面临重大挑战。以医疗领域为例,目前形成了两大思想流派:一是"就业学派",主张AI应作为"思维的助力工具",增强人类的能力;二是"扎克伯格学派",认为AI算法可能取代人类的主导地位,甚至"劫持"人类思维。BabyAGI创始人Yohei的观点颇具前瞻性:"在自主AI Agent的未来,每个人都将成为管理者。"

技术发展:技术层面的制约主要体现在两个方面。首先,目前跨系统交互的AI Agents运营成本相对较高,尤其是在这些系统仍在不断完善的情况下。有观点预测,随着Reddit和Twitter等平台开始对API收费,可能会引发"AI寒冬"。这些成本很可能会转嫁到整个AI Agent生态系统中。Theeuf指出:"开源社区可能面临AI寒冬,这将对市场垄断行为产生深远影响。"其次,技术上还存在诸多挑战,如API调用的上下文长度限制、长期规划能力不足、任务分解错误,以及NLP接口的可靠性问题(如"幻觉"现象)。

政策、监管和法律进展:针对自主AI Agents和生成式AI的监管和法律政策将继续成为焦点。对初创公司而言,将负责任的AI理念融入设计过程至关重要。像ChaosGPT这样的事件正在引发业界的警觉和行动。最新的法律理论探讨了一些关键未解的问题,例如考虑到所有权和版权规则,自主AI Agents应该享有怎样的法律地位。这些问题若得不到及时解答,可能会阻碍AI Agents技术的推广应用。正如Bedigo教授所指出的,长远来看能够识别生态系统中"恶意行为者"的"AI免疫系统"概念可能会成为主流。



07

结论

我最喜欢的一位创始人兼朋友,来自生成式AI游戏初创公司Stori的Nilu,对当前形势做出了一针见血的总结:"目前,AI代理最大的'贡献'似乎是让你的OpenAI账单飙升...但这种状况很快就会改变。在不远的将来,AI代理在执行复杂的高级任务时,将展现出令人惊叹的能力,甚至可能超出我们的想象。"


那么,你对哪个机会感到兴奋,或者可能认为哪个机会无法实现?我很想在评论中听到你的想法。





小研聊AI
带你洞悉AI与大模型的前沿认知