2024 AI Agent 最新发展报告

文摘   2024-12-03 23:52   新加坡  

近日,LangChain 发布了《2024 AI Agent 状态调查报告》,我对全文进行了翻译和润色。让我们一起来看看,AI Agent 目前究竟发展到了哪一步?https://www.langchain.com/stateofaiagents


引言

我们对 1300 多名专业人士进行了调查,受访者包括工程师、产品经理、业务领导和高管,旨在深入了解 AI Agent 的最新发展现状。通过分析调查数据,我们来看看 AI Agent 在实际应用中走到了哪一步。

2024 年,AI Agent 已经从小众概念变为主流趋势。各行各业的公司正积极将 AI Agent 融入工作流程,用于自动化日常任务、辅助数据分析,甚至编写代码。

但背后究竟发生了什么?AI Agent 是否达到了预期的潜力,还是只是又一个流行词?哪些公司在部署它们,又是什么阻碍了其他企业的全面采用?

为了解答这些问题,我们进行了这次调查。以下是我们的分析和解读。

主要发现

什么是 AI Agent?

LangChain,我们将 AI Agent 定义为利用大型语言模型(LLM)来决定应用程序控制流程的系统。就像自动驾驶汽车有不同的自动化等级,AI Agent 的功能也存在多个层次。

AI Agent 的采用情况:一半已用,而且几乎所有人都有计划

AI Agent 的竞争日益激烈。过去一年,各种 Agent 框架备受关注——从将 LLM 推理与行动结合的 ReAct、多 Agent 协调器,到强调控制性的 LangGraph

这些讨论并非空穴来风。调查显示,约有 51% 的受访者已经在生产环境中采用了 AI Agent。按公司规模看,员工人数在 1002000 人的中型企业最为积极,采用率达到了 63%

更令人鼓舞的是,78% 的受访者计划在近期将 AI Agent 引入生产应用。尽管热情高涨,但实际部署仍是许多企业需要克服的挑战。

我们还发现,企业正逐步超越单一的聊天式应用,探索更复杂的框架,强调多 Agent 的协作和更高的自主性。(详见下文“新兴趋势”部分。)

值得注意的是,对 AI Agent 的兴趣已超越科技行业。非科技公司的受访者中,90% 已经部署或计划部署 AI Agent,这与科技公司的比例(89%)几乎相当。

AI Agent 的核心应用场景

AI Agent 被用于哪些领域?它们不仅处理常规任务,还为知识工作的新可能性打开了大门。

调查显示,最常见的应用是 研究与总结58%),其次是 提升个人生产力或助理任务(53.5%)。

这些结果反映出人们希望将耗时的任务交给 AI Agent。例如,在文献综述或研究分析中,无需手动筛选大量数据,AI Agent 可以快速提炼关键信息。同时,它还能协助安排日程、管理任务,提升个人效率,使人们专注于更重要的工作。

不仅如此,客户服务45.8%也是一个重要应用场景AI Agent 帮助企业更快地处理客户咨询、解决问题,大幅提升团队的响应速度。

在您看来,现阶段AI Agent最适合哪些任务?

安全为重:需要监控和人工监督

强大的功能需要谨慎的控制。多数企业为 AI Agent 配备了监控和可观测性工具,以了解其行为和性能。此外,设置保护机制(如“护栏”)也很常见,以防止 Agent 偏离预期。

您为 AI Agent 设置了哪些控制措施?

在测试 LLM 应用时,离线评估(39.8%被采用的频率高于 在线评估32.5%)。这可能是因为实时监控 Agent 性能存在一定难度。许多公司还通过人工专家审核 Agent 的输出,为其行为增加一层保障。

尽管对 AI Agent 寄予厚望,大多数企业在权限设置上仍然谨慎。很少有受访者允许Agent自由读取、写入或删除数据。大多数团队仅赋予只读权限,或对重要操作(如写入或删除)设置人工审批。

您的 AI Agent 拥有哪些权限?

不同规模的公司在控制策略上有所不同。大型企业(2000 名以上员工)更为谨慎,偏好只读权限,降低风险。他们还倾向于结合护栏和离线评估,确保在正式上线前解决潜在问题。

按公司规模划分的权限设置

小型企业和初创公司(少于 100 人)则更关注追踪功能,以实时了解 Agent 的运行情况。他们更倾向于快速上线,通过数据分析评估效果,而大型企业则采取更全面的控制策略。

按公司规模划分的控制措施

虽然科技公司和非科技公司的 AI Agent 采用率相似,但科技公司更倾向于使用多种控制方法。51% 的科技行业受访者使用了两种或以上的控制措施,而非科技行业这一比例为 39%。这表明科技公司在构建可靠的 AI Agent 方面可能更具经验,以确保高质量的用户体验。

使用的控制措施数量

推动 AI Agent 部署的挑战

保持 LLM 应用的高性能并非易事,无论是确保响应的准确性,还是风格的一致性,都需要克服技术难题。

受访者普遍认为,性能质量 是首要关注点,其重要性远超成本和安全等因素。

AI Agent 依赖 LLM 控制工作流程,这带来了不可预测性,增加了出错的风险,使团队难以确保 Agent 始终提供准确、相关的响应。

您认为将更多 AI Agent 投入生产的最大挑战是什么?

对于小型企业,性能质量尤为关键。数据显示,45.8% 的受访者将其视为主要关注点,而成本因素仅占 22.4%。这强调了高质量性能对企业部署 AI Agent 的重要性。

大型企业则在关注性能的同时,更加重视安全性,这与他们需要遵守法规和保护客户数据密切相关。

按公司规模划分的挑战

除了质量,团队还面临其他障碍:

  • 知识不足:许多团队缺乏构建和部署 AI Agent 的专业技能,特别是在特定应用场景下的实现。员工需要提升技能,以充分利用 AI Agent
  • 时间有限:构建可靠的 AI Agent 需要投入大量时间,包括调试、评估和模型微调等环节。

Agent 的成功案例:Cursor 引领潮流

最受关注的 AI Agent 应用

在我们的调查中,Cursor 脱颖而出,成为最受关注的 AI Agent 应用,其次是 PerplexityReplit

  • Cursor 是一款由 AI 驱动的代码编辑器,帮助开发者编写、调试和解析代码,提供智能自动完成和上下文辅助。
  • Replit 通过预设环境和配置,使开发者能在几分钟内构建并部署完整的应用程序,加速软件开发流程。
  • Perplexity 是一款 AI 驱动的问答引擎,能够通过网络搜索回答复杂问题,并在响应中提供参考来源。

这些应用正在重新定义 AI Agent 的能力,展示了其在生产环境中解决实际问题的潜力。

AI Agent 的新兴趋势与挑战

通过对自由回答的分析,我们发现企业在采用 AI Agent 时,既有新的期待,也面临持续的挑战。

人们对 AI Agent 的期待:

  • 处理多步骤任务AI Agent 具备更深入的推理和上下文理解能力,能够应对复杂任务。
  • 自动化重复性工作AI Agent 被视为自动化日常任务的关键工具,释放人力投入更具创造性的工作。
  • 任务分配与协作:优化任务分配,确保合适的 Agent 在正确的时间处理特定问题,尤其在多 Agent 系统中。
  • 类人推理能力AI Agent 能追溯并优化自己的决策,根据新信息调整策略,类似人类的思考过程。

面临的主要挑战:

  • 理解 Agent 行为的困难:一些工程师发现,向团队和利益相关者解释 AI Agent 的行为并不容易。尽管可视化步骤有助于理解,但 LLM 的内部机制仍然是个黑盒,增加了解释的难度。热点与未来展望:
  • 对开源 AI Agent 的热情:许多人对开源的 AI Agent 表现出浓厚兴趣,认为集体智慧能加速创新。
  • 期待更强大的模型:大家期待更高级的 AI Agent,由更强大的模型驱动,以更高的效率和自主性处理复杂任务。

结论

AI Agent 正在改变企业的工作方式,各行各业都在利用 LLM 重塑工作流程,提升决策质量和生产力。

然而,企业也意识到需要谨慎行事,通过适当的控制措施探索新应用。团队在积极尝试的同时,也注重保证 Agent 的高质量和可靠性。

展望未来,能够构建可靠、可控 AI Agent 的企业将在下一波 AI 创新中占得先机,引领智能自动化的未来。

附:采访企业相关信息

前五大行业

  • 科技(占受访者的60%)
  • 金融服务(占受访者的11%)
  • 医疗保健(占受访者的6%)
  • 教育(占受访者的5%)
  • 消费品(4%)

公司规模

  • 少于100人(占受访者的51%)
  • 100-2000人(占受访者的22%)
  • 2000-10,000人(占受访者的11%)
  • 超过10,000人(占受访者的16%)

如果你觉得今天的分享有帮助,记得点赞收藏转发,下次找起来更方便哦!


蔡荔谈AI
AI科普 AI培训 超级个体 创业
 最新文章