Anthropic: Agents 没那么复杂!只需 8 个范式

文摘   2025-01-06 16:13   辽宁  

 

很多团队都在追求“代理 (Agents) 万能”——想要构建出一个像科幻小说主角那样高度自治、包打天下的超级 AI 系统。

伴随而来的,是市面上层出不穷的各种“框架”、“工具库”和“黑科技”。大家一边感慨“AI 又进化了”,一边又抱怨“东西太复杂,根本上手不了”。

然而,在过去一年,Anthropic 和数十个团队在各行各业合作构建大型语言模型(LLM)代理的经历证明:最成功的落地案例往往没有使用这些“花里胡哨”的复杂框架或库,而是基于简单、可组合的模式

因此,如果你已经被“智能代理”这个概念绕晕了,不妨先松口气:它没那么复杂,只需要理解 8 个核心范式,你就能在大多数场景里把 LLM 代理的威力榨得干干净净。

一、为何说“没那么复杂”?

“代理”这个词,很多人对它又爱又恨。有人把“代理”定义为无人看守、独立运行的纯自治系统,在后台翻云覆雨,完成繁复任务;也有人将其视为按预先写死的工作流程,去调用各类工具的比较“傻瓜式”自动化。

Anthropic的做法更包容一些:不管是“工作流程(workflow)”还是“代理(agent)”,只要 LLM 在不同程度上负责引导或控制流程,都可以把它归为“代理系统”

不过,在具体实现上,二者是有关键区别的:

  • • 工作流程(Workflow):程序化、预先定义好的代码路径,用来编排 LLM 和工具的交互,保证可预测性和一致性。
  • • 代理(Agent):让 LLM 更加灵活地“自己决定”要走哪一步,何时调用工具、如何调用工具,从而获得更大自主性。

两者各有利弊:简单的工作流程可以高效率、易调试;高度自治的代理则有更强的灵活性,但也意味着更高的成本和可能的失控风险。

许多团队踩过的坑都提醒我们:如果能用简单工作流程搞定,千万别盲目上多回合复杂代理。

二、LLM 应用的基础构建块:增强型 LLM

The augmented LLM 增强 LLM

增强型 LLM:所谓“增强”,就是在纯语言模型之上,增加检索、调用工具、记忆等能力。

有了这个“增强型 LLM”,你就可以围绕它,组合出各种不同的系统架构。从简单的一次调用,到复杂的多回合自主代理,皆可由此演化。


三、8 个核心范式:从简单到复杂,步步为营

1. Prompt Chaining(提示链)

把一个大任务拆成有序的子步骤,每个步骤都是一次新的 LLM 调用,上一步输出做下一步输入。

提示链工作流程
  • • 适用场景:可以被干净地分解成若干固定子任务,而且每个子任务都能借由“前一步的结果”得到提升时。
  • • 优点:分而治之,大大提升准确度;每一步都“聚焦”于更小、更明确的目标。
  • • 缺点:牺牲速度(多次调用),且需要写出较多中间逻辑。

想想写论文时,你先列提纲、再写大标题、然后扩充段落……这就是提示链思维。

“脑力分段”,保证每一次调用都清晰可控。

2. Routing(路由)

所谓路由,就是先把输入分分类,再把它交给合适的下游提示或工具。

The routing workflow 路由工作流程
  • • 适用场景:当输入数据可以被明确区分为不同类型,如“一般咨询”“退款请求”“技术支持”,可以送到对应的工作流程或提示中。
  • • 好处:让每种类型的输入都能得到专门优化。没有这种路由的话,通用提示可能要应对五花八门的输入,难免哪一头都顾不好。
  • • 典型例子:客服聊天机器人;先判断用户问题类型,再决定调用哪个模型(小模型够用就别用大模型浪费钱和算力)。

3. Parallelization(并行化)

有些任务可以拆分成若干平行的子任务,再把结果合并;或者同一任务让多个 LLM 同时“投票”。

并行化工作流程
  • • 适用场景:需要更快速度(各干各的,最后汇总)或需要多个角度审视(同一任务多次调用,取最优或融合结果)。
  • • 优点:节省时间,提高稳健性;有时还能让模型从多个“维度”出发,避免单一思路出错。
  • • 缺点:并行多路调用意味着更多成本,也需一套汇总机制。

4. Orchestrator-Workers(编排器-工作者)

中心“编排器” LLM 根据任务需要,动态地切分子任务、分配给不同“工作者” LLM,再汇总结果。
指挥员-工作人员工作流程
  • • 适用场景:无法预先写子任务流程的复杂需求,比如代码编辑,一开始并不知道要改多少文件、怎么改。
  • • 优势:灵活性极高,是真正“看菜下饭”的动态调度。
  • • 劣势:代码实现更复杂,也更耗时,需要好好设计中央编排器的提示逻辑。

5. Evaluator-Optimizer(评估者-优化者)

两个 LLM 协作:先有一个生成初步方案(优化者),另一个对结果进行评估并给出修改建议(评估者),再迭代循环。

评估-优化工作流程
  • • 适用场景:当能够清晰定义“好答案”的标准,并且“多轮迭代”可以显著优化结果时。
  • • 示例:文学翻译,第一版不一定准确,评估者给出批评意见,优化者持续改进;或复杂搜索场景,需要多轮分析和搜索,评估者决定什么时候再搜、什么时候收手。

6. Agent 在生产环境中的兴起

有了前面这些工作流程,大家自然会想:能不能让模型自己“看情况”去动态选择合适的步骤和工具,而不必人来规定固定顺序?这就是代理的雏形。如今的 LLM 已经能承担足够多的关键能力:理解复杂输入、推理与规划、可靠地使用工具,以及出现失误时的自我纠错。

Autonomous agent 自主代理
  • • 代理工作方式
  1. 1. 接受来自人类用户的命令或与用户交互讨论,明确目标;
  2. 2. 独立规划并执行步骤,必要时再次询问用户;
  3. 3. 在每一步调用工具并读取结果,不断修正自己的计划;
  4. 4. 直至完成或到达停止条件。

这套循环很朴素,核心就是“LLM + 工具 + 环境反馈”。但只要工具集设计合理,代理依然能完成复杂挑战。

7. 何时使用 Agent?

  • • 开放性问题:无法预测步骤,或者固定路径很难写死;
  • • 环境可控:代理的自主性会放大错误,一定要有沙盒保护机制;
  • • 成本权衡:代理会带来更多调用和运算开销,得确保这笔“灵活性”值得买单。

如果你能用简单的提示链或路由方案搞定,那就别整多回合“脑暴”。要是频繁出现动态分支、难以人工定义流程时,代理才真正大显身手。

8. 充分组合,避免过度复杂

前面提到的这些“增强型 LLM + 六大工作流程 + 代理能力”,构成了构建智能 Agents 的八大范式基础。它们可以自由拼装、拆解:

  • • 在一个路由工作流中,你也可以嵌入并行化;
  • • 在编排器-工作者架构中,你也可能用评估者-优化者方式反复打磨某个子任务;
  • • 在开发者调试代理时,也可先行用工作流程做小范围实验。

最重要的一点增加复杂性一定要换来成效,否则就是自寻烦恼

不少团队因为滥用复杂框架,把核心任务淹没在各种冗余调用中,调试困难、性能拖慢,还平白多花经费。

示例中代理有用的场景

以下示例来自我们的实现:

高级编码代理的流程
  • • 一个用于解决 SWE-bench 任务的编码代理,这些任务涉及根据任务描述对多个文件进行编辑;

四、从框架到“撸底层代码”:两种思路

市面上已有不少成熟框架,如

  • • LangChain 的 LangGraph
  • • Amazon Bedrock
  • • Rivet
  • • Vellum
    等都能帮你快速搭建工作流程或代理,它们把调用 LLM、定义解析工具、链式调用这些常规任务封装得很“顺滑”。
  • • 优点:入门快,减少初期开发成本。
  • • 缺点:增加额外抽象层,可能掩盖底层提示和响应,后期调试困难,并让人盲目堆砌功能。

Anthropic 建议:除非你对底层逻辑非常了解,否则别急着上一堆框架

有些简单的代理模式,就几行原生 API 调用就能实现。若真使用框架,一定要确保你能看懂“引擎盖下”在干啥,否则在生产环境可能踩大坑。

五、结语:从简单开始,循环迭代

LLM 时代的成功秘诀,不在于堆出最炫、最庞大、最花哨的自治代理——而在于是否真正解决问题先用最简单的单次提示做 MVP,评估性能,若有需要再逐步扩展到多步骤流程,最后才是全面放手给代理系统自主决策。

如果你打算上马代理项目,记住以下三条核心原则:

  1. 1. 保持设计简洁。最简单的往往最可靠,别把小问题引向大架构。
  2. 2. 透明展示规划步骤。代理的内部推理若能让人类可视可控,更易 Debug,也更易赢得信任。
  3. 3. 精心设计代理-计算机界面(ACI)。工具文档要清晰完备,测试要系统到位,以免让代理“用错工具”或“工具用歪”。

总之,所谓“没那么复杂”,不是说智能代理很随意,而是好的设计往往遵循“由繁入简”的思想。对任何花里胡哨的框架或架构,都要先问一句:我真的需要它吗? 当你以这份审慎与洞察来构建 LLM 应用,就能打造出既强大又易维护、既可靠又能让用户安心信任的智能代理系统。祝你在 AI 旅程中一路高歌!

参考资料:https://www.anthropic.com/research/building-effective-agents

宁犀牛2025年3月python一级等级考试报名

【腾讯文档】宁犀牛2025年3月python一级等级考试报名 https://docs.qq.com/form/page/DRFRPcmxYTXBJUWVn

宁犀牛每周会举行一场线上免费分享,分享编程、数学、人工智能方面的内容,帮助3-9年级的同学更好地理解学习,欢迎感兴趣的小伙伴及家长们参加。

添加下方微信,我拉您进分享群。

推荐阅读

 

性能顶尖?实测DeepSeek-V3模型,偶尔输出混乱、表现不稳定

AI也懂"分工协作"?一文读懂混合专家模型MOE

AI无所不能,还需不需要学习?

IBM专家马丁·基恩:7大AI趋势2025

罗素·艾可夫:数据、信息、知识、智慧

4款国产顶尖大模型横评:谁更强?宁犀牛python大模型个性化学习反馈系统v1.4

全球最著名的9位计算机与人工智能科学家

Python:2024年度语言,AI编程语言之王

学习就是增加对人生的掌控感

知识的诅咒(Curse of Knowledge):为什么辅导孩子作业总容易情绪失控

Ilya Sutskever:下一代人工智能将伴随自我意识

“当世最聪明的人”史蒂芬·沃尔弗拉姆:Mathematica、Wolfram Alpha与Wolfram语言

贝索斯:人生的意义在于你如何提升他人

AI时代下的教育焦虑及应对之道 ——北大×腾讯:AI+教育思想沙龙启示

调用 Qwen-Max 模型api生成个性化学习报告:解构教育不可能三角

教育部:加强中小学人工智能教育为未来铺路 宁犀牛详解:机遇与挑战

如何成为一个好老师?大卫·耶格尔:激励、挑战与反思

新晋诺奖得主辛顿教授Hinton的AI预言:未来十年,我们会见证什么奇迹?

谷歌前CEO施密特谈AI时代年轻人的生存指南:Python+分析与批判性思维

黄仁勋:我不断学习

AI不会取代老师!谷歌大脑之父Jeff Dean详解教育新范式

彭凯平:内耗时代如何培养拥有幸福感的孩子

陶哲轩:数学的新时代,AI解锁未知,数学家引领未来

数学家竟是人工智能时代下最好的职业?港大教授非常推荐

史上公认最具天赋的9位数学家

直觉修正:从杨振宁的“学习秘籍”到如何启发AI研究

“卡脖子”下的专业调整,高校专业大洗牌:工科“瘦身”新工科“扩容”

破解应试教育密码:6大科学方法助你成绩飙升

实测Meta最新开源模型——LLaMA 3.1,能力惊人!

2024高校预算经费TOP50出炉!解密高校财务:资金来源与预算分析

理解985高校强基破格录取政策:数学的重要性

一个表格看懂2024强基计划!37所高校核心摘要


人工智能+教育➡️宁犀牛

宁犀牛
人工智能|教育|数学|Python
 最新文章