Anthropic： Agents 没那么复杂！只需 8 个范式

文摘 2025-01-06 16:13 辽宁

很多团队都在追求“代理 (Agents) 万能”——想要构建出一个像科幻小说主角那样高度自治、包打天下的超级 AI 系统。

伴随而来的，是市面上层出不穷的各种“框架”、“工具库”和“黑科技”。大家一边感慨“AI 又进化了”，一边又抱怨“东西太复杂，根本上手不了”。

然而，在过去一年，Anthropic 和数十个团队在各行各业合作构建大型语言模型（LLM）代理的经历证明：最成功的落地案例往往没有使用这些“花里胡哨”的复杂框架或库，而是基于简单、可组合的模式。

因此，如果你已经被“智能代理”这个概念绕晕了，不妨先松口气：它没那么复杂，只需要理解 8 个核心范式，你就能在大多数场景里把 LLM 代理的威力榨得干干净净。

一、为何说“没那么复杂”？

“代理”这个词，很多人对它又爱又恨。有人把“代理”定义为无人看守、独立运行的纯自治系统，在后台翻云覆雨，完成繁复任务；也有人将其视为按预先写死的工作流程，去调用各类工具的比较“傻瓜式”自动化。

Anthropic的做法更包容一些：不管是“工作流程（workflow）”还是“代理（agent）”，只要 LLM 在不同程度上负责引导或控制流程，都可以把它归为“代理系统”。

不过，在具体实现上，二者是有关键区别的：

• 工作流程（Workflow）：程序化、预先定义好的代码路径，用来编排 LLM 和工具的交互，保证可预测性和一致性。
• 代理（Agent）：让 LLM 更加灵活地“自己决定”要走哪一步，何时调用工具、如何调用工具，从而获得更大自主性。

两者各有利弊：简单的工作流程可以高效率、易调试；高度自治的代理则有更强的灵活性，但也意味着更高的成本和可能的失控风险。

许多团队踩过的坑都提醒我们：如果能用简单工作流程搞定，千万别盲目上多回合复杂代理。

二、LLM 应用的基础构建块：增强型 LLM

增强型 LLM：所谓“增强”，就是在纯语言模型之上，增加检索、调用工具、记忆等能力。

有了这个“增强型 LLM”，你就可以围绕它，组合出各种不同的系统架构。从简单的一次调用，到复杂的多回合自主代理，皆可由此演化。

三、8 个核心范式：从简单到复杂，步步为营

1. Prompt Chaining（提示链）

把一个大任务拆成有序的子步骤，每个步骤都是一次新的 LLM 调用，上一步输出做下一步输入。

• 适用场景：可以被干净地分解成若干固定子任务，而且每个子任务都能借由“前一步的结果”得到提升时。
• 优点：分而治之，大大提升准确度；每一步都“聚焦”于更小、更明确的目标。
• 缺点：牺牲速度（多次调用），且需要写出较多中间逻辑。

想想写论文时，你先列提纲、再写大标题、然后扩充段落……这就是提示链思维。

“脑力分段”，保证每一次调用都清晰可控。

2. Routing（路由）

所谓路由，就是先把输入分分类，再把它交给合适的下游提示或工具。

• 适用场景：当输入数据可以被明确区分为不同类型，如“一般咨询”“退款请求”“技术支持”，可以送到对应的工作流程或提示中。
• 好处：让每种类型的输入都能得到专门优化。没有这种路由的话，通用提示可能要应对五花八门的输入，难免哪一头都顾不好。
• 典型例子：客服聊天机器人；先判断用户问题类型，再决定调用哪个模型（小模型够用就别用大模型浪费钱和算力）。

3. Parallelization（并行化）

有些任务可以拆分成若干平行的子任务，再把结果合并；或者同一任务让多个 LLM 同时“投票”。

• 适用场景：需要更快速度（各干各的，最后汇总）或需要多个角度审视（同一任务多次调用，取最优或融合结果）。
• 优点：节省时间，提高稳健性；有时还能让模型从多个“维度”出发，避免单一思路出错。
• 缺点：并行多路调用意味着更多成本，也需一套汇总机制。

4. Orchestrator-Workers（编排器-工作者）

中心“编排器” LLM 根据任务需要，动态地切分子任务、分配给不同“工作者” LLM，再汇总结果。

• 适用场景：无法预先写子任务流程的复杂需求，比如代码编辑，一开始并不知道要改多少文件、怎么改。
• 优势：灵活性极高，是真正“看菜下饭”的动态调度。
• 劣势：代码实现更复杂，也更耗时，需要好好设计中央编排器的提示逻辑。

5. Evaluator-Optimizer（评估者-优化者）

两个 LLM 协作：先有一个生成初步方案（优化者），另一个对结果进行评估并给出修改建议（评估者），再迭代循环。

• 适用场景：当能够清晰定义“好答案”的标准，并且“多轮迭代”可以显著优化结果时。
• 示例：文学翻译，第一版不一定准确，评估者给出批评意见，优化者持续改进；或复杂搜索场景，需要多轮分析和搜索，评估者决定什么时候再搜、什么时候收手。

6. Agent 在生产环境中的兴起

有了前面这些工作流程，大家自然会想：能不能让模型自己“看情况”去动态选择合适的步骤和工具，而不必人来规定固定顺序？这就是代理的雏形。如今的 LLM 已经能承担足够多的关键能力：理解复杂输入、推理与规划、可靠地使用工具，以及出现失误时的自我纠错。

• 代理工作方式：

1. 接受来自人类用户的命令或与用户交互讨论，明确目标；
2. 独立规划并执行步骤，必要时再次询问用户；
3. 在每一步调用工具并读取结果，不断修正自己的计划；
4. 直至完成或到达停止条件。

这套循环很朴素，核心就是“LLM + 工具 + 环境反馈”。但只要工具集设计合理，代理依然能完成复杂挑战。

7. 何时使用 Agent？

• 开放性问题：无法预测步骤，或者固定路径很难写死；
• 环境可控：代理的自主性会放大错误，一定要有沙盒保护机制；
• 成本权衡：代理会带来更多调用和运算开销，得确保这笔“灵活性”值得买单。

如果你能用简单的提示链或路由方案搞定，那就别整多回合“脑暴”。要是频繁出现动态分支、难以人工定义流程时，代理才真正大显身手。

8. 充分组合，避免过度复杂

前面提到的这些“增强型 LLM + 六大工作流程 + 代理能力”，构成了构建智能 Agents 的八大范式基础。它们可以自由拼装、拆解：

• 在一个路由工作流中，你也可以嵌入并行化；
• 在编排器-工作者架构中，你也可能用评估者-优化者方式反复打磨某个子任务；
• 在开发者调试代理时，也可先行用工作流程做小范围实验。

最重要的一点：增加复杂性一定要换来成效，否则就是自寻烦恼。

不少团队因为滥用复杂框架，把核心任务淹没在各种冗余调用中，调试困难、性能拖慢，还平白多花经费。

示例中代理有用的场景

以下示例来自我们的实现：

• 一个用于解决 SWE-bench 任务的编码代理，这些任务涉及根据任务描述对多个文件进行编辑；

四、从框架到“撸底层代码”：两种思路

市面上已有不少成熟框架，如

• LangChain 的 LangGraph
• Amazon Bedrock
• Rivet
• Vellum
等都能帮你快速搭建工作流程或代理，它们把调用 LLM、定义解析工具、链式调用这些常规任务封装得很“顺滑”。
• 优点：入门快，减少初期开发成本。
• 缺点：增加额外抽象层，可能掩盖底层提示和响应，后期调试困难，并让人盲目堆砌功能。

Anthropic 建议：除非你对底层逻辑非常了解，否则别急着上一堆框架。

有些简单的代理模式，就几行原生 API 调用就能实现。若真使用框架，一定要确保你能看懂“引擎盖下”在干啥，否则在生产环境可能踩大坑。

五、结语：从简单开始，循环迭代

LLM 时代的成功秘诀，不在于堆出最炫、最庞大、最花哨的自治代理——而在于是否真正解决问题。先用最简单的单次提示做 MVP，评估性能，若有需要再逐步扩展到多步骤流程，最后才是全面放手给代理系统自主决策。

如果你打算上马代理项目，记住以下三条核心原则：

1. 保持设计简洁。最简单的往往最可靠，别把小问题引向大架构。
2. 透明展示规划步骤。代理的内部推理若能让人类可视可控，更易 Debug，也更易赢得信任。
3. 精心设计代理-计算机界面（ACI）。工具文档要清晰完备，测试要系统到位，以免让代理“用错工具”或“工具用歪”。

总之，所谓“没那么复杂”，不是说智能代理很随意，而是好的设计往往遵循“由繁入简”的思想。对任何花里胡哨的框架或架构，都要先问一句：我真的需要它吗？ 当你以这份审慎与洞察来构建 LLM 应用，就能打造出既强大又易维护、既可靠又能让用户安心信任的智能代理系统。祝你在 AI 旅程中一路高歌！

参考资料：https://www.anthropic.com/research/building-effective-agents

宁犀牛2025年3月python一级等级考试报名

【腾讯文档】宁犀牛2025年3月python一级等级考试报名 https://docs.qq.com/form/page/DRFRPcmxYTXBJUWVn

宁犀牛每周会举行一场线上免费分享，分享编程、数学、人工智能方面的内容，帮助3-9年级的同学更好地理解学习，欢迎感兴趣的小伙伴及家长们参加。

添加下方微信，我拉您进分享群。