很多团队都在追求“代理 (Agents) 万能”——想要构建出一个像科幻小说主角那样高度自治、包打天下的超级 AI 系统。
伴随而来的,是市面上层出不穷的各种“框架”、“工具库”和“黑科技”。大家一边感慨“AI 又进化了”,一边又抱怨“东西太复杂,根本上手不了”。
然而,在过去一年,Anthropic 和数十个团队在各行各业合作构建大型语言模型(LLM)代理的经历证明:最成功的落地案例往往没有使用这些“花里胡哨”的复杂框架或库,而是基于简单、可组合的模式。
因此,如果你已经被“智能代理”这个概念绕晕了,不妨先松口气:它没那么复杂,只需要理解 8 个核心范式,你就能在大多数场景里把 LLM 代理的威力榨得干干净净。
一、为何说“没那么复杂”?
“代理”这个词,很多人对它又爱又恨。有人把“代理”定义为无人看守、独立运行的纯自治系统,在后台翻云覆雨,完成繁复任务;也有人将其视为按预先写死的工作流程,去调用各类工具的比较“傻瓜式”自动化。
Anthropic的做法更包容一些:不管是“工作流程(workflow)”还是“代理(agent)”,只要 LLM 在不同程度上负责引导或控制流程,都可以把它归为“代理系统”。
不过,在具体实现上,二者是有关键区别的:
• 工作流程(Workflow):程序化、预先定义好的代码路径,用来编排 LLM 和工具的交互,保证可预测性和一致性。 • 代理(Agent):让 LLM 更加灵活地“自己决定”要走哪一步,何时调用工具、如何调用工具,从而获得更大自主性。
两者各有利弊:简单的工作流程可以高效率、易调试;高度自治的代理则有更强的灵活性,但也意味着更高的成本和可能的失控风险。
许多团队踩过的坑都提醒我们:如果能用简单工作流程搞定,千万别盲目上多回合复杂代理。
二、LLM 应用的基础构建块:增强型 LLM
增强型 LLM:所谓“增强”,就是在纯语言模型之上,增加检索、调用工具、记忆等能力。
有了这个“增强型 LLM”,你就可以围绕它,组合出各种不同的系统架构。从简单的一次调用,到复杂的多回合自主代理,皆可由此演化。
三、8 个核心范式:从简单到复杂,步步为营
1. Prompt Chaining(提示链)
把一个大任务拆成有序的子步骤,每个步骤都是一次新的 LLM 调用,上一步输出做下一步输入。
• 适用场景:可以被干净地分解成若干固定子任务,而且每个子任务都能借由“前一步的结果”得到提升时。 • 优点:分而治之,大大提升准确度;每一步都“聚焦”于更小、更明确的目标。 • 缺点:牺牲速度(多次调用),且需要写出较多中间逻辑。
想想写论文时,你先列提纲、再写大标题、然后扩充段落……这就是提示链思维。
“脑力分段”,保证每一次调用都清晰可控。
2. Routing(路由)
所谓路由,就是先把输入分分类,再把它交给合适的下游提示或工具。
• 适用场景:当输入数据可以被明确区分为不同类型,如“一般咨询”“退款请求”“技术支持”,可以送到对应的工作流程或提示中。 • 好处:让每种类型的输入都能得到专门优化。没有这种路由的话,通用提示可能要应对五花八门的输入,难免哪一头都顾不好。 • 典型例子:客服聊天机器人;先判断用户问题类型,再决定调用哪个模型(小模型够用就别用大模型浪费钱和算力)。
3. Parallelization(并行化)
有些任务可以拆分成若干平行的子任务,再把结果合并;或者同一任务让多个 LLM 同时“投票”。
• 适用场景:需要更快速度(各干各的,最后汇总)或需要多个角度审视(同一任务多次调用,取最优或融合结果)。 • 优点:节省时间,提高稳健性;有时还能让模型从多个“维度”出发,避免单一思路出错。 • 缺点:并行多路调用意味着更多成本,也需一套汇总机制。
4. Orchestrator-Workers(编排器-工作者)
• 适用场景:无法预先写子任务流程的复杂需求,比如代码编辑,一开始并不知道要改多少文件、怎么改。 • 优势:灵活性极高,是真正“看菜下饭”的动态调度。 • 劣势:代码实现更复杂,也更耗时,需要好好设计中央编排器的提示逻辑。
5. Evaluator-Optimizer(评估者-优化者)
两个 LLM 协作:先有一个生成初步方案(优化者),另一个对结果进行评估并给出修改建议(评估者),再迭代循环。
• 适用场景:当能够清晰定义“好答案”的标准,并且“多轮迭代”可以显著优化结果时。 • 示例:文学翻译,第一版不一定准确,评估者给出批评意见,优化者持续改进;或复杂搜索场景,需要多轮分析和搜索,评估者决定什么时候再搜、什么时候收手。
6. Agent 在生产环境中的兴起
有了前面这些工作流程,大家自然会想:能不能让模型自己“看情况”去动态选择合适的步骤和工具,而不必人来规定固定顺序?这就是代理的雏形。如今的 LLM 已经能承担足够多的关键能力:理解复杂输入、推理与规划、可靠地使用工具,以及出现失误时的自我纠错。
• 代理工作方式:
1. 接受来自人类用户的命令或与用户交互讨论,明确目标; 2. 独立规划并执行步骤,必要时再次询问用户; 3. 在每一步调用工具并读取结果,不断修正自己的计划; 4. 直至完成或到达停止条件。
这套循环很朴素,核心就是“LLM + 工具 + 环境反馈”。但只要工具集设计合理,代理依然能完成复杂挑战。
7. 何时使用 Agent?
• 开放性问题:无法预测步骤,或者固定路径很难写死; • 环境可控:代理的自主性会放大错误,一定要有沙盒保护机制; • 成本权衡:代理会带来更多调用和运算开销,得确保这笔“灵活性”值得买单。
如果你能用简单的提示链或路由方案搞定,那就别整多回合“脑暴”。要是频繁出现动态分支、难以人工定义流程时,代理才真正大显身手。
8. 充分组合,避免过度复杂
前面提到的这些“增强型 LLM + 六大工作流程 + 代理能力”,构成了构建智能 Agents 的八大范式基础。它们可以自由拼装、拆解:
• 在一个路由工作流中,你也可以嵌入并行化; • 在编排器-工作者架构中,你也可能用评估者-优化者方式反复打磨某个子任务; • 在开发者调试代理时,也可先行用工作流程做小范围实验。
最重要的一点:增加复杂性一定要换来成效,否则就是自寻烦恼。
不少团队因为滥用复杂框架,把核心任务淹没在各种冗余调用中,调试困难、性能拖慢,还平白多花经费。
示例中代理有用的场景
以下示例来自我们的实现:
• 一个用于解决 SWE-bench 任务的编码代理,这些任务涉及根据任务描述对多个文件进行编辑;
四、从框架到“撸底层代码”:两种思路
市面上已有不少成熟框架,如
• LangChain 的 LangGraph • Amazon Bedrock • Rivet • Vellum
等都能帮你快速搭建工作流程或代理,它们把调用 LLM、定义解析工具、链式调用这些常规任务封装得很“顺滑”。• 优点:入门快,减少初期开发成本。 • 缺点:增加额外抽象层,可能掩盖底层提示和响应,后期调试困难,并让人盲目堆砌功能。
Anthropic 建议:除非你对底层逻辑非常了解,否则别急着上一堆框架。
有些简单的代理模式,就几行原生 API 调用就能实现。若真使用框架,一定要确保你能看懂“引擎盖下”在干啥,否则在生产环境可能踩大坑。
五、结语:从简单开始,循环迭代
LLM 时代的成功秘诀,不在于堆出最炫、最庞大、最花哨的自治代理——而在于是否真正解决问题。先用最简单的单次提示做 MVP,评估性能,若有需要再逐步扩展到多步骤流程,最后才是全面放手给代理系统自主决策。
如果你打算上马代理项目,记住以下三条核心原则:
1. 保持设计简洁。最简单的往往最可靠,别把小问题引向大架构。 2. 透明展示规划步骤。代理的内部推理若能让人类可视可控,更易 Debug,也更易赢得信任。 3. 精心设计代理-计算机界面(ACI)。工具文档要清晰完备,测试要系统到位,以免让代理“用错工具”或“工具用歪”。
总之,所谓“没那么复杂”,不是说智能代理很随意,而是好的设计往往遵循“由繁入简”的思想。对任何花里胡哨的框架或架构,都要先问一句:我真的需要它吗? 当你以这份审慎与洞察来构建 LLM 应用,就能打造出既强大又易维护、既可靠又能让用户安心信任的智能代理系统。祝你在 AI 旅程中一路高歌!
参考资料:https://www.anthropic.com/research/building-effective-agents
宁犀牛2025年3月python一级等级考试报名
【腾讯文档】宁犀牛2025年3月python一级等级考试报名 https://docs.qq.com/form/page/DRFRPcmxYTXBJUWVn
宁犀牛每周会举行一场线上免费分享,分享编程、数学、人工智能方面的内容,帮助3-9年级的同学更好地理解学习,欢迎感兴趣的小伙伴及家长们参加。
添加下方微信,我拉您进分享群。
推荐阅读
性能顶尖?实测DeepSeek-V3模型,偶尔输出混乱、表现不稳定
4款国产顶尖大模型横评:谁更强?宁犀牛python大模型个性化学习反馈系统v1.4
知识的诅咒(Curse of Knowledge):为什么辅导孩子作业总容易情绪失控
“当世最聪明的人”史蒂芬·沃尔弗拉姆:Mathematica、Wolfram Alpha与Wolfram语言
AI时代下的教育焦虑及应对之道 ——北大×腾讯:AI+教育思想沙龙启示
调用 Qwen-Max 模型api生成个性化学习报告:解构教育不可能三角
教育部:加强中小学人工智能教育为未来铺路 宁犀牛详解:机遇与挑战
新晋诺奖得主辛顿教授Hinton的AI预言:未来十年,我们会见证什么奇迹?
谷歌前CEO施密特谈AI时代年轻人的生存指南:Python+分析与批判性思维
AI不会取代老师!谷歌大脑之父Jeff Dean详解教育新范式
“卡脖子”下的专业调整,高校专业大洗牌:工科“瘦身”新工科“扩容”
2024高校预算经费TOP50出炉!解密高校财务:资金来源与预算分析
人工智能+教育➡️宁犀牛