你好啊,我是雨飞,见字如面。感谢阅读,期待我们下一次的相遇。
2024年,无疑是Agent发展的元年,不管是Coze、Dify、FastGPT这种智能体搭建的平台多了起来,还包括Langchain、llamaindex等开发框架也在飞速的更新。Anthropic公司在24年12月底曾经发布了一篇关于如何构建Agent的文章,借着这篇文章,我们来分享下关于Agent相关的内容。
1、什么是Agent
Agent这个术语一开始算是在强化学习领域出现的,它表示的是可以和外界环境交互的智能体,能够根据外界的反馈去改变自己的规划。
在大模型出现之后,Agent有了更多的定义,简单来说就是可以在长时间独立运行,使用各种工具完成复杂任务的系统都可以称为智能体。
在Anthropic的文章中,他们对Agent和Workflow做了更详细的区分。
简单来说,Workflow就是一个固定的执行路径,而Agent是由LLM动态的规划自己的执行流程和工具使用。
2、如何构建Workflow
不管是Agent还是Workflow,其基石都是LLM,我们可以通过微调的方式给LLM注入工具理解和使用的能力,从而让LLM可以主动的发起搜索查询,工具调用,以及保存历史的对话信息。
工作流,主要包括提示链(Prompt chaining)、路由(Routing)、并行化(Parallelization)、业务流程协调程序(Orchestrator-worker)、评估器(Evaluator-optimizer)
提示链是最基础的工作流,通过人工把任务分解成一系列的小任务,分别让每一个LLM去调用。
提示链的使用非常广泛,比如
1)生成文案并进行翻译
2)编写文档的大纲,检查大纲是否满足条件,然后根据大纲编写文档
路由功能,就是对输入的内容进行分类,有条件的也可以构建单独的意图识别模型。
相关示例:
1)将不同类型的客服服务查询引导到不同的下游工作流或者工具中。
2)将简单的问题路由给小模型,成本更低,响应更快。而将困难的问题路由给大模型。
LLM可以一次处理多个任务,因此能够实现并行化。
一般分为两个不同的变体:
1)分段,将一个大任务,分解为几个可以独立运行的子任务
2)投票,多次运行同一个任务,以便获得不同的输出
切片示例
1)自动化评估LLM性能,每一个LLM可以评估模型效果的某一个指标
2)请求拦截,一个模型处理用户的查询,另外一个模型筛选用户查询是否合理
投票示例
1)检查一段代码是否存在漏洞,如果多个LLM发现了相同问题,则出现该问题的几率就非常大
2)评估用户的内容是否合适,不同的LLM可以评估不同的方面,然后进行投票平衡误报和漏报
业务流程协调工作流,中央的LLM可以动态分解任务,并委派给worker的LLM,最后合成结果。
参考示例
1)对多个文件进行复杂更改的产品进行编码
2)涉及到从多个信息源收集和分析信息以查找可能相关信息的搜索任务。
评估器-优化器工作流,一个LLM调用生成响应,而另一个LLM调用提供评估和反馈。
参考示例
1)文学翻译,单一的LLM可能无法捕捉翻译语法的细节错误,而评估的LLM可以提供更有效的评估意见。
2)复杂的搜索任务,评估者用于决定是否要进行下一轮搜索
3、如何构建Agent
Agent可以理解复杂的输入,进行推理和规划,并且使用工具,并能从错误中恢复。一个完整的智能体,能够接受人类的命令并讨论交流相关任务,一旦任务明确,智能体就会选择使用相应的工具去获取结果,并根据结果进度反馈来确认任务是否终止,或者是到了最大循环次数就结束任务。
智能体的制作和使用意味着更高的成本,而且会使得错误复杂化,因此在使用一些危险操作,比如调用命令行,操作数据库这种,尽量在沙盒环境中执行和测试,并开启防护机制。
4、2024只有Workflow 没有Agent
从我们24年一年的经验来说,不管是Coze还是Dify这种主流的智能体搭建平台,本质上还是以工作流为主。以Coze为例,其核心的流程还是工作流和图像流,一个工作流对应的输入、输出都是稳定的。
之所以Agent还没有大幅度流行的原因主要有两个, 第一,24年的AI大模型性能远远不够强,真正能实现Agent功能的Claude 3.5 Sonnet是24年下半年才发布的模型,这就导致了虽然有很多现有的Agent能力不够,不好用。
第二,成本巨大,调用链长。Agent模式会频繁的和AI大模型进行交互,成本非常高,真正意义上把成本降下来的DeepSeek V3也是24年底的事情了。这也就导致了24年一年,Agent技术其实一直在探索中,并未大规模使用。
但随着AI大模型的发展,像Cursor、Windsurf这种AI编程工具都已经植入了Agent的功能,从目前表现来看效果有了明显的改善。另外,Cline、Roo Cline等插件也可以有效的集成AI大模型去完成更复杂的需求。因此,我们有理由相信25年,Agent技术会迎来更全面的爆发和应用。
如果你想进一步研究AI Agent,可以关注下我的专栏。
https://zhuanlan.zhihu.com/column/c_1836541070365839360
参考文献
https://www.anthropic.com/research/building-effective-agents
如果你觉得这篇文章对你有启发,欢迎点赞收藏转发下。目前运营了两个Cursor交流群,付费、免费的都有,有想一起交流学习的可以添加下方的微信,邀你一起学习。
❤️常驻小尾巴❤️
加微 1060687688,备注「公众号」,送你一份「AI工具与副业变现指南」