简单才是王道,这是Anthropic和数十家团队建构AI Agent的终极心得!
Anthropic刚刚发布了一篇博客,揭示了他们与众多团队合作开发AI Agent的经验。
有趣的是,最成功的实现并不依赖复杂的框架或特殊的库,而是使用简单、可组合的模式。
而且,他们还计划在2025年推出更大的动作:一个能自主操作电脑、编写代码、和同事交流的「虚拟协作者」!
工作流还是Agent?
Anthropic对「Agent」下了个有趣的定义。
在他们看来,Agent系统分两种:
工作流(Workflows):通过预定义的代码路径来编排LLM和工具
Agent:由LLM自主决定如何完成任务,动态使用工具
选哪个?这是道送命题。
Anthropic建议:先用最简单的方案。
很多时候,一个优化过的单次LLM调用就够用了。
只有在真正需要的时候才考虑Agent系统。毕竟这会增加延迟和成本,需要权衡值不值得。
常见模式大揭秘
Anthropic总结了几种经典模式:
1. 提示链(Prompt Chaining) 当任务能清晰地分解为固定子任务时,这种模式最合适。比如:先生成营销文案,再翻译成其他语言。
2. 路由(Routing) 适合处理不同类型的输入。例如:将不同类型的客服查询分流到不同的处理流程。
3. 并行化(Parallelization) 两种玩法:
任务分段:将大任务分解为可并行的子任务
投票:同一个任务运行多次,获取多样的输出
4. 调度者-工作者(Orchestrator-Workers) 中央LLM负责任务分解和结果整合,很适合复杂的编码任务。
5. 评估者-优化者(Evaluator-Optimizer) 一个LLM生成响应,另一个提供反馈,形成优化循环。
客服和编码:两大杀手级应用
Anthropic特别提到了两个实战案例:
客服领域:结合了传统聊天机器人界面和增强功能:
自然的对话流程
集成客户数据和工具
可编程的退款和工单更新
清晰的成功衡量标准
编码领域:
代码可通过自动化测试验证
Agent可以根据测试结果迭代方案
问题空间结构清晰
输出质量可客观衡量
工具设计的艺术
Anthropic强调,工具设计至关重要。他们建议:
为LLM提供足够的思考空间
保持格式接近互联网上的自然文本
避免复杂的格式要求
最后,Anthropic 总结到:
投入在人机界面(HCI)上的努力有多少,在代理-计算机界面(ACI)上就该投入多少。
👇
👇
👇
👇
本文同步自知识星球《AGI Hunt》
星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。
每天约监控6000 条消息,可节省约800+ 小时的阅读成本;
每天挖掘出10+ 热门的/新的 github 开源 AI 项目;
每天转译、点评 10+ 热门 arxiv AI 前沿论文。
星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)
一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;
二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。
欢迎你的加入!