首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

Anthropic发布 Agent 最佳实践指南！

旅行 2025-01-22 01:30 北京

简单才是王道，这是Anthropic和数十家团队建构AI Agent的终极心得！

Anthropic刚刚发布了一篇博客，揭示了他们与众多团队合作开发AI Agent的经验。

有趣的是，最成功的实现并不依赖复杂的框架或特殊的库，而是使用简单、可组合的模式。

而且，他们还计划在2025年推出更大的动作：一个能自主操作电脑、编写代码、和同事交流的「虚拟协作者」！

工作流还是Agent？

Anthropic对「Agent」下了个有趣的定义。

在他们看来，Agent系统分两种：

工作流（Workflows）：通过预定义的代码路径来编排LLM和工具
Agent：由LLM自主决定如何完成任务，动态使用工具

选哪个？这是道送命题。

Anthropic建议：先用最简单的方案。

很多时候，一个优化过的单次LLM调用就够用了。

只有在真正需要的时候才考虑Agent系统。毕竟这会增加延迟和成本，需要权衡值不值得。

常见模式大揭秘

Anthropic总结了几种经典模式：

1. 提示链（Prompt Chaining） 当任务能清晰地分解为固定子任务时，这种模式最合适。比如：先生成营销文案，再翻译成其他语言。

2. 路由（Routing） 适合处理不同类型的输入。例如：将不同类型的客服查询分流到不同的处理流程。

3. 并行化（Parallelization） 两种玩法：

任务分段：将大任务分解为可并行的子任务
投票：同一个任务运行多次，获取多样的输出

4. 调度者-工作者（Orchestrator-Workers） 中央LLM负责任务分解和结果整合，很适合复杂的编码任务。

5. 评估者-优化者（Evaluator-Optimizer） 一个LLM生成响应，另一个提供反馈，形成优化循环。

客服和编码：两大杀手级应用

Anthropic特别提到了两个实战案例：

客服领域：结合了传统聊天机器人界面和增强功能：

自然的对话流程
集成客户数据和工具
可编程的退款和工单更新
清晰的成功衡量标准

编码领域：

代码可通过自动化测试验证
Agent可以根据测试结果迭代方案
问题空间结构清晰
输出质量可客观衡量

工具设计的艺术

Anthropic强调，工具设计至关重要。他们建议：

为LLM提供足够的思考空间
保持格式接近互联网上的自然文本
避免复杂的格式要求

最后，Anthropic 总结到：

投入在人机界面（HCI）上的努力有多少，在代理-计算机界面（ACI）上就该投入多少。

👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本；
每天挖掘出10+ 热门的/新的 github 开源 AI 项目；
每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

关注AGI 的沿途风景！

最新文章

从DeepSeek R1看推理模型的四种进化路线

对DeepSeek的五大误解！

重磅！Gemini 2.0全家桶发布：Flash免费用，Pro会写代码，还有一个便宜货

传言称Grok-3延迟！但马斯克仍手握最强算力

Deep Research 开源版来了！立省200美元

魔幻现实之：美国人下载DeepSeek 将坐牢20年？！

爆料：Anthropic 有比o3 更强的模型，但不敢放出来

Lex Fridman 最新播客：Deepseek与o3-mini，芯片管制与中美竞争、AI Agent与AGI……

华为突围：910C芯片性能达H100的60%！DeepSeek 已验证

OpenAI Deep Research上线：人类研究员失业倒计时？

基于o3-mini 的浏览器agent，打造属于自己的Operator

伯克利教授：AI思考的越多，越容易出错

o3-mini 的10 大疯狂应用案例！

指责DeepSeek 的OpenAI 们才是真正的賊！

特斯拉：This robot sucks!

Yann LeCun 痛批硅谷精英的优越感！

o3-mini 发布，但仍未走出DeepSeek 阴影

美分析机构称DeepSeek V3 成本远超600 万美元，实际达13亿美元！

OpenAI 最强模型o3 今晚发布！

重现Deepseek R1 「Aha Moment」的完整教程来了！

当马斯克的脑机接口卷到了书法界，我们正在见证史上最硬核的意念书法大赛！

Stable Diffusion 创始人：DeepSeek 没有抄袭！

Anthropic CEO：DeepSeek 为落后的追随者，需进一步加强中国芯片管制！

OpenAI 称有证据证明DeepSeek违规使用其模型！

Grok 重磅推出推理能力，Grok 3 或指日可待！

DeepSeek严正声明：警惕虚假账号冒充！

手把手教学：40000 元在家跑顶级DeepSeek R1的完整方案！

重磅！OpenAI 推出美国政府专用版ChatGPT Gov！

Meta 或成开源竞赛中最大输家！

DeepSeek 入场，Meta 或成开源竞赛中最大输家！

终于，Sam Altman 正面迎战DeepSeek！

量化压缩80%！160GB就能运行671B的DeepSeek R1

炸裂！DeepSeek 的新春礼物——多模态模型Janus-Pro 详解

DeepSeek 爆火遭Scale AI 华裔 CEO Alexandr Wang 痛批：美国必须加强对中国AI 管制！

继Operator 之后，Perplexity 推出多模态助手！

马斯克：OpenAI 星门计划将流产！

DeepSeek R1 6百万美元训练成本是否真实？

试用完 OpenAI 的新代理工具，以下是我们的发现

哈佛医学院：AI 将治愈癌症，Sam Altman 没在吹牛！

重磅！字节发布UI-TARS大模型，三句话搞定电脑操作！碾压GPT-4！

Perplexity发布Sonar API，提供实时信息搜索功能，一举超越所有搜索引擎和LLM！

Perplexity发布Sonar API，一举超越所有搜索引擎和LLM

重磅！OpenAI 宣布5000亿美元启动Stargate项目，「星门计划」再起波澜！

Anthropic发布 Agent 最佳实践指南！

重磅！Anthropic CEO 称将于2025年推出数字员工！

Perplexity CEO：印度应向中国学习模型研发！

DeepSeek R1 训练方法解析

超便携AI超算来了！这台「公文包」竟能塞下一台超级计算机

以小博大，DeepSeek-R1-Distill-Qwen-1.5B 开源模型击败GPT-4和Claude 3.5!

爬虫工程师将失业！Firecrawl 能让你一句话抓取全网数据！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉