“通往 AGI 的道路感觉更像是一段旅程,而不是一个目的地。但我认为这种类型的 Agent 工作流可以帮助我们在这个非常漫长的旅程中向前迈进一小步。”
——吴恩达(Andrew NG)
01
—
AI Agent 是什么
记忆: 分为短期记忆和长期记忆,类似于人类大脑的记忆功能。 规划: 包括思维链和目标分解,帮助 AI Agent 处理复杂任务。 工具和行动: AI Agent 使用不同的工具来执行任务,类似于人类使用工具完成工作。
值得一提的是,我的 Google 账号已经启用了 Google Search AI Overview 特性,但它还是走到了关键字搜索的逻辑。
02
—
为什么 Agent 会火
更强的智能 更可控的输出
就如《Coze工作流的深度体验:打造家庭会议助手并浅谈插件生态》提到的,使用 Agent 不仅能够让文章结构更加清晰,还让最后生成的文章内容更可控。
尤其是在企业端,稳定性和可解释性比起自主性更重要。
03
—
Agent 的方向和当前局限
当前的 Agent 还是个新兴的领域,有大量的研究和开源项目。尽管如此,吴恩达对 Agent 的发展方向做更具体的分类,便于我们有选择地运用到相关的产品设计中。
反思(Reflection)
工具使用(Tool user)
规划(Planning)
多智能体协同(Multi-agent collaboration)
目前来看,反思(Reflection) 和工具使用(Tool use)这两类是相对成熟的方向,稳定可控,推荐大家尽快用起来,至少值得作为一个 AI 应用工程落地的备选方案。
关于反思(Reflection),推荐大家一个开源项目:OpenDevin,它是一个编程智能体(Coding Agent),根据提示描述,可以自动生成代码、生成测试用例、自动 Debug,过程非常稳定、丝滑。
规划(Planning)和多智能体协同(Multi-agent collaboration) 目前还处于新兴阶段,当使用它们时,有时会对它们的表现感到震惊,但至少在目前,让它们稳定工作还有一定的挑战。
03
—
Agent 的方向和当前局限
【奇绩创坛】[AI Agent 开发者对话:科研和商业化落地》](
https://mp.weixin.qq.com/s/kbnaYmcJkWGOLLqDiGn-qQ) 【万维刚】[人的智能是 AI 的上限吗(下)》](https://www.dedao.cn/course/article?id=89GEyP73eprvKBPD1QJq2Mb0kRD64d) 【红杉 2024 AI 大会-吴恩达分享】[What's next for AI agentic workflows ft. Andrew Ng of AI Fund](https://www.youtube.com/watch?v=sal78ACtGTc&list=PLOhHNjZItNnOoPxOF3dmq30UxYqFuxXKn&index=2) 【腾讯 Agent 研究论文】[Masterman, Tula, Sandi Besen, Mason Sawtell, and Alex Chao. "The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey." arXiv, April 23, 2024.](https://arxiv.org/abs/2404.11584) 【贾扬清】[what did the most popular post in hacker news say today?](https://x.com/jiayq/status/1786208795720593789?mx=2)