Agent智能体？我们要的到底是什么

文摘 2024-07-08 09:02 湖北

❝
近年来，大型语言模型（LLM）的能力越来越强，应用范围也越来越广泛，其中一个热门方向就是智能体（Agent）。但在这一切的背后，我们真正追求的是什么？是简单地让机器执行命令，还是赋予它们更多的智能体特性（Agentic features），使它们能够更加自主地参与决策过程？

本文将深入探讨智能体的概念、为何“具有智能体特性”变得如此重要，以及这一趋势如何影响我们对未来技术的构想。

什么是智能体？

传统应用程序通常遵循预先定义好的规则和逻辑，而智能体则不同，它可以根据LLM的理解和判断，动态地选择下一步操作，这使得智能体能够处理更加复杂和不确定的任务。

简单来说，智能体就是一个利用LLM来决定应用程序控制流程的系统，可以被视为一种能够自主决策和执行任务的系统。它通过与外部数据和计算资源的交互，来实现复杂的任务。

以LangChain生态为例，通过LangChain创建的很多LLM应用的工具，特别是那些作为推理引擎并与外部数据源和计算资源交互的系统，这些系统通常被称为智能体。

❝
智能体的定义可能因人而异。技术上讲，智能体是一个利用LLM来决定应用程序控制流程的系统。

然而，这样的定义并不完美。人们往往认为智能体是高级的、自主的、类似人类的系统，但一个简单的系统也可以通过LLM在两条不同路径之间进行路由，这也符合技术定义。这表明，智能体的定义并不单一，而是具有多样性。

举个例子，想象一下一个智能客服机器人。传统的客服机器人只能根据预设的关键词进行简单的问答。但智能客服机器人则可以利用LLM理解用户的真实意图，并根据情况选择不同的对话策略，例如：

如果用户只是询问简单的信息，智能客服机器人可以直接给出答案。
如果用户的问题比较复杂，智能客服机器人可以引导用户提供更多信息，或者将用户转接到人工客服。

Agentic意味着什么？

Agentic可以理解为“具有智能体特性”。一个系统越“具有智能体特性”，就意味着LLM在决定系统行为方面的作用越大。

我们可以把Agentic看作一个连续谱系：

一端是完全没有Agentic的系统。 这些系统完全按照预设的规则运行，LLM的作用仅仅是提供信息或执行简单的指令。
另一端是完全Agentic的系统。 这些系统的行为完全由LLM决定，甚至可以自己设定目标和计划。

当然，大多数实际系统都处于这个谱系的中间地带。例如，一个智能客服机器人可能在回答简单问题时没有Agentic，但在处理复杂问题时就需要一定的**Agentic。

吴恩达提出了一个观点，即智能体的能力可以被视为一个谱系，就像自动驾驶车辆有不同的自动化等级一样，智能体的能力也可以有不同的等级,因而在现阶段使用Agentic定义比Agent更加合适。这个观点得到了广泛的认同，并且有助于更好地理解智能体的不同层次。

根据系统中LLM的作用程度，可以将智能体划分为不同的等级：

路由器（Router）：使用LLM将输入路由到特定的下游工作流，这种行为具有一定的“智能体特性”。
状态机（State Machine）：如果系统使用多个LLM进行多次路由步骤，并且其中一个步骤决定是否继续或结束，这种系统就类似于状态机。
自主智能体（Autonomous Agent）：如果系统能够构建工具、记住这些工具并在未来的步骤中使用它们，这种系统就具有高度的智能体特性。

尽管这些定义看起来比较技术性，但在设计和描述LLM系统时，这些技术定义是非常有用的。

Agentic为何有价值？

理解Agentic的概念对于构建和使用基于LLM的系统至关重要。它可以帮助我们：

选择合适的系统架构。 对于一些简单的任务，可能并不需要Agentic，传统的应用程序就足够了。但对于一些复杂的任务，就需要考虑构建具有Agentic的系统。
设计更有效的交互方式。 对于具有Agentic的系统，我们需要设计更灵活的交互方式，以便LLM能够充分发挥其作用。
评估系统的性能。 对于具有Agentic的系统，传统的评估指标可能不再适用，我们需要探索新的评估方法。

总而言之，Agentic是一个需要根据具体问题和应用场景进行权衡的因素。

更进一步说，理解你的系统可以有多“具有智能体特性”，可以在开发过程中指导你的决策——包括构建、运行、交互、评估，甚至监控。

构建：在构建复杂的智能体系统时，拥有一个框架可以加速开发过程。这个框架应该支持分支逻辑和循环。
运行：智能体系统越复杂，运行起来就越困难。需要能够处理长时间运行的任务，并且在执行过程中处理任何可能发生的错误。
交互：在系统运行时，你需要观察系统内部的运行情况，并在必要时修改智能体的状态或指令。
评估：需要一个评估框架来测试智能体的表现，包括中间步骤的效率。
监控：需要一个新的监控框架来深入了解智能体的每一步操作，并根据智能体的步骤查询运行情况。

理解和利用系统中智能体特性的谱系，可以提高开发过程的效率和系统的鲁棒性。

Agentic是新趋势

随着LLM技术的不断发展，我们正在构建越来越多的具有Agentic的系统。例如：

自主机器人： 可以根据环境和任务自主规划行动路线，例如自动驾驶汽车、物流机器人等。
智能个人助理： 可以根据用户的习惯和需求提供个性化的服务，例如安排日程、推荐内容等。
智能创作工具： 可以辅助用户进行创作，例如生成文本、图像、音乐等。

随着我们在智能体谱系上走得更远，支持工具的整个生态系统都需要重新构想。我们需要开发新的编程模型、调试工具和评估指标，以支持这些更复杂、更智能的系统。

传统的工具和基础设施可能无法满足需求,例如，LangGraph和LangSmith就是为了帮助构建、运行和交互智能体而设计的新工具。

随着智能体特性的不断发展，我们需要重新构想整个支持工具的生态系统，以适应智能体应用的需求。

总结

Agent和Agentic是理解和构建基于LLM的系统的关键概念。随着LLM技术的不断发展，我们可以预见，未来将会出现更多更强大的智能体，为我们的生活带来更多便利和可能性。

智能体技术的探索之路还很长，但通过不断地学习和创新，我们有望构建一个更加智能、更加互联的未来。

今天的内容就到这里，如果老铁觉得还行，可以来一波三连，感谢！

AI小智

AI认知架构师，让我们一起用AI改变世界！

最新文章

LangChain 2024年人工智能发展报告

《一书解决几乎所有机器学习问题》.PDF下载

AI 打工我躺平｜大厂前端摸鱼指南

大模型面试实战！Prompt调优

改个名字，数倍提升Function Calling准确率！

如何生成Function Calling微调数据？

又一本开源免费的大模型书来了，449页pdf！

作为开发者，我如何提高任务型大模型应用的响应性能

总算有人把智能体记忆说清楚了

军用大模型现世，AI战争新时代

AI创造者计划,通义开启电影创作新时代

探索LLM推理全阶段的JSON格式输出限制方法

小米SU7智能举报不用等，我用智谱的GLM-4-Plus搞定了！

AI最大的应用是什么，如何成为初代AGI产品经理？

光与AI：视障玩家的《黑神话：悟空》挑战

必须为孩子存下来的提示词，像玩黑神话游戏一样学习

LangChain百万代码全解析：这个模型胃口很大！

可信Agent构建之道：AI如何重塑工作流？

AI界的新宠：揭秘Llama 3.1如何革新AI合成技术

LLM工具调用破局：Few-shot Prompting

如何改进Agents的推理与规划?

Agent智能体？我们要的到底是什么

难倒吴恩达的LLM评估，有解吗？

全新发布：LangGraph开启认知架构新纪元

探索GLM4-ALLTools：全能AI工具箱，释放开发者潜能

大模型能力分水岭数学考试，文心一言超gpt4o排名第一

吴恩达揭秘：编程Agent如何革新软件开发行业

全网爆火的AI狼人杀：开源了

Hugging Face全面拥抱LangChain：全新官方合作包

无需魔法,无需插件,国内网络即刻愉快的使用搭载GPT4的Newbing!

AI办公自动化｜使用New Bing和Python实现Word转Excel

无网络限制人人可用的ChatGPT-Claude

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉