资讯 | 代理(Agentic) AI与生成式(Generative)AI

文摘   2024-12-23 22:58   广东  

大语言模型 (Large Language Models, LLM)(例如GPT)可以生成文本、回答问题并协助完成许多任务。但是,它们是被动的,这意味着它们只能根据所学的模式对收到的输入做出反应。LLM 无法自行做出决定;除此之外,它们无法规划或适应不断变化的情况。

代理人工智能(Agentic AI)可以解决这个问题。与生成式人工智能LLM不同,代理人工智能可以采取主动行动,设定目标并从经验中学习。它是主动的,能够随着时间的推移调整其行动,并且可以处理需要持续解决问题和决策的更复杂任务。这种从被动到主动的人工智能的转变为许多行业的技术开辟了新的可能性。

什么是 Agentic AI

代理人工智能是指能够自主做出决策并采取行动以实现特定目标的人工智能系统。这些人工智能模型不仅可以生成内容,还可以与周围环境互动、响应变化并在极少的人工指导下完成任务。例如,具有代理功能的虚拟助手不仅可以提供信息,还可以安排约会、管理提醒或执行其他操作来帮助用户实现目标。同样,自动驾驶汽车也是代理型人工智能的典型代表,因为它们可以做出实时决策,独立安全地行驶道路并到达目的地。

什么是生成式人工智能

生成式人工智能是一种专注于创建新内容(例如文本、图像、音乐甚至视频)的人工智能。它的工作原理是从大量数据中学习以了解模式、风格或结构,然后根据所学内容生成原创内容。例如,像 ChatGPT 这样的生成式人工智能可以对问题生成独特的文本响应,而像 DALL-E 这样的图像生成模型可以根据文本描述创建图像。从本质上讲,生成式人工智能就像一位数字艺术家或作家,根据所学内容创作作品。

上图重点介绍了 Agentic AI 如何通过迭代、循环的工作流程工作,其中包括“思考/研究”和“修订”阶段。这一自适应过程涉及持续的自我评估和改进,使 Agentic AI 能够产生更高质量、更优化的输出。通过采取多个步骤来测试和改进其工作,Agentic AI 可以独立运行,从每个阶段学习,并处理需要持续评估和调整的任务。

在上图中,您可以看到生成式人工智能如何遵循简单的单步工作流程:它直接从“开始”移动到“完成”。这意味着人工智能会立即做出响应,而无需重新查看或优化其输出。该过程是线性的,会产生满足初始提示的基本结果,但不考虑极端情况或迭代测试。这说明了生成式人工智能在处理更复杂或自适应任务方面的局限性。

Agentic AI和GenAI的特点

本节探讨 Agentic AI 和 GenAI 的独特特性,强调它们对智能、自主性和决策的不同方法。

代理人工智能

自主性:Agentic AI 可以独立行动,无需人类不断输入。它可以自行做出决定并执行任务。可以将其想象成一个无需人类控制的机器人,根据周围环境确定下一步要做什么。

目标导向行为:Agentic AI 的运行有着明确的目标。它不会随机地对世界做出反应,而是积极地朝着特定目标努力。例如,自动驾驶汽车会努力将您安全送达目的地,它采取的每一个动作,从转向到刹车,都是为了实现这一目标。

适应和学习:代理从其行为和经验中学习。当遇到问题或失败时,它会进行调整。例如,推荐电影的人工智能会了解您喜欢哪些电影,并随着时间的推移不断改进,为您提供更好的建议。

复杂决策:Agentic AI 不只是做出简单的选择;它会评估许多选项并考虑结果。想象一下控制股票交易算法的 AI:它会分析大量数据、预测趋势并根据这些信息决定是否买入或卖出股票。

环境感知:人工智能要做出明智的选择,就需要了解其环境。它通过传感器或数据来实现这一点。例如,机器人使用摄像头“看到”障碍物,然后绕过它们。

GenAI

自主性有限:生成式人工智能的自主性有限。它不能独立行动,需要人工输入才能产生响应。它会处理收到的输入,并根据学习到的模式产生输出,但它无法在没有外部提示的情况下发起行动或运行。

面向任务的行为:生成式人工智能面向任务,但仅限于反应性。它通过生成相关内容(例如文本或图像)来响应特定提示或任务,但它不追求长期目标或没有总体目标。每项任务都是基于即时输入完成的。

基本决策:生成式人工智能参与基本决策。它根据所学的模式选择输出,但不会评估多种替代方案或考虑后果。例如,在生成文本时,它会根据训练选择最有可能的下一个单词或短语,但不会做出复杂的分层决策。

无法学习或适应:生成式人工智能无法实时学习或适应。经过训练后,它会根据训练期间学习到的模式进行操作,但不会根据新的交互改变或提高其性能,除非使用更新的数据进行重新训练。

无环境感知:生成式人工智能无环境感知。它处理数据(例如文本、图像),但无法感知或解释物理环境。它无法理解周围环境,只能对输入做出反应,没有任何外部意识。

案例研究:Agentic 工作流程实际应用

虽然生成式 AI 和代理 AI 之间的理论区别很明显,但只有将这些概念付诸实践,才能真正体现代理 AI 的潜力。为了展示其实际价值,让我们探索一个案例研究,展示代理 AI 在现实场景中如何胜过传统的 LLM 方法。

吴恩达分享了一个案例研究,以强调 Agentic Workflow 在编码任务中的强大功能。他的团队使用 HumanEval 编码基准测试了两种方法。任务是:“给定一个整数列表,返回所有偶数位置元素的总和。”在第一种方法零样本提示中,AI 被要求直接解决问题,而无需任何额外步骤。例如,GPT-3.5 的准确率为 48%,而 GPT-4 的表现更好,为 67%。这些结果不错,但并不出众。

零样本提示:要求人工智能解决问题,但不提供额外指导或将其分解为更小的步骤。

Agentic Workflow:一种将任务分解为较小阶段的方法,例如理解、编码、测试和调试,从而允许 AI 随着时间的推移进行迭代和改进。

然而,当团队应用 Agentic Workflow 时,GPT-3.5 的表现甚至比 GPT-4 更好,该工作流将任务分解为更小的步骤,例如理解问题、分部分编写代码、测试和修复错误。吴恩达指出,GPT-4 在使用 Agentic Workflow 时也表现出了更好的结果。这表明,通过采取循序渐进的方法,AI 模型(尤其是较老的模型)可以胜过使用零样本提示等传统方法的更高级模型。

结论

随着人工智能在我们的生活和工作场所中占据越来越重要的地位,了解代理人工智能和生成人工智能之间的区别非常重要。生成人工智能在文本生成等任务中非常有用,可以通过生成文本或图像来响应提示。但它仅限于遵循指令,没有真正的自主权。另一方面,代理人工智能向前迈进了一步——它可以自行设定目标、做出决策并适应不断变化的情况,无需不断的人工指导即可完成复杂任务。

通过使用 Agentic Workflow 等方法,AI 系统可以变得更加高效,通过迭代步骤和从每个阶段学习来提高性能。这种转变为高级应用程序带来了机会,甚至让较旧的模型也能不断发展并保持相关性。在本系列的下一篇文章中,我们将探讨 Agentic AI 在实践中的工作原理及其重塑行业和推动新创新的潜力。


微信群

图科学实验室Graph Science Lab
分享有关图理论、图表示学习、图神经网络、图+交叉学科(生物、化学、物理 ...)、图+交叉算法(DL、RL、NLP、CV ...)最新科研资讯、论文、开源工具、招生/招聘、会议/竞赛、课程/书籍。秉持文理兼修,也分享人文作品。欢迎持续关注。
 最新文章