先别让 AI 智能体干活,让他思考

科技   2024-12-30 08:00   广东  

不要一开始就让 AI 直接干活

先让 AI 做意图理解,再根据流程选择不同的智能体干活

最近在缓过来半口气的 ChatPAN 在做提示词的测试,对吴恩达提出的 Agentic AI 有了更深的理解

什么是 ChatPAN

ChatPAN 是一个我写的基于用户自己资料库的工具(暂未上线)

用户自己组合知识库,可以是书、文章等,然后再对接到微信中以机器人的形式进行问答。如文“如何通过小红书采集用户需求”,就会通过 RAG 到自己设定的资料库进行查询,然后返回结果。

就 ChatPAN 本身先不多说了,这里主要就提示词进行讨论

吴恩达的 Agentic AI 是什么

这是一种新型的智能体技术,指的是一类能够实现自主操作的人工智能系统,他可以作出决策,并且与环境互动

设计模式

  • 反思(Reflection):模型能够检查自身的工作,发现问题,并进行迭代修订。例如,在生成文本内容时,智能体可以对生成的初稿进行自我审查,检查逻辑是否连贯、语法是否正确等,并根据检查结果进行修改完善,从而提高输出质量
  • 工具使用(Tool Use):智能体可以借助外部工具来进行分析、收集信息以及采取行动。比如,在需要获取最新数据时,智能体能够调用网络搜索工具,通过整合工具的功能,更高效地完成复杂任务
  • 规划(Planning):智能体能够自主规划一系列流程以达成目标。例如,在执行一个复杂的项目时,它可以先制定详细的计划,明确各个阶段的任务,然后按照计划执行
  • 多智能体协作(Multi-agent Collaboration):多个具有不同角色和专长的智能体相互协作,各自领取任务,共同完成任务

工作流程

  • 任务分解:将复杂的任务分解为多个更小的子任务,每个子任务的输出将作为下一步的输入,如此循环
  • 智能体执行:智能体为Agentic Workflow的核心,执行特定的子任务。每个代理可能负责工作流中的一个或多个特定环节。每个智能体都有自己角色和能力
  • 自适应循环:智能体边工作边收集反馈,评估自身的性能,并根据反馈调整自己的行为,整体可以自我进化

从 Agentic AI 得到的灵感

我们大多数使用 AI 时候,尤其是调用 API 的时候,都是写一个复杂的提示词,调用模型接口返回结果,因为这样简单啊

好处

调用简单,直接调用,直接返回结果

坏处

对于需要得到一个足够好的结果,就要写非常强悍当然也很复杂的提示词。就算是一个提示词可以搞定,那也需要大模型足够强的能力,所以我们才不断地追求模型能力。

这对我们提示词的能力和钱包能力就有了超高要求

简单改进

现在直接做一套 Agentic AI 就很难,但我们可以从中吸取很多灵感。

先让 AI 做意图理解,再选择合适的智能体/不同的条件进行后续工作

做一个最小的改动

  1. 入口智能体接收用户的问题/需求,根据需求分析意图并输出拆解后的意图/任务。
  2. 根据意图,选择工作智能体,干活
  3. 整合工作智能体的结果,形成最终结果返回给用户

上面对 AI 的使用,要大量使用 JSON 作为数据格式,方便程序进行后续的操作

案例说明

上面说了半天,搞不好有点懵,咱们弄个案例就知道了

简单的一个

先说一个好理解的,如果我们问 AI

他的第一张专辑是什么?

如果此时 AI 直接去工作,就很啼笑皆非

他怎么知道我问的不是张学友呢?

如果按照上面的改动,就应该

  1. 入口智能体接收用户的问题/需求,分析意图,发现无法明确“他”的指代,应该进行提问确认
  2. 当确认了“他”之后,再进行搜索等工作

我的真实案例

上面我说的 ChatPAN 是一个基于用户自己资料库的问答工具,最直接的使用方式

  1. 用户向智能体提问,给出问题
  2. 智能体使用问题,进行 embedding/RAG 等方式对资料库数据进行检索(这里不纠结技术细节哈)
  3. 根据检索的资料信息,整合并提问大模型给出回答

不能说这个流程不对,给出的结果也可以接受,但是可能有如下的优化空间

  • 用户的问题,如果不足够精准,如何能够正确的进行资料检索
  • 一个问题如果涉及多个角度,单一提问方式如何全方位覆盖

新方式,在这个提问的场景下

  1. 用户向智能体提问,给出问题
  2. 智能体理解问题,根据设定的身份/场景,分析问题,把原始问题拆解为多个子问题
  3. 使用子问题进行 embedding/RAG 等方式对资料库数据进行检索(这里不纠结技术细节哈)
  4. 根据检索的资料信息,整合并提问大模型给出回答

问题

在线教程售卖、线下培训。有什么实操的案例和建议


# Instructions 1. 请使用 CoT 的方式,逐步推理,给出最终答案 2. 请先认真阅读问题,并思考问题与xxxxxxxxxxxx等是否相关 3. 尝试理解沟通者的深层的意图,可能他无法明确的表达自己的含义,请帮助完善意图,和修改为完整的问题描述 3. 根据核心意图和原始问题,提取关键信息并推导拆分为多个子问题,子问题可以是更全面的描述,也可以是具体的拆解步骤,或者是相关的描述,保障每个子问题的独立性,每个子问题要完整,适合使用向量检索相似性 4. 每个子问题,可以衍生出来不同的表达方式,为了可以使用向量检索到更完整的内容,对每个子问题产生相关联的问题,也罗列在子问题的后面。 - 子问题的不同表达方式可以作为相关问题  - 子问题可以衍生的情况、行为、相似描述,可以作为相关问题

👆👆👆参考我使用的提示词👆👆👆


被拆解的子问题

  • 在线教程售卖有哪些成功的实操案例
  • 有哪些知名的在线教程售卖平台的成功案例
  • 不同领域的在线教程售卖实操案例有哪些
  • 开展线下培训有哪些成功的实操案例
  • 各类热门行业线下培训的成功实操案例分享
  • 针对不同人群的线下培训实操案例有哪些
  • 进行在线教程售卖有哪些实用的建议
  • 如何提高在线教程的销量的建议
  • 制作吸引人的在线教程有哪些建议
  • 开展线下培训有哪些实用的建议
  • 如何吸引学员参加线下培训的建议
  • 线下培训的课程设计有哪些建议

因为多了 2 这个步骤,一个问题被拆解了 12 个问题,自然会让结果效果提升很高

在吴恩达的测试中 Agentic AI 可以使用 GPT3.5 达到 GPT4 的水平。我自己目测是效果可以提高很多

这就可以让我们在很多环节使用国产 AI 达到 GPT/Claude 的效果

添加我微信,一起聊 AI。商单当然也欢迎


新一代智能化应用
人工智能是一门认知科学,而新一代的智能化应用是一个系统工程。智能应用程序是 人工智能驱动的应用程序,可转变用户的工作效率、自动化流程并获得见解
 最新文章