作者|沙丘智库研究团队
来源|沙丘社区(www.shaqiu.cn)
大模型缺少在最少的人类监督下自主行动的能力,以及在复杂环境中适应和执行目标的能力,基于大模型的AI Agent利用大模型理解、思考输出的“专家能力”,并附加规划、记忆、执行、工具调用能力,可以替代大量人工执行,消除大模型和真实世界沟通的障碍,解决大模型落地的“最后一公里”。
当前,AI Agent已经成为企业落地大模型时的必要路径之一。
按照智能体数量划分,AI Agent可以分为Single-agent和Multi-agent。Single-agent(单个智能体)较为常见,Multi-agent(多智能体)是在Single-agent的基础上,通过多个Agent之间的交互去解决更加复杂的问题。
根据沙丘智库发布的《2024中国AI Agent市场指南》,Multi-agent系统(MAS)由多个彼此独立但可互相交互的的Agent组成,每个Agent都能感知环境并采取行动。多个Agent朝着一个共同的目标努力,这个目标通常超出了单个Agent的能力范围。
多个Agent的联合应用可以解决单个Agent无法完成的复杂任务,同时创造出适应性更强、扩展性更高和更稳健的解决方案。但Multi-agent系统通常比单个Single-agent系统更难设计。这些系统可能会表现出难以提前预测的突发行为,需要更强大的训练和测试,以及持续的监控、追溯和文档记录。例如,Agent之间相互冲突的目标和互动可能会产生不良行为。
当前,大模型以及AI Agent技术仍处于快速发展阶段,在企业应用过程中,是Single-agent系统还是Multi-agent系统更为有效,没有确定答案,需要结合场景特点、技术能力等多方面的因素考虑。
Single-agent的潜力不可忽视,Multi-agent的价值同样值得期待。Single-agent系统在处理那些定义清晰、无需其他智能体角色或用户反馈的任务时表现较为出色,Multi-agent系统则在需要多方协作和能够采取多条执行路径的情况下,展现出其独特的优势。
沙丘智库长期跟踪调研大模型技术的发展,旨在帮助企业快速了解大模型最新、最全面的落地情况。在Multi-agent系统的落地实践方面,当前已有企业在客服、销售、运维等任务参与方较多、场景较为复杂、需要灵活调整的场景进行了探索。沙丘智库通过研究联想、百度、华为、蚂蚁等头部企业的Multi-agent落地实践,旨在为其他企业提供参考。
▎案例1:联想基于Multi-agent的销售提效实践
联想通过建立一个multi-agent系统来简化销售场景的产品配置建议流程,旨在生成精准的、定制化的产品配置建议。multi-agent系统的工作流程如下:
· 系统内的每个Agent都由一个大语言模型支持执行特定任务,如检查库存可用性、优先考虑高毛利产品以及根据营销策略推广产品;
· 根据用户输入的prompt,每个Agent从知识库中获取特定信息,并触发工具包中的相关应用来执行任务。工具包是一个API集合,这些API可以在配置过程中触发应用,不同的Agent会根据不同的任务需求选择不同的API来完成任务。
▎案例2:百度客服AI Agent实践
基于Agent的对话系统需要做到在任务发起时理解任务并进行合理规划、在任务执行时根据任务状态进行灵活切换。
百度基于Agent的对话系统包括一个主Agent和多个子Agent,Master Agent作为规划器,三个子Agent(RAG Agent、信息收集Agent、观察Agent)完成知识答疑、信息收集等子任务。
▎案例3:华为基于LLM和Multi-agent的智能运维探索
华为探索基于大语言模型(LLM)和多智能体(Multi-agent)的智能运维方案,该方案利用大模型的知识储备与运维专业知识的结合,以及多智能体的协同工作,显著提高了故障分析、异常检测和根因定位的效率。
以故障诊断为例,系统检测到节点异常后,主管Agent收到信息后下发具体任务流,请检测Agent执行详细检测、请根因定位Agent根据详细检测结果查找根因、请故障分析Agent给出故障分析报告,然后检测Agent进行检测,将指标异常、异常程度、异常开始时间等信息输入给根因定位Agent,根因定位Agent执行根因定位分析,找到根因。然后将检测出来的信息和根因输入给故障分类Agent,利用大模型进行故障分类,然后启动故障分析Agent,输出可执行代码和总结。
金融领域因其信息、知识和决策的密集性,要求智能体解决方案具备严谨性和专业性。蚂蚁集团AgentUniverse框架是一个支持多智能体协作的开源项目,投研支小助是AgentUniverse框架的典型应用之一。
投研支小助中间是计划、执行、表达、评价的闭环,且闭环可以嵌套,例如在计划环节引入一层PEER通过分工得到更好的拆解,或者在评价环节再引入PEER的分工来做细粒度的精细评价,让子闭环内的多个Agent决定复杂任务如何进行更合理的拆解。
完整内容:蚂蚁金融场景的大模型多智能体实践
更多研究:
*更多生成式AI研究可前往“沙丘智库”小程序查阅
*有任何需求可咨询客服微信:zimu738