大模型Agent,如何利用历史经验自我进化?

学术   2024-09-20 11:55   湖北  

论文笔记分享,标题:Agent Workflow Memory Agent。代码开源:https://github.com/zorazrw/agent-workflow-memory/tree/main

考虑到人类是可以通过从过去的经验中学习可重用的任务工作流程,然后用这些经验来指导未来的行动,从而更好的解决复杂任务。

所以使用累死的模式,构建可以从历史任务过程中受益的Agent系统,Agent Workflow Memory (AWM)来了。

如下图,在经过40个样例之后,AWM与传统Agent系统的差距已经来到了22.5%

AWM的核心思想是,通过提取可重用的工作流,并将这些工作流整合到Agent的记忆中,然后指导未来的任务处理。每个工作流代表从一个任务对应的动作序列中提取的通用流程,如下图,框住的是用户query,最后step3是转换之后的工作流,id已经完成了脱敏。

对于离线和在线,工作流记忆都可以正常作用,离线的用训练数据,在线的用之间的进行提取。

跨任务,跨领域都取得了不错的结果。能够将从一个任务中学习到的工作流程应用于其他任务。

NLP前沿
一手ai news分享 \x26amp; 热点paper解读
 最新文章