转载自:CAAI认知系统与信息处理专委会
【重磅最新】DeepMind发布"AGI 的六个层次及原则:实现 AGI 道路上的最近进展"!
【中文综述: 519篇文献】南京大学LAMDA团队发布“开放环境下的协作多智能体强化学习进展综述”
【Paper+Code】可证明样本效率的自主LLM智能体框架RAFA(Reason for Future, Act...)
【重磅】Q-Transformer,谷歌DeepMind让大模型+强化学习成为机器人感知世界的大脑
【80页综述】复旦NLP团队发布大模型Agent综述,一文纵览AI智能体的现状与未来
【Nature重磅最新】强化学习控制无人机竞速超越顶级人类玩家,突破移动机器人领域新里程碑
【 ChatGPT作者LilianWeng博客总结】智能体=LLM(大语言模型)+记忆+规划技巧+工具使用
【开源环境】斯坦福25个AI智能体「小镇」开源,Agent代表着AI的一种未来。
【前沿速递】17所高校32位作者联合综述最新技术:RLHF 的开放问题和技术限制(34页)
【ICML2023顶会最新】176页PPT详解RLHF(基于人类反馈的强化学习)技术原理与过程
【前沿观点】大模型(LLM)后的热点,AI"智能体(Agent)",OpenAI的新方向。
【DeepMind最新算法BBF】Bigger-Better-Faster,两小时超过人类!速通26款Atari游戏
【重磅Nature+代码开源】DeepMind提出AlphaDev, 用强化学习将排序算法提升70%
【53页综述】牛津&斯坦福:全面总结元强化学习(Meta-RL)定义、算法、应用、开放问题等