当物理推理能力进化后,通用强化学习智能体能在2D物理环境中执行多样化任务了。
论文地址:https://arxiv.org/pdf/2410.23208 项目主页:https://kinetix-env.github.io/ 论文标题:Kinetix: Investigating the Training of General Agents through Open-Ended Physics-Based Control Tasks
观察空间
奖励
当物理推理能力进化后,通用强化学习智能体能在2D物理环境中执行多样化任务了。