两位来自加州大学伯克利分校和瑞士联邦理工学院的研究者,利用OpenAI的GPT-4o大型语言模型,教会了便宜的机器人手臂如何清理洒出来的液体。 这是一个非常巧妙的演示,展示了AI语言模型(如OpenAI的ChatGPT背后的技术)如何被用于表面上看似与语言毫无关系的任务。 这对机器人专家仅用了四天时间,就教会了这些只配备普通海绵的机器人手臂如何识别附近的液体洒漏。 在UC伯克利机器人学家Jannik Grothusen分享的视频中(https://x.com/JannikGrothusen/status/1852790503823...),可以看到机器人在被问到它面前有什么时,回答得很准确:“我看到了一块海绵和一个小洒漏在台面上。” “解释你会怎么做,并清理桌子。”研究人员接着指示。 “我会用机器人手臂清理桌面。”机器人用流利的英语回复道,“首先,我会检查可用的运动技能来拿起海绵并擦拭桌子,然后我会执行清理洒漏的动作序列。” 说干就干,机器人手臂立即行动,完全按照自己说的那样做了。
机器人对话式操作
Grothusen表示,机器人的动作是通过大约100次示范训练出来的。 这些机器人手臂完全开源,并且可以通过一个YouTube播放列表自行在家搭建。 一个名为“LangChain”的情境感知“多模态代理”作为框架,将大型语言模型的输入和输出转化为机器人的动作,通过强化学习进行控制。 Grothusen在LinkedIn的帖子中称,这项实验是“机器人控制架构的概念验证”,其中包括“用于人机交互、推理和协调的视觉语言模型”。 此外,它还展示了“开源技术如何开始让机器人领域变得更加普及”,因为这个机器手臂的价格便宜,且其学习算法完全开源。 不过,这个概念是否有朝一日能变成一个真正的家庭清洁机器人,还不得而知。
关注《森林聊AI商业》公众号
了解 AI 如何塑造商业的未来