历时18个月,地表最强人形机器人诞生了!黑色外观颜值爆表,五指灵活,号称是地球上最先进的AI硬件,还有OpenAI的模型加持推理。现在,它已经进宝马工厂打工了,干20小时都不带停的那种!
号称OpenAI二代机器人「Figure 02」,真的来了!刚刚,Figure AI终于官宣了第二代人形机器人,完全换了一身新形象——黑色的外观,更加灵活的五指。创始人Brett Adcock表示,「这是『地表最强』的人形机器人」!值得一提的是,Figure 02的设计评审耗时18个月完成。据介绍,迭代后的Figure手部具有16个自由度,能够承受与人类相当的力量。现在的它,已经进入宝马车厂开始打工了,可以无休止地狂干20个小时。
Figure 02还可以与人类直接开启「语音对话」,这背后依旧用上了OpenAI最先进的定制AI模型,通过语音-语音进行推理。与初代类似,它拥有一个机载的视觉模型(VLM),可通过摄像头,完成视觉推理。去年,初代机器人Figure 01,同样在OpenAI大模型的加持下,能够看、听、遵循人类指令。不仅如此,这家明星初创背后,还得到了英伟达、奥特曼、贝佐斯等大佬的联合投资。如今,工程和设计团队在Figure 02上完成了一次从零开始的硬件和软件重新设计。其中,在包括人工智能、计算机视觉、电池、电子设备、传感器和执行器等关键技术上,取得了巨大的进步:语音到语音:通过内置麦克风和扬声器连接自定义AI模型,能够与人类进行对话
摄像头:由6个内置RGB摄像头驱动的AI视觉系统
手部:第四代手部具有16个自由度和等同于人类的力量
内置VLM:使机器人摄像头能够进行快速的常识性视觉推理
电池:机器人躯干内的2.25千瓦时定制电池组提供50%以上的能量
- CPU/GPU:相比上一代,机载计算和AI推理能力提高了3倍
Figure 02机器人与其前身Figure 01身高相似,但在很多方面都进行了改进。最明显的变化是机器人的「皮肤」采用了哑光黑色外观,而不是Figure 01的铬金属饰面。之前的机器人看起来像穿着盔甲,而Figure 02看起来像一辆现代跑车,拥有流线型的曲线和精致的外观。另一个变化部分就是电缆。在Figure 01中,电缆被故意布置在机身外部,以支持测试夹具、更换传感器和电机,并加快维修速度。而在Figure 02中,所有电缆都集成到了四肢中,保护它们免受环境的影响,并为长时间在生产线上工作做好准备。Figure AI表示,新机器人的电池容量比Figure 01大50%,能够在实际部署中工作更长时间。电池已集成到人形机器人的躯干中,使其重心更接近中心线位置,使得机器人更加灵活。Figure AI还为其定制了电机,与关节传动系统集成在一起,以优化每个关节的功率和性能。机器人设计的一大难题,就是可靠地通过旋转关节布线。我们可以看到,Figure 02的肩部、肘部、髋部和膝部四个主要关节组设计非常简洁,完美解决了这个难题。
AI模型的训练决定了机器人智能和能力的核心,因此Figure AI与OpenAI的合作可谓「如虎添翼」,能够快速测试、验证和迭代机器人的语音互动功能。早在GPT-4o发布前,Figure AI的视频就展示了机器人如何通过语音指令与人类互动,最新发布的Figure 02在OpenAI定制模型到加持下,也可以通过麦克风和扬声器人类进行对话。Figure AI表示,Figure 02的计算和AI推理能力提升了3倍,可以在现实世界中完全自主地执行任务。新型号配备了六个RGB摄像头,用于感知物理世界,此外还配备了一个车载视觉语言模型,能够快速进行常识性的视觉推理。视觉模型能够处理所有车载图像以进行感知、避障,最重要的是进行手眼协调,以便机器人能够识别并拾取面前的物体。另外,比起Figure 01,Figure 02拥有3倍机载计算能力和AI推理能力。这使得机器人能够完全自主地执行实际的AI任务。这里AI数据引擎会提供最新的AI模型,并直接直接在设备的GPU上运行。
自成立以来,Figure AI已经在机器人手部的设计和功能上投入了大量资金。由此得到的最新设计,不仅具有十六个自由度(DoF),而且能够承载最多25公斤(55.1 磅)的物体。与此同时,这双「手」的外观也与人类都非常相似——有四根手指和一个拇指。具体来说,每根手指由一个集成单元驱动,该单元包括传感器和电机。手腕是另一个新颖的设计,提供了与人类手腕相似的运动范围,同时将所有电力和传感信号线路封装并引导到手和手指。Figure AI表示,他们的目标就是让机器人能够操控任何人类手能抓住的物体。
Figure AI最初摆脱「隐身」模式还是在2023年3月,推出了通用人形机器人Figure 01,希望能应用于工业制造、物流、仓储、零售等多个行业以解决全球范围内的劳动短缺问题。根据创始人Adcock的设想,机器人们可以替人类承担不安全和不受欢迎的工作,构建一个更加自动化且高效的未来。并且他坚称,Figure AI的这项技术绝不会被武器化。很难想象,Figure AI第一代全规模机器人的构建仅花了短短6个月的时间,不得不说,这得益于包括CTO Jerry Pratt在内的40名行业专家组成的强大团队。作为2024年初的投资宠儿,Figure AI目前已筹集了6.75亿美元资金。凭借雄厚的资金,联合创始人兼CEO Brett Adcock正在全速推进,目标是在未来2~5年内将自主双足机器人推向市场。其实,今年早些时候,Figure AI就已经在南卡罗来纳州一家宝马工厂测试了。在这里,AI模型训练的数据会被收集起来。在演示中我们可以看到,机器人完全展现出了在工业环境中运行的能力,还能学习执行基本任务。当然,这个越来越卷的赛道中,其他竞争对手也没闲着。Agility Robotics的Digit和Apptronik的Apollo,早就把自家机器人部署到了GXO物流公司中,执行简单任务。马斯克家的Optimus,也很早就被「下放」到了特斯拉工厂;波士顿动力,也有意在现代设施中,给最新版Atlas进行测试。在科幻故事中,我们早就见识过各类人形机器人,但在商业产品的推出上,它们其实一直进展缓慢。一方面是受限于研究环境,另一方面,设计也非常昂贵。然而,LLM和多模态AI模型的发展,改变了这一切!如果模型能快速分析实时视频和音频输入,还能以类人音频和动作进行相应,那科幻中的场景,显然不会很遥远了。拥有Optimus的马斯克最近大胆预言,地球上有超过100亿台人形机器人的市场,这意味着未来每个人会拥有不止一台机器人。此外,英伟达的GR00T项目也在进行时,展示了AI在指导人形机器人方面的进展。Jim Fan发布的这个视频中,人类远程操作员可以通过佩戴Apple Vision Pro来引导机器人完成正确动作。
由于官方并没有透露太多信息,因此外媒IEEE Spectrum找到了Figure的控制总监Michael Rose和硬件总监Vadim Chernyak,并做了一波快速的QA。问:Figure 02有多少个部件?这些是全部吗?
答:有几百个独特的部件,总共有几千个部件。不,这不是全部。问:Figure 02每走一步都会留下Figure标志吗?
问:「可更换的腿」是很难做到的吗,还是因为只需要做一条腿而更容易呢?
问:电池包也是可更换的吗?
答:我们的电池是可更换的,但这不是一个快速更换的过程。问:Figure 02膝盖后面和肘关节处那个看起来软软的东西是什么呢?
答:这些是软限位器,它们以受控的方式限制运动范围,并防止机器人夹伤。问:你们把拇指的马达藏哪了?
问:脖子上的「皮肤」是什么?
答:这种皮肤是一种柔软的织物,即使机器人移动头部,也能保持干净无缝的外观。问:当Figure 02的头部转动时,它的身体也会转动,手臂也会移动。这是必要的,还是只是出于美学考虑?
问:上半身和肩膀看起来比其他人形机器人窄得多。为什么设计成这样?
答:我们认为将机器人设计成与人类相似的比例非常重要。这使我们能够完成目标使用场景,并更容易适应环境。问:Figure 02的步态是如何设计的?
答:机器人使用模型预测控制器来确定脚步位置和维持平衡所需的力量,从而跟随预定的轨迹。问:2.25千瓦时的电量在视频中的那些任务中能运行多长时间?
https://x.com/Figure_robot/status/1820791819023909031https://www.therobotreport.com/figure-02-humanoid-robot-is-ready-to-get-to-work/https://spectrum.ieee.org/figure-new-humanoid-robothttps://venturebeat.com/ai/openai-backed-startup-figure-teases-new-humanoid-robot-figure-02/
人工智能 | 超高清
产业创新 | 技术孵化 | 成果转化