OpenAI版终结者降临!地表最强机器人Figure 02问世,进宝马狂飙20小时

科技   2024-08-07 17:30   广东  

历时18个月,地表最强人形机器人诞生了!黑色外观颜值爆表,五指灵活,号称是地球上最先进的AI硬件,还有OpenAI的模型加持推理。现在,它已经进宝马工厂打工了,干20小时都不带停的那种!

号称OpenAI二代机器人「Figure 02」,真的来了!
刚刚,Figure AI终于官宣了第二代人形机器人,完全换了一身新形象——黑色的外观,更加灵活的五指。
创始人Brett Adcock表示,「这是『地表最强』的人形机器人」!
值得一提的是,Figure 02的设计评审耗时18个月完成。
据介绍,迭代后的Figure手部具有16个自由度,能够承受与人类相当的力量。
现在的它,已经进入宝马车厂开始打工了,可以无休止地狂干20个小时。

Figure 02还可以与人类直接开启「语音对话」,这背后依旧用上了OpenAI最先进的定制AI模型,通过语音-语音进行推理。
与初代类似,它拥有一个机载的视觉模型(VLM),可通过摄像头,完成视觉推理。
去年,初代机器人Figure 01,同样在OpenAI大模型的加持下,能够看、听、遵循人类指令。
不仅如此,这家明星初创背后,还得到了英伟达、奥特曼、贝佐斯等大佬的联合投资。
如今,工程和设计团队在Figure 02上完成了一次从零开始的硬件和软件重新设计。
其中,在包括人工智能、计算机视觉、电池、电子设备、传感器和执行器等关键技术上,取得了巨大的进步:
  • 语音到语音:通过内置麦克风和扬声器连接自定义AI模型,能够与人类进行对话

  • 摄像头:由6个内置RGB摄像头驱动的AI视觉系统

  • 手部:第四代手部具有16个自由度和等同于人类的力量

  • 内置VLM:使机器人摄像头能够进行快速的常识性视觉推理

  • 电池:机器人躯干内的2.25千瓦时定制电池组提供50%以上的能量

  • CPU/GPU:相比上一代,机载计算和AI推理能力提高了3倍

更流线型的外观

Figure 02机器人与其前身Figure 01身高相似,但在很多方面都进行了改进。
最明显的变化是机器人的「皮肤」采用了哑光黑色外观,而不是Figure 01的铬金属饰面。
之前的机器人看起来像穿着盔甲,而Figure 02看起来像一辆现代跑车,拥有流线型的曲线和精致的外观。
另一个变化部分就是电缆。在Figure 01中,电缆被故意布置在机身外部,以支持测试夹具、更换传感器和电机,并加快维修速度。
而在Figure 02中,所有电缆都集成到了四肢中,保护它们免受环境的影响,并为长时间在生产线上工作做好准备。
Figure AI表示,新机器人的电池容量比Figure 01大50%,能够在实际部署中工作更长时间。电池已集成到人形机器人的躯干中,使其重心更接近中心线位置,使得机器人更加灵活。
Figure AI还为其定制了电机,与关节传动系统集成在一起,以优化每个关节的功率和性能。
机器人设计的一大难题,就是可靠地通过旋转关节布线。
我们可以看到,Figure 02的肩部、肘部、髋部和膝部四个主要关节组设计非常简洁,完美解决了这个难题。

准备好接收语音指令

AI模型的训练决定了机器人智能和能力的核心,因此Figure AI与OpenAI的合作可谓「如虎添翼」,能够快速测试、验证和迭代机器人的语音互动功能。
早在GPT-4o发布前,Figure AI的视频就展示了机器人如何通过语音指令与人类互动,最新发布的Figure 02在OpenAI定制模型到加持下,也可以通过麦克风和扬声器人类进行对话。
Figure AI表示,Figure 02的计算和AI推理能力提升了3倍,可以在现实世界中完全自主地执行任务。

新型号配备了六个RGB摄像头,用于感知物理世界,此外还配备了一个车载视觉语言模型,能够快速进行常识性的视觉推理。
视觉模型能够处理所有车载图像以进行感知、避障,最重要的是进行手眼协调,以便机器人能够识别并拾取面前的物体。
另外,比起Figure 01,Figure 02拥有3倍机载计算能力和AI推理能力。这使得机器人能够完全自主地执行实际的AI任务。
这里AI数据引擎会提供最新的AI模型,并直接直接在设备的GPU上运行。

操控人手能抓的物体

自成立以来,Figure AI已经在机器人手部的设计和功能上投入了大量资金。
由此得到的最新设计,不仅具有十六个自由度(DoF),而且能够承载最多25公斤(55.1 磅)的物体。
与此同时,这双「手」的外观也与人类都非常相似——有四根手指和一个拇指。
具体来说,每根手指由一个集成单元驱动,该单元包括传感器和电机。
手腕是另一个新颖的设计,提供了与人类手腕相似的运动范围,同时将所有电力和传感信号线路封装并引导到手和手指。
Figure AI表示,他们的目标就是让机器人能够操控任何人类手能抓住的物体。

资金雄厚,但人形机器人赛道竞争激烈

Figure AI最初摆脱「隐身」模式还是在2023年3月,推出了通用人形机器人Figure 01,希望能应用于工业制造、物流、仓储、零售等多个行业以解决全球范围内的劳动短缺问题。
根据创始人Adcock的设想,机器人们可以替人类承担不安全和不受欢迎的工作,构建一个更加自动化且高效的未来。并且他坚称,Figure AI的这项技术绝不会被武器化。
很难想象,Figure AI第一代全规模机器人的构建仅花了短短6个月的时间,不得不说,这得益于包括CTO Jerry Pratt在内的40名行业专家组成的强大团队。
作为2024年初的投资宠儿,Figure AI目前已筹集了6.75亿美元资金。
凭借雄厚的资金,联合创始人兼CEO Brett Adcock正在全速推进,目标是在未来2~5年内将自主双足机器人推向市场。
其实,今年早些时候,Figure AI就已经在南卡罗来纳州一家宝马工厂测试了。在这里,AI模型训练的数据会被收集起来。
在演示中我们可以看到,机器人完全展现出了在工业环境中运行的能力,还能学习执行基本任务。
当然,这个越来越卷的赛道中,其他竞争对手也没闲着。
Agility Robotics的Digit和Apptronik的Apollo,早就把自家机器人部署到了GXO物流公司中,执行简单任务。
马斯克家的Optimus,也很早就被「下放」到了特斯拉工厂;波士顿动力,也有意在现代设施中,给最新版Atlas进行测试。
在科幻故事中,我们早就见识过各类人形机器人,但在商业产品的推出上,它们其实一直进展缓慢。
一方面是受限于研究环境,另一方面,设计也非常昂贵。
然而,LLM和多模态AI模型的发展,改变了这一切!如果模型能快速分析实时视频和音频输入,还能以类人音频和动作进行相应,那科幻中的场景,显然不会很遥远了。
拥有Optimus的马斯克最近大胆预言,地球上有超过100亿台人形机器人的市场,这意味着未来每个人会拥有不止一台机器人。
此外,英伟达的GR00T项目也在进行时,展示了AI在指导人形机器人方面的进展。
Jim Fan发布的这个视频中,人类远程操作员可以通过佩戴Apple Vision Pro来引导机器人完成正确动作。

快速QA

由于官方并没有透露太多信息,因此外媒IEEE Spectrum找到了Figure的控制总监Michael Rose和硬件总监Vadim Chernyak,并做了一波快速的QA。

问:Figure 02有多少个部件?这些是全部吗?

答:有几百个独特的部件,总共有几千个部件。不,这不是全部。

问:Figure 02每走一步都会留下Figure标志吗?

答:如果表面足够柔软的话,是的。

问:「可更换的腿」是很难做到的吗,还是因为只需要做一条腿而更容易呢?

答:我们选择制作可更换的腿是为了便于制造。

问:电池包也是可更换的吗?

答:我们的电池是可更换的,但这不是一个快速更换的过程。

问:Figure 02膝盖后面和肘关节处那个看起来软软的东西是什么呢?

答:这些是软限位器,它们以受控的方式限制运动范围,并防止机器人夹伤。

问:你们把拇指的马达藏哪了?

答:拇指现在完全包含在手中。

问:脖子上的「皮肤」是什么?

答:这种皮肤是一种柔软的织物,即使机器人移动头部,也能保持干净无缝的外观。

问:当Figure 02的头部转动时,它的身体也会转动,手臂也会移动。这是必要的,还是只是出于美学考虑?

答:只是出于美学考虑。

问:上半身和肩膀看起来比其他人形机器人窄得多。为什么设计成这样?

答:我们认为将机器人设计成与人类相似的比例非常重要。这使我们能够完成目标使用场景,并更容易适应环境。

问:Figure 02的步态是如何设计的?

答:机器人使用模型预测控制器来确定脚步位置和维持平衡所需的力量,从而跟随预定的轨迹。

问:2.25千瓦时的电量在视频中的那些任务中能运行多长时间?

答:我们的目标是让产品运行5小时。
参考资料:
https://x.com/Figure_robot/status/1820791819023909031
https://www.therobotreport.com/figure-02-humanoid-robot-is-ready-to-get-to-work/
https://spectrum.ieee.org/figure-new-humanoid-robot
https://venturebeat.com/ai/openai-backed-startup-figure-teases-new-humanoid-robot-figure-02/

来源:新智元



深圳龙岗智能视听研究院

人工智能 | 超高清

产业创新 | 技术孵化 | 成果转化 

智能视听研究院
建设具有国际影响力、华南地区最重要的视听技术创新基地,以及国家自主视听 AVS标准的运营总部和音视频处理和分析芯片设计、生产基地。
 最新文章