首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

OpenAI版终结者降临！地表最强机器人Figure 02问世，进宝马狂飙20小时

科技 2024-08-07 17:30 广东

历时18个月，地表最强人形机器人诞生了！黑色外观颜值爆表，五指灵活，号称是地球上最先进的AI硬件，还有OpenAI的模型加持推理。现在，它已经进宝马工厂打工了，干20小时都不带停的那种！

号称OpenAI二代机器人「Figure 02」，真的来了！

刚刚，Figure AI终于官宣了第二代人形机器人，完全换了一身新形象——黑色的外观，更加灵活的五指。

创始人Brett Adcock表示，「这是『地表最强』的人形机器人」！

值得一提的是，Figure 02的设计评审耗时18个月完成。

据介绍，迭代后的Figure手部具有16个自由度，能够承受与人类相当的力量。

现在的它，已经进入宝马车厂开始打工了，可以无休止地狂干20个小时。

‍

Figure 02还可以与人类直接开启「语音对话」，这背后依旧用上了OpenAI最先进的定制AI模型，通过语音-语音进行推理。

与初代类似，它拥有一个机载的视觉模型（VLM），可通过摄像头，完成视觉推理。

去年，初代机器人Figure 01，同样在OpenAI大模型的加持下，能够看、听、遵循人类指令。

不仅如此，这家明星初创背后，还得到了英伟达、奥特曼、贝佐斯等大佬的联合投资。

如今，工程和设计团队在Figure 02上完成了一次从零开始的硬件和软件重新设计。

其中，在包括人工智能、计算机视觉、电池、电子设备、传感器和执行器等关键技术上，取得了巨大的进步：

语音到语音：通过内置麦克风和扬声器连接自定义AI模型，能够与人类进行对话
摄像头：由6个内置RGB摄像头驱动的AI视觉系统
手部：第四代手部具有16个自由度和等同于人类的力量
内置VLM：使机器人摄像头能够进行快速的常识性视觉推理
电池：机器人躯干内的2.25千瓦时定制电池组提供50%以上的能量
CPU/GPU：相比上一代，机载计算和AI推理能力提高了3倍

更流线型的外观

Figure 02机器人与其前身Figure 01身高相似，但在很多方面都进行了改进。

最明显的变化是机器人的「皮肤」采用了哑光黑色外观，而不是Figure 01的铬金属饰面。

之前的机器人看起来像穿着盔甲，而Figure 02看起来像一辆现代跑车，拥有流线型的曲线和精致的外观。

另一个变化部分就是电缆。在Figure 01中，电缆被故意布置在机身外部，以支持测试夹具、更换传感器和电机，并加快维修速度。

而在Figure 02中，所有电缆都集成到了四肢中，保护它们免受环境的影响，并为长时间在生产线上工作做好准备。

Figure AI表示，新机器人的电池容量比Figure 01大50%，能够在实际部署中工作更长时间。电池已集成到人形机器人的躯干中，使其重心更接近中心线位置，使得机器人更加灵活。

Figure AI还为其定制了电机，与关节传动系统集成在一起，以优化每个关节的功率和性能。

机器人设计的一大难题，就是可靠地通过旋转关节布线。

我们可以看到，Figure 02的肩部、肘部、髋部和膝部四个主要关节组设计非常简洁，完美解决了这个难题。

准备好接收语音指令

AI模型的训练决定了机器人智能和能力的核心，因此Figure AI与OpenAI的合作可谓「如虎添翼」，能够快速测试、验证和迭代机器人的语音互动功能。

早在GPT-4o发布前，Figure AI的视频就展示了机器人如何通过语音指令与人类互动，最新发布的Figure 02在OpenAI定制模型到加持下，也可以通过麦克风和扬声器人类进行对话。

Figure AI表示，Figure 02的计算和AI推理能力提升了3倍，可以在现实世界中完全自主地执行任务。

新型号配备了六个RGB摄像头，用于感知物理世界，此外还配备了一个车载视觉语言模型，能够快速进行常识性的视觉推理。

视觉模型能够处理所有车载图像以进行感知、避障，最重要的是进行手眼协调，以便机器人能够识别并拾取面前的物体。

另外，比起Figure 01，Figure 02拥有3倍机载计算能力和AI推理能力。这使得机器人能够完全自主地执行实际的AI任务。

这里AI数据引擎会提供最新的AI模型，并直接直接在设备的GPU上运行。

操控人手能抓的物体

自成立以来，Figure AI已经在机器人手部的设计和功能上投入了大量资金。

由此得到的最新设计，不仅具有十六个自由度（DoF），而且能够承载最多25公斤（55.1 磅）的物体。

与此同时，这双「手」的外观也与人类都非常相似——有四根手指和一个拇指。

具体来说，每根手指由一个集成单元驱动，该单元包括传感器和电机。

手腕是另一个新颖的设计，提供了与人类手腕相似的运动范围，同时将所有电力和传感信号线路封装并引导到手和手指。

Figure AI表示，他们的目标就是让机器人能够操控任何人类手能抓住的物体。

资金雄厚，但人形机器人赛道竞争激烈

Figure AI最初摆脱「隐身」模式还是在2023年3月，推出了通用人形机器人Figure 01，希望能应用于工业制造、物流、仓储、零售等多个行业以解决全球范围内的劳动短缺问题。

根据创始人Adcock的设想，机器人们可以替人类承担不安全和不受欢迎的工作，构建一个更加自动化且高效的未来。并且他坚称，Figure AI的这项技术绝不会被武器化。

很难想象，Figure AI第一代全规模机器人的构建仅花了短短6个月的时间，不得不说，这得益于包括CTO Jerry Pratt在内的40名行业专家组成的强大团队。

作为2024年初的投资宠儿，Figure AI目前已筹集了6.75亿美元资金。

凭借雄厚的资金，联合创始人兼CEO Brett Adcock正在全速推进，目标是在未来2~5年内将自主双足机器人推向市场。

其实，今年早些时候，Figure AI就已经在南卡罗来纳州一家宝马工厂测试了。在这里，AI模型训练的数据会被收集起来。

在演示中我们可以看到，机器人完全展现出了在工业环境中运行的能力，还能学习执行基本任务。

当然，这个越来越卷的赛道中，其他竞争对手也没闲着。

Agility Robotics的Digit和Apptronik的Apollo，早就把自家机器人部署到了GXO物流公司中，执行简单任务。

马斯克家的Optimus，也很早就被「下放」到了特斯拉工厂；波士顿动力，也有意在现代设施中，给最新版Atlas进行测试。

在科幻故事中，我们早就见识过各类人形机器人，但在商业产品的推出上，它们其实一直进展缓慢。

一方面是受限于研究环境，另一方面，设计也非常昂贵。

然而，LLM和多模态AI模型的发展，改变了这一切！如果模型能快速分析实时视频和音频输入，还能以类人音频和动作进行相应，那科幻中的场景，显然不会很遥远了。

拥有Optimus的马斯克最近大胆预言，地球上有超过100亿台人形机器人的市场，这意味着未来每个人会拥有不止一台机器人。

此外，英伟达的GR00T项目也在进行时，展示了AI在指导人形机器人方面的进展。

Jim Fan发布的这个视频中，人类远程操作员可以通过佩戴Apple Vision Pro来引导机器人完成正确动作。

快速QA

由于官方并没有透露太多信息，因此外媒IEEE Spectrum找到了Figure的控制总监Michael Rose和硬件总监Vadim Chernyak，并做了一波快速的QA。

问：Figure 02有多少个部件？这些是全部吗？

答：有几百个独特的部件，总共有几千个部件。不，这不是全部。

问：Figure 02每走一步都会留下Figure标志吗？

答：如果表面足够柔软的话，是的。

问：「可更换的腿」是很难做到的吗，还是因为只需要做一条腿而更容易呢？

答：我们选择制作可更换的腿是为了便于制造。

问：电池包也是可更换的吗？

答：我们的电池是可更换的，但这不是一个快速更换的过程。

问：Figure 02膝盖后面和肘关节处那个看起来软软的东西是什么呢？

答：这些是软限位器，它们以受控的方式限制运动范围，并防止机器人夹伤。

问：你们把拇指的马达藏哪了？

答：拇指现在完全包含在手中。

问：脖子上的「皮肤」是什么？

答：这种皮肤是一种柔软的织物，即使机器人移动头部，也能保持干净无缝的外观。

问：当Figure 02的头部转动时，它的身体也会转动，手臂也会移动。这是必要的，还是只是出于美学考虑？

答：只是出于美学考虑。

问：上半身和肩膀看起来比其他人形机器人窄得多。为什么设计成这样？

答：我们认为将机器人设计成与人类相似的比例非常重要。这使我们能够完成目标使用场景，并更容易适应环境。

问：Figure 02的步态是如何设计的？

答：机器人使用模型预测控制器来确定脚步位置和维持平衡所需的力量，从而跟随预定的轨迹。

问：2.25千瓦时的电量在视频中的那些任务中能运行多长时间？

答：我们的目标是让产品运行5小时。

参考资料：

https://x.com/Figure_robot/status/1820791819023909031

https://www.therobotreport.com/figure-02-humanoid-robot-is-ready-to-get-to-work/

https://spectrum.ieee.org/figure-new-humanoid-robot

https://venturebeat.com/ai/openai-backed-startup-figure-teases-new-humanoid-robot-figure-02/

来源：新智元

深圳龙岗智能视听研究院

人工智能 | 超高清

产业创新 | 技术孵化 | 成果转化

http://mp.weixin.qq.com/s?__biz=MzUyMzY3NDA5Nw==&mid=2247505724&idx=1&sn=d6e760b175ae069247240675c48faf76

智能视听研究院

建设具有国际影响力、华南地区最重要的视听技术创新基地，以及国家自主视听 AVS标准的运营总部和音视频处理和分析芯片设计、生产基地。

最新文章

全球首款AI游戏诞生！无需游戏引擎，视频模型直出「我的世界」

航展附近这场无人机编队表演，竟用了钉钉AI助理的方案

当AI遇上广告，AKOOL 4000万美元营收一夜走红广告营销界

全球首个支持多主体一致性的国产视频模型诞生！视觉模型进入上下文时代

Claude三巨头回应一切！Opus3.5仍可能发布，5小时超长视频10万人围观

VP/XR/AIGC/数智人！VPS 2024上海国际虚拟制作大会亮点速递

马斯克招人策略曝光：9轮面试，底薪低于同行，只招“铁杆特斯拉人”

黄仁勋：AI算力集群会扩展到100万芯片，没有任何物理定律可以阻止

国创中心重点孵化项目：粤港澳超高清数创产业园正式开园！

用XR跨越现实与虚拟，享受《黑神话•悟空》超沉浸天命之路

苹果AI上线，ChatGPT免费用！首款M4 Mac诞生

比Flux更强大的文生图模型来了！秘诀是“集百家之长”

粤港澳超高清数创产业园暨超高清公共服务平台正式启动，诚邀您莅临参会！

Claude接管人类电脑编程，OpenAI反击，智能体大战一触即发

粤港澳超高清数创产业园：湾东智芯先锋项目，超高清视频产业应用示范新高地

Claude重磅升级，接管人类电脑12小时，已经学会摸鱼了

手机自动驾驶来了！首款国产AI智能体手机引爆端侧革命

智源发布原生多模态世界模型Emu3，仅靠预测下一个token统一图像文本视频

AVS感知无损压缩团体标准正式发布

研究院荣誉院长高文院士：AI科学家获诺奖，提醒我们重视科学大赛

超高清赋能精品创作，《2023-2024广播电视大屏收视数据报告》权威发布

Meta版Sora深夜横空出世，小扎放出16秒高清大片！92页论文曝光技术细节，Llama 3架构立功

抖音小红书卖爆1万台！Office版人形机器人也来了，破解波士顿动力商业化难题

阿里通义万相AI生视频震撼上线！更懂中国风的大模型来了

央卫视2024秋晚亮点纷呈！艺术与科技“狠活儿”的多样态融合

虚幻引擎+XR+虚拟演播室技术，带你亲临台风现场

苹果史上第一台AI手机诞生，iPhone 16屠版热搜！中文版明年登场，3nm芯片封神

老黄预言成真！Roblox官宣AI秒生3D物体模型，引爆10亿玩家游戏新世界

当视听艺术遇上AI奇缘，一起来见证AIGC赋能下的视听创作新生态

MiniMax不藏了，大秀视频/语音/文本全模态模型家族，“每天与世界交互30亿次”

讯飞版「Her」横空出世全民开放！百变人设逼真丝滑，情绪价值逆天

OpenAI家庭机器人NEO登场，动作丝滑逼近人类！穿着西装的「人」却专做家务

全国首个上手机的AI视频通话来了！《黑神话：悟空》经文也能破译

Windows、Mac只是装了个夸克，整个电脑都AI了！

5年要烧掉1000亿！中国大模型第一城，诞生了！

法国国礼纪录片已上线，使用AVS3标准进行8K转码播放

中科院院士乔红：人形机器人十大趋势展望

6年“取经”长路，国产游戏大作《黑神话：悟空》幕后分享

惊艳又抽象！巴黎奥运会闭幕式的“高光”回顾

国产AI机器人好超前…弹琴泡茶打咏春，还能撸猫？？

全球首个AI流媒体音乐App来了！中国造的

谷歌版Her抢跑！一键召唤Gemini，全球52亿终端被颠覆

4090单卡可跑，6秒直出电影级画质，智谱版Sora正式开源！

OpenAI版终结者降临！地表最强机器人Figure 02问世，进宝马狂飙20小时

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

1194个镜头的原创AI数字资产，还原百年前中国第一次报名参加奥运会的真实历史

深圳争创“五个先锋” 加快打造人工智能先锋城市

清华系Sora全球上线！注册即用不排队，重点支持动漫风，官方：角色一致性下功夫了

AI涌入巴黎奥运，颠覆观赛的中国黑科技大起底

2024年广东超高清视频显示产业全景图谱

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉