首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
具身智能需要什么?一场学术年会的讨论给出了一些思考
科技
2025-01-02 18:01
北京
具身智能最缺的,可能是一个「干活」的场景。
作者 | Li Yuan
编辑
| 郑玄
最近几个月,中国机器人的进展引起了全世界的关注。
先是 11 月的珠海航展,无人机、无人车、机器狼引起了全球「极客」的讨论,就连马斯克都忍不住转发无人机蜂群表演并评论载人装备已经过时;最近几天,他又点赞了宇树科技新发布的 B2-W 机器狗,火遍全网的视频中,这只中国机器狗各种体操动作、上下坡飞跃不在话下,人们纷纷惊叹这家成立刚满八年的中国公司已经超越了波士顿动力。
从「靠开源吃饭」到「遥遥领先」,技术的不断迭代,让市场有了态度鲜明的转变,这似乎也让我们窥视到了中国机器人赛道弯道超车的可能。
不过,在最近在参加一些专业活动和业界学界进行交流时,笔者总能听到一些新的共识:机器人的未来,技术决定产业的下限,「场景+需求」是未来的上限。
01
一场挑战赛看到未来人的期待:
极限犹可突破,至真亦不可止
上周五,美团机器人研究院在深圳举办了学术年会。
会上,一个细节让笔者印象深刻:一支叫做「参与就很棒」的队伍获得了一项专业奖。颁奖嘉宾调侃道:「队伍的名字还是要好好起,说不定获奖了就要『社死』。」不过,这个名字或许比在场的许多其他队伍的名字,更贴近比赛的本质。
低空经济是当前机器人应用的重要领域之一,也是国家重点发展的领域,潜力毋庸置疑。对于无人机的学术研究,尤其是对于有想法的在校生而言,能够在落地场景验证想法十分重要,但多数的现实是技术找不到场景去验证。
通过美团的低空经济智能飞行管理挑战赛,学生们获得了难得将想法在大范围场景验证的尝试机会——大赛提供美团研发的仿真环境,可模拟多架无人机在城市及无人机机场环境中同步运行。
模拟的基础,同时也是这家公司搞挑战赛的底气,就是近年来的海量投入和应用:比如无人机应用,一个典型的场景来自「低空之城」深圳:今年在深圳,官方统计数据是 1-11 月市内低空无人机载货飞行 62.6 万架次,同期美团无人机的数字是送了近 20 万订单,飞行架次接近 40 万架次。不难计算,在深圳的天空,每 3 次送货飞行,大约会有 2 次需要美团无人机完成,这家公司的飞行总量是其他公司总和的两倍。
订单背后意味着数据,在数据获取难度远超其他的当下,吸引力不言自明:一场挑战赛,其实是一次真正的「参与」就很棒的机会。
此次低空经济挑战赛议程设置,也十分有趣。整个比赛分成性能赛和创意赛两大部分:性能赛中参赛队面对确定地图环境下的配送场景,物流订单需求会在地图上随机产生。选手开发并提交规划算法,高效、安全完成机场地面调度、起降、城市配送任务,并避免碰撞等极端情况。创意赛则鼓励参赛者设计创新型无人机应用及飞行管理方案,激发技术在前沿场景中的潜力。
王健丞所在的 nROS 团队是性能赛的获胜冠军。
为了获得性能赛的胜利,nROS 团队设计出了一张「蒙娜丽莎」拓扑图。
「我们选用了拓扑图作为我们的高效的地图表征方式,并添加了许多功能节点作为交通管理的模块。通过周期推演来计算出了最优的拓扑地图的降落点的位置。」王健丞介绍道。「为了获得更高的分数,我们最后的送餐航线是选择最短路径,而返航航线选择的则是较为安全的航线。」
图片来源:网络
在一次次的算法优化中,nROS 团队学到了在课本上学不到的许多知识:例如,他们发现无人机进出工作台时,如果路线垂直,协同作业的 AGV 小车会延迟约 4 秒才能进入工作台。基于这一观察,他们调整了装货方式,提高了效率。
「当我们拿到 1 万分的时候,我们曾以为这就不错了;后来拿到 13,000 分,我们觉得这可能是极限;再到 15,000 分时,我们几乎不敢想还能再往前走
。但最终,我们没有停下脚步,突破了 17,000 分。」
王健丞认为这是他们队训「极限犹可突破,至真亦不可止」最好的诠释。
创意赛的表现同样精彩,SkyMinds 天马行空队
凭借一套面向全流程无人配送场景的系统设计夺冠。
在无人机配送的最后 100 米的难点配送环节,SkyMinds 天马行空队使用了团队自己的双臂机器人,使用视觉传感的方法自主导航到用户的指定地点,使用端到端模仿学习的算法实现复杂场景的打包操作,并对弱光环境进行了优化。这种成熟的方案令人难以相信是由在校生完成的。
「你们为什么不把线上系统多开三个月?」比赛结束后,这几乎成为参赛者们的统一呼声。3 个月的时间让他们意犹未尽,许多团队希望能够有更多机会深入优化和测试自己的方案,庞大的真实场景需求,第一次让技术从生活中来,到生活中去。
为了留住人才,美团机器人研究院自然响应呼声,从明年的比赛开始,系统开放时间延长至 6 个月。同时,表现优异的队伍还将获得参与线下实际飞行操演的机会,进一步检验他们的技术在真实场景中的表现。
02
具身智能,
真正缺的是产业化的场景
当然,如果说年轻人的挑战赛,比拼的是潜力和想象力,那会上「老炮」们的讨论,可能关乎的是当下探索者们发展路径的选择。
毋庸讳言,2024 年,机器人领域细分出的具身智能,已经成为当前科技领域的一个大热词。无论是从学术的快速发展,到产业的融资落地,具身智能都开始表现出极大的潜力。
会上,银河通用创始人王鹤、星海图首席科学家赵行、清华大学交叉信息研究院助理教授吴翼等正在学术和产业交叉领域进行探索的前沿专家,进行了观点的碰撞。
在一年的产业狂奔后,被问到机器人行业目前最大的卡点是什么,各位的答案出乎意料地一致:不是机器人本体,不是智能算法,而是商业落地,是需求和场景。
正如前文所述,商业落地会带来真实世界的数据。在人工智能的赛道上,有真实世界的数据,才能让算法更好地迭代,获得进一步的智能。
王鹤用了一个很好的对比:「自动驾驶和具身智能在技术上很接近,但是在商业上,则完全不同。自动驾驶是一个典型的热启动。你把车卖出去以后,有用户替你开。每一个能卖出去车的车企,后续都能获得海量数据,进一步优化自动驾驶算法。机器人,则完全不同。一个机器人,如果开头不够有能力,一开始就没办法卖出去,卖出去了因为能力不足,也不会有多少真实场景的数据回传,那数据和算法的相互驱动能力就会大大降低,闭环也无法建立。」
图片来源:网络
如何解决,恐怕要产业和学术界一起努力。
对于学术界而言,实现商业化本身,可能有两点比较重要:首先是让机器人先达到一定的可用能力。银河通用目前正在聚焦于使用合成数据,先让机器人获得一定的基础抓取能力,再进入产业界。星海图则正在聚焦少样本的预训练——做更大规模的预训练,让机器人在学习新任务的时候通过三五个样例,就能获取新的技能。
第二点,是安全问题。让机器人部署到人类环境中,与人类共同进步而不产生危害,也是商业化的一个关键重点。
「在装修房子的时候,我们现在都会说给洗碗机留一个空间。什么时候,我们意识到这个地方需要有个电源留给机器人,大家愿意为它留一个改造的空间,人机共生的时代可能才会真正开始。」星海图首席科学家赵行表示。
产业界的推动也同样重要。什么样的场景,才是机器人能快速落地的场景?
或许是更简单的场景。吴翼举了一个我们日常生活中常见的场景——在家找不到东西,给妈妈打电话确认物品位置,最后找到。「这是一个大家看起来稀松平常的事,但是如果机器人要完成的话,首先需要理解比如『东西在白色箱子后面』这个语言在现实世界中意味着什么。同时它要能够做到视觉上的空间理解,做到现实中的定位和导航。涉及到人机交互还需要记忆、交互能力、理解、推理,需要自主地知道问出怎样的问题。」
图片来源:网络
这并不简单。
王鹤则直接指出:「现在不用看需求,直接看什么能做就可以。我认为最快能落地的,就是做粗活。」所谓的做粗活,就是指在环境中导航、移动,抓取、放置。
「这些粗活的场景本身对成功率要求不会极为苛刻——比如自动驾驶目前仍然不能很好地应用,其中一个重要问题是,自动驾驶失败了,是会撞死人的,但简单的粗活,则不存在这样的问题。」王鹤表示。
这样的场景,刚好在我们的日常生活中就很常见。
「比如很多 24 小时业态的前置仓零售店,需求很大。它的活又很简单,就是把一个东西从架子上抓下来,然后放在桌子上给快递员。」王鹤表示,「这就是一个很好的场景。」
王鹤表示,银河通用已经与一些平台达成合作,明年将在更多场景中,启动机器人的规模化场景落地。「具身智能现在的状态就像 2013 年的新能源汽车。我们的目标是,在五年内实现 1 万台人形机器人能够自主在实际场景中工作。」
03
在学术与场景的双向反哺中,
平台要做桥梁
一场年会,笔者看到了学术获益于场景的同时,也在反哺场景。这或许就是机器人未来发展的路径指引。
作为大会的东道主,每年办一届学术年会,美团或许也是看到了相同的未来。
据美团机器人研究院秘书长刘硕介绍,美团有很多产业界的同行,也有很多在学术界的合作伙伴。之所以成立机器人研究院,正是希望成为产业界和学术界的桥梁,为机器人科技创新与落地应用提供土壤。
「这其中有两个意义。第一是产业界有应用场景,可以牵引学术界的定向研发;第二在于通过给学术界提供经费、场景、工程资源,让学术成果尽快形成产业转化。」她说。
她还分享了一个来自美团的感悟:美团无人机目前运送了超过 40 万单的真实客户订单,飞行架次接近 100 万次,已经达到了非常密集的高频次的飞行。
这样的成绩背后,一部分原因就是「产学研用」合作,推动无人机自主避障的发展。「百万架次的时候,挑战场景其实在平常想都想不到的,我们见过风筝、气球,高楼擦窗的安全绳,我们甚至见过很多好奇的游客的消费无人机,试图在拍摄我们自己的无人机等等。如何发现并解决这些边缘案例?」
除了收集真实场景的数据,美团机器人研究院也在不断发展仿真技术,并和学术界合作解决问题。
例如,在和清华大学深圳国际研究生院的丁文伯团队的合作中,双方就使用了一个 Multi-Game Decision Transformer 的架构,用人工智能找到无人机飞行的边缘案例。
「以我们现在的技术能力,一个专业测试团队,需要用好几个月的时间,才能找到难倒我们规划调度系统的两个难题。但通过人工智能,找边缘案例的速度提升了九倍。」刘硕介绍道,「这让我们能更快地解决一些边缘案例和疑难场景,更好地保障无人机的飞行。」
在自主智能的提升下,美团无人机的技术,今年也在国际上得到了认可,首次在海外拿到了第一张在城市场景的无人机送货的许可证。
图片来源:网络
以管窥豹,在具身智能赛道,需求与场景并存的美团,同样有希望成为学术和场景双向反哺的桥梁。
毕竟在很多与会者看来,过往观念里,机器人的潜力更多被放在工业领域中,视作工厂自动化的主力军。但在人口红利逐渐消失的背景下,人们开始希望通过它从事那些危险、重复、高强度的工作。而随着具身智能技术的进展,新的场景会更多出现在美团擅长的本地生活、即时配送等领域中。这些有趣有价值的应用,会让大家的生活品质得到改善和提升,成为真实的市场需求。
「现在的市场,总在担心机器人的安全和价格,担心人类失去工作,担心机器人的伦理道德……但有一天大家在生活当中真的用到了好产品、好服务,可能剩下的只会是一句,『真香』。」一位参会者道出了别样的「真相」。
*头图来
源:视觉中国
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
你期待机器人在哪些场景里落地?
热点视频
马斯克:人类或将进入黑暗时代,要确保文明的种子。
点赞关注
极客公园视频号
,
观看更多精彩视频
更多阅读
极客公园
用极客视角,追踪你最不可错过的科技圈。欢迎同步关注极客公园视频号👇
最新文章
用 GPT 总结 2024 年的人,全破防了
微信测试「语音信息倍速播放」; BBC 怒斥苹果 AI 通知摘要频频出错;谷歌 AI 科学家自杀离世|极客早知道
造车的理想要「All in AI」,这事靠谱吗?
特斯拉 2024 年交付数据公布,年销量首次下滑;蜜雪冰城递表港交所;诺奖得主支持马斯克起诉 OpenAI | 极客早知道
具身智能需要什么?一场学术年会的讨论给出了一些思考
每一个孤独的坚持,都是改变世界的能量
特朗普酒店外一辆Cybertruck爆炸,马斯克回应;鱿鱼游戏2首周观看打破奈飞记录;百度25周年李彦宏发全员信 | 极客早知道
张鹏对谈汪华、袁进辉、胡修涵:2025 年,匍匐也要前进,活下来最重要
雷军:小米汽车新年目标 30 万台;Altman 确定 GPT 将有「成人模式」;字节否认砸 70 亿美元买芯片 | 极客早知道
真没想到,AI 夸得我有点不好意思,还能陪我过日子?
大模型时代,没有超级应用,只有超级智能,为什么?
AI Agent 创新突破!从「耍嘴皮」到「看得见」,还能「动手干」
美团外卖推防疲劳,12小时强制下线;苹果 iOS 18 视觉增强默认启用,隐私堪忧;小米宠物员工狗走失,公司急寻 | 极客早知道
我们试了市面上八款视频模型,发现 Sora 确实不太行了
瞄准家庭具身,云鲸开始提速
雷军 31 日进行「跨年直播」;华为:能活下来因为国民热情;「拳皇」30 周年,SNK 成立独立 KOF 工作室 | 极客早知道
本想偷懒才用的 AI,没想到 AI 摸起鱼比我还厉害?!
小米汽车交付超 13 万,雷军:创造奇迹;华为问界 M8 实车曝光;传 iPhone17 标准版终于支持高刷|极客早知道
重塑人机边界,Soul 正在迈向 AI 社交的未来?
OpenAI 盈利实体变「盈利公司」;智能手表表带含「永久化学物质」;美公司推「神药」延长狗狗一年寿命 | 极客早知道
亲测!豆包+PC,解锁生产力「神器」
脑机接口和 AI,一个硬币的两面
这个「能飞」的机器人,悄悄走进人们的生活
传小米搭 GPU 万卡集群,大力投入 AI;董明珠:年轻人躺平,因为家长太溺爱;微软、OpenAI 再起争执 | 极客早知道
李继刚:当我们说「提示词」时,到底在说什么?
李想:有了冰箱彩电大沙发,还想用 AI 造「硅基家人」
2024 年末决战,AI 视频「卷麻了」
李想:理想汽车大模型进入手机市场;吴柳芳被禁言,抖音:根据法规要求;三星 XR 头显产品或叫「Switch」 | 极客早知道
怒喵李楠的「百镜大战」大实话:别骗自己有技术,抓紧兑现风口
AI 是如何利用语言技巧「操纵」人类的?
AI 的「i」,原来是斜杠青年的「金箍棒」!
OpenAI 或考虑开发人形机器人;小米辟谣「年底大裁员」:缺乏基本常识;宁德时代发「智能底盘」,阿维塔首搭|极客早知道
相机公司瞄上了线上会议这块大蛋糕
2025 年,AI Agent 将如何变革?
传播学者对谈科普博主:算法造不了网红
传罗永浩转战 AI 硬件,产品「不便宜」;滴滴正式发文治理「冬天臭车」;Meta AI 眼镜将加屏幕 | 极客早知道
从 OpenAI 12 天发布会里,我们看到了行业的四个关键问题
影石刘靖康:在「AI 硬件」的战场上,大 Boss 是手机厂商,不是互联网公司
传苹果研发「智能门铃」;美总统赞成 TikTok 继续运营;汤姆猫推 AI 陪伴机器人,1499 元 | 极客早知道
AI,如何真正助力商家?
短剧出海的秘密:ReeIShort 如何让外国人爱上「霸总」?
传 GPT-5 开发不顺;蔚来第三品牌新车首秀,预售价 14.88 万元;广电总局要求加强微短剧片名审核 | 极客早知道
看看产业里 AI 应用的进展吧,它治愈了我的 AI 价值焦虑
未来十年,谁将主宰科技巅峰?
OpenAI 发布高级推理模型 o3;传雷军亲自重金招募大模型领军人才非事实;小米 YU7 无伪装实车曝光 | 极客早知道
冲刺年底 KPI,车企的心眼子都用在「免息」上了
张一鸣,终于来了
内容创作的「Windows 时代」来了
999 元的 AI 眼镜来了,闪极拉开「百镜大战」序幕
苹果就 AI 与腾讯字节谈判;百度、吉利垫付,极越员工获「N+1」赔偿;余承东称智界要打造年轻人 DreamCar|极客早知道
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉