SAIL观察 | 10年后,具身智能的终极形态是?

科技   科技   2024-10-22 17:01   上海  

扫码登录【云平台

观看更多WAIC 2024精彩



在科技与未来交织的前沿,特斯拉再次吸引了全球目光。


美国当地10月10日(北京时间10月11日),特斯拉产品发布会现场,马斯克亲自下场,乘坐新品Cybercab无人驾驶出租车绕场一周,为这款新车赚足了眼球。


马斯克乘坐Cybercab

随后出场的无人驾驶客货两用运输车Robovan,以及猜拳蹦迪、疯狂整活的Optimus擎天柱,更是将全场气氛推向高潮。

Optimus和观众猜拳


马斯克此前称这场发布会“将载入史册”,或成为“公司历史上最大的活动”。全球瞩目时刻,马斯克为其具身智能布局大力按下加速键,不仅展示了特斯拉在具身智能领域重注入局的成果,更引发了行业对未来具身智能终极形态的无限遐想。


具身智能,顾名思义,可以理解“具身+智能”即有实体的智能体。


根据具身智能发展报告(2024年),具身智能具有两大显著特点:


“一脑多形”即让一个智能系统适配各种形态的物理实体,如智能机器人、智能车辆等;


“一机多用”即让一个机器设备可以灵活地执行多种任务,比如从工业生产到家务助手,从灾难救援到太空探索,深入融入人类社会。


在所有场景中,机器人和自动驾驶是具身智能发展最可能率先落地、市场前景最大的两个高成长赛道。今年SAIL奖参评项目中,具身智能赛道占比12.39%,其中59.26%是机器人项目,40.74%是智能驾驶项目





机器人形态之争:人形VS非人形



英伟达CEO黄仁勋今年在一次采访中表示,未来人形机器人将变得像今天的汽车一样普遍,“100年后人形机器人将无处不在,可能成为人类历史上产量最大的机器系统。”对此马斯克隔空喊话:“它们(人形机器人)的普及程度将是汽车的10倍。”



人形机器人已然置身于聚光灯的中心,身后挤满了投资人。


根据行业媒体的不完全统计,2024年上半年全球人形机器人领域融资事件超过22起,融资金额超过70亿元。


入围今年SAIL奖TOP30的“通用人形机器人H1”,其项目主体宇树科技在春节前完成了B2轮融资,融资近10亿元人民币,且在上个月又宣布完成数亿元C轮融资,投后估值80亿元。

一个比较明显的趋势是,资金充裕的“氪金”玩家正重金下注人形机器人,他们倡导“技术驱动”,类人、能跑、能跳、取物是他们所追求的目标。他们不惜耗费大量的资金和时间,专注于研发具备高度拟人化特征和强大功能的人形机器人。他们试图打破技术的边界,让机器人能够像人类一样灵活自如地行动,完成各种复杂的人类任务


WAIC 2024 世界人工智能大会上的“十八金刚”

而相对“缺钱”的玩家则选择适配落地场景,以尽快实现商业化为目标,他们纷纷涌入非人形机器人赛道,主打“场景驱动”,专为特定任务和应用场景设计。“人形”不再是所要考虑的目标,相反,非完整人形(有手、有脚)机器人,甚至非人形的设计可能更受青睐。它们通常成本更低,研发周期更短,能够迅速响应市场需求并实现商业化。

在今年SAIL奖项目中,非人形机器人占比大大超过人形机器人且在商业、服务业、医疗等各个应用场景迎来爆发。

SAIL奖工作组整理

从提报的项目来看,他们更注重机器人在实际场景中的实用性和效率提升,专注于解决实际问题。

比如在工业领域,网易伏羲的无人装载机机器人,接收任务后,装载机器人会自动执行移动、铲料以及卸料等原子动作,全程无需人为干预;在医疗领域,瑞龙诺赋手术机器人模拟人手的灵活腕部动作,能够完成分离、暴露、剪切、缝合打结、止血等操作,在手术中为医生提供精确的支持;蚕丛移动能源机器人FlashBot则是融合了自动驾驶和能源机器人,解决新能源车充电、工业园区储能送电、应急用电等场景方需求;来自上海初创公司菲蒽蔓的庭院机器人在国外的中大型院子都有使用场景,据悉已实现量产。

2024 SAIL 非人形机器人项目典型代表

一个有趣的趋势是,人形机器人也不再沉迷于单纯的“炫技”,它们开始在智能制造、智能分拣、智能质检等场景“大展身手”,上演一出“人形机器人进厂记”。

“人形机器人第一股”优必选在今年SAIL奖中,带来的就是工业人形机器人Walker S在蔚来汽车工厂的场景应用项目,实现全球首例人形机器人在汽车工厂流水线与人类协作完成汽车装配及质量检查作业。


Walker S“上班”中





智能驾驶之问:从L4到L5还要多久?



虽然硅谷科技圈流行的看法是,具身智能的最终形态为人形,但就目前的市场发展来看,机器人尤其是人形机器人显然不是具身智能的唯一路径,智能驾驶也是具身智能的重要落地场景之一。


在今年SAIL奖智能驾驶赛道,60%是智能驾驶应用类项目,40%为技术类项目(主要为自动驾驶技术)。

根据国家标准《汽车驾驶自动化分级》,自动驾驶分为0~5级共六个等级,当下全球范围内L4级自动驾驶技术正逐渐走向现实。L4级实际上已极为接近完全无人驾驶的水准,车辆可在特定区域内实现自主驾驶,无需人工干预。比如,在一些城市的特定区域,我们已经能够看到这样的车辆在运营。


今年爆火的萝卜快跑“接活中”


在今年的SAIL奖智能驾驶应用项目中,L4级自动驾驶技术占据主导,其中包括文远知行的自动驾驶小巴、美团的自动配送车、Chitu赤兔无人物流车以及九识城配物流的无人驾驶等。


除了城市交通之外,智能驾驶应用类项目还包括矿区、山地等特种场景下的自动驾驶项目,以及来自上海船舶研究设计院的全球首艘自主航行智能游艇。

而在智能驾驶技术类项目中,以自动驾驶技术研究为主。比如今年SAIL之星、入围TOP10的项目来自于清华大学赵行团队的“视觉为中心的高级自动驾驶技术”

该项目主要解决了高级自动驾驶技术的泛化性问题,包括:感知过分依赖激光雷达和高精度地图、导航过分依赖规则、长尾问题。


以感知技术为例,自动驾驶的感知系统需要准确地知道环境的三维几何和语义信息,但过去以激光雷达为主的感知方案丢失了场景中的色彩、纹理等信息,无法实现对于场景的细致识别。


对此,赵行团队提出全球首个基于Transformer的纯视觉BEV检测模型DETR3D、全球首个以视觉为中心的多传感器前融合BEV3D物体检测模型FUTR3D、全球首个纯视觉BEV3D物体跟踪模型MUTR3D、全球首个纯视觉的物体轨迹预测模型ViP3D,为自动驾驶领域BEV技术的发展奠定了基础。

据赵行表示,该项目的研究成果已应用到理想汽车的智能辅助驾驶系统中,为国产辅助驾驶中的领先技术方案。



而对于L5级全自动驾驶,目前业界已有看法认为,特斯拉Cybercab无人驾驶出租车已经实现L5级。但在还未进行充分路测、未获得监管许可的情况下,大多数吃瓜群众对此还是保持理性,从L4到L5,不只是技术的迭代和升级,还涉及政策监管、社会伦理以及公众接受度等多方面的因素。


尽管L5级自动驾驶技术在理论上可以实现完全无人干预的驾驶,但现实中的挑战依然巨大。例如,如何确保在极端天气条件下的安全性,如何在复杂的城市道路环境中做出准确判断,这些都是需要解决的难题。

此外,法律法规的制定和更新也需要跟上技术的发展步伐,以确保自动驾驶汽车的安全运行。甚至L5级自动驾驶可能会引发一系列伦理问题。例如,在面临不可避免的事故时,车辆应该如何做出决策?是优先保护乘客还是行人?这些决策可能会因不同的文化、价值观和道德标准而有所不同。




在这个充满创新与竞争的时代,未来究竟属于哪一种路线?具身智能的终极形态又是什么?欢迎在评论区留下你的观点。


关于SAIL奖


卓越人工智能引领者(SAIL)奖是世界人工智能大会的最高奖项荣誉,自 2018年创办以来,坚持“追求卓越、引领未来”的理念,发掘全球领先的具有高度认可和美誉、并提升人类福祉的人工智能项目,旨在激励技术突破、应用创新和治理探索,引领智能变革。


2025 SAIL 申报或推荐


傅老师 18616964005

sail@worldaic.com.cn






点击阅读原文观看WAIC 2024精彩

世界人工智能大会
聚焦人工智能行业前沿,跟踪世界人工智能大会信息
 最新文章