人形机器人与AI大模型之Robot+AI的Transformer之旅

汽车 2024-11-08 17:24 北京

从Transformer到多模态大模型的演进与应用。Transformer不仅在语言处理上广泛应用，还扩展至图像、视频、音频等多模态任务。诸如StableDiffusion、VideoPoet和MusicLM等模型展现了其强大的生成能力，推动了多模态大模型（MLLM）的发展。

机器人现实世界至数据化的突破：RT-2、RoboCat与MimicGen。RT-2通过大规模的视觉-语言预训练，将视觉识别与低级机器人控制结合，实现了机器人在复杂任务和未见环境中的强大泛化能力。RoboCat则基于Gato模型，展示了多任务和多具身平台上的自我迭代学习能力，能够快速适应新任务并生成跨任务策略。英伟达的MimicGen自动生成大量模仿学习数据，有效减少了人工干预，提升了机器人学习的效率。

特斯拉FSD，端到端算法成为主流，数据为关键。2020年FSD引入Transformer模型，走向了数据驱动的模型范式，2024年初FSD V12完全采用神经网络进行车辆控制，从机器视觉到驱动决策都将由神经网络进行控制。FSDV12能够模拟人类驾驶决策，成为自动驾驶领域全新发展路径。

英伟达Robocasa：具体智能关键节点，首次论证real-sim-real。通过升级模拟平台并构建模拟框架，基于厨房场景和原子任务、复合任务、真实世界三个场景收集行为数据集并进行结果评估。说明模拟器的丰富多样性以及视觉和物理真实性显著改善了模拟效果，实验结果首次论证了real-sim-real可行。

后续演绎：在机器人real-sim-real可行，证明存在scaling law的基础上，持续推荐可执行任务的泛化能力，迈向真正的AGI智能化：1）李飞飞Rekep:一种针对机器人操作任务的新型空间和时间约束表示方法，提供了一种三任务闭环的解决方案。通过关键点约束解构机器人行为，将操作行为分为多阶段，并构建子目标约束和路径约束，基于此提出一种三任务闭环的解决方案。同时，融入大型视觉模型和视觉-语言模型，利用VLM和GPT-4o生成Rekep约束，避免了手动指定Rekep的需要。2）1x世界模型：首证扩展定律，能通过大量学习理解周围环境。通过大量的真实数据学习和模拟，机器人能够预测复杂的物体互动，理解周围环境，并灵活应对日常任务。1x的进展首次在机器人上证明了扩展法则。3）GR-2的高效动作预测与泛化能力。由字节跳动研究团队开发的第二代机器人大模型，凭借大规模视频预训练和多模态学习技术，展示了卓越的泛化能力与多任务通用性。4）数字表亲：机器人训练法优化，以更低的成本获取更好的泛化能力。在保留数字孪生优势的基础上，数字表亲表现出了更强的适应能力和鲁棒性，成功实现了从模拟到现实的零样本迁移，为机器人学习在复杂、多变的真实环境中的应用开辟了新的可能性。

点击文后阅读原文，可获得下载资料的方法。

联系方式：微信号18515441838

http://mp.weixin.qq.com/s?__biz=MzI5NzExMTY0Mg==&mid=2650816323&idx=3&sn=6c795a193b4b336ac4be409df1e7af0c

智能交通技术

关注智能交通、TOCC、车路协同、MAAS、综合交通规划、交通安全改善等领域理论和技术的发展。交流大数据、云边端计算、AI、区块链等技术的应用经验。推广智能交通技术在交通管理、交通运输监管、交通规划等部门中的应用。

最新文章

2024世界互联网大会开幕，蘑菇车联建成桐乡首个全息实时数字孪生路口

智慧高新一期EPC总承包项目——智能交通设计方案

高德地图：2024年Q3中国主要城市交通分析报告

车载以太网在智能座舱中的应用与优化

面向未来网络的数字孪生城市场景应用白皮书2024

重磅！上汽、腾讯、蘑菇车联、奥迪、蔚来等企业齐推《车路云一体化实践应用白皮书》

FHWA：增强安全性的主动式交通基础设施维护指南（英）2024

安永：无锡人工智能融入产业发展评估报告2024

路口路段优化提升改造步行式街区的探索与实践

人形机器人武汉城市应用场景研究报告（2024年）

煤炭工业协会：露天煤矿无人驾驶技术应用发展报告

佛罗里达交通局：道路环境分类指南（英）2024

人工智能交通应用主题汇总（2024-11-18更新）

车路云一体化商业化模式和路径论证研究报告 2024

激光雷达芯片进入发展快车道

智慧港航信息化解决方案

智慧城市主题汇总（2024-11-17更新）

2024中国汽车工程学会年会暨展览会超30家智车解决方案企业

欧盟AI法案解读：要求和实践指南2024

低空经济发展研究报告（2024）

新能源飞行器发展白皮书（2024）

杭州：实施“三大改革” 打造现代化车管所

2024年第四季度中国经济观察报告

河北省普通公路运营安全隐患排查治理指南

从挂挡到驱动，电动汽车是怎么跑起来的？

政务服务一网通办平台建设方案

智慧航空主题汇总（2024-11-14更新）

汽车工程学会：智能底盘操作系统白皮书2024

我国交通安全宣传教育场所发展演进阶段及特征研究

2024百工百业AI落地行动指南：AI应用、挑战与先锋者的关键启示（繁）

低空产业联盟：新能源新构型低空装备安全技术体系报告（2024版）

低空产业联盟：低空智能网联体系参考架构（2024版）

数字乡村农村公路数字化管理解决方案

低空经济——物流园区的新机遇，做好准备迎接吧！

中国电信：智算产业发展研究报告（2024年）

车路云一体化商业化模式和路径论证研究报告 2024

信通院：边缘计算产业发展研究报告（2024年）

高速公路智慧工地系统建设方案

阿里云&德勤：公共云优先，打造智能时代的开放创新基础设施2024

ARTEMIS：卫星导航电离层精准监测助力北斗高精度应用

新出行时代：利用数字技术实现更公平、更高效、更有效的公共交通（英）2024

市智慧交通规划方案

出行即服务MaaS主题汇总（2024-11-11更新）

世界银行：少有人走的路——扩大积极出行以获取经济和气候效益（英）

用物流来理解OSI模型

东莞市凤岗镇停车专项规划2024

自动驾驶主题汇总（2024-11-10更新）

《深圳市综合立体交通网规划方案（2024-2035年）》政策解读

介绍一种transformer稀疏神经网络的硬件加速器算法

汽车产业AIGC技术应用白皮书

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉