本期为TechBeat人工智能社区第630期线上Talk。
北京时间10月17日(周四)20:00,香港科技大学博士生高深远的Talk将准时在TechBeat人工智能社区开播!他与大家分享的主题是: “构建通用可泛化的自动驾驶世界模型”,届时他将介绍GenAD和Vista系列工作,为构建开放场景中通用可泛化的自动驾驶世界模型提供了一条可行的技术路线。相关工作已入选CVPR 2024和NeurIPS 2024。 长按识别二维码,一键预约TALK!
近期,世界模型在具身智能的多个子领域都得到了广泛的关注。世界模型是真实世界的模拟,可以预测不同控制指令对应的未来状态,并反馈给智能体的训练和决策过程。作为通往L5自动驾驶的关键技术之一,世界模型也在自动驾驶领域也受到了广泛的关注。本次分享将着重介绍GenAD和Vista系列工作,为构建开放场景中通用可泛化的自动驾驶世界模型提供了一条可行的技术路线。2. 动机 - 现有自动驾驶世界模型概览及其局限性
3. 解决方案 - OpenDV大规模自动驾驶数据集、Vista世界模型技术细节
4. 效果展示 - 视频生成评测、可视化对比分析
5. 总结 - 现存挑战和未来工作展望
Talk·预习资料
▼
论文链接:
https://arxiv.org/abs/2403.09630
项目链接:
https://github.com/OpenDriveLab/DriveAGI
论文链接:
https://arxiv.org/abs/2405.17398
项目链接:
https://github.com/OpenDriveLab/Vista
Demo链接:
https://vista-demo.github.io
Talk·提问交流
▼
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!高深远,香港科技大学在读博士生。目前研究兴趣主要围绕具身智能中世界模型的构建及应用。曾在CVPR、NeurIPS、ECCV等会议上以第一作者身份发表多篇工作,并担任TPAMI、ICLR、NeurIPS、CVPR等期刊会议的审稿人。个人主页:
https://www.techbeat.net/grzytrkj?id=14834
如果你也想成为讲者
▼
单人Talk | 团队专场 | 录播or直播 | 闭门交流
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区