NVIDIA Research 研究科学家李柏依：探索基于多模态LLM 的自动驾驶智能体 | 公开课预告

汽车 2024-10-20 19:40 北京

让自动驾驶系统适应新环境和不同地区的习惯和法规是自动驾驶领域长期面临的挑战。NVIDIA Research 团队提出的自动驾驶智能体 LLaDA 能够利用 LLM 生成适应不同环境的驾驶策略和指令，为驾驶员和自动驾驶汽车提供多语言和地区交通规则的实时指导，帮助他们更轻松地在陌生的地方导航。此外，LLaDA 还能帮助自动驾驶汽车重新规划出与当地环境更加匹配的运动轨迹，调整自动驾驶汽车的运动规划策略。相关论文成果收录于 CVPR 2024 。

然而，LLaDA 无法实现场景的自动识别，且对场景描述的质量有着较高要求。尽管 GPT-4V 能够提供这种描述，但是却不够准确。为此，NVIDIA Research 提出一个创新的自动化视频字幕生成框架 Wolf。Wolf 采用专家混合方法，利用视觉语言模型(VLMs)的互补优势，能够提升自动驾驶智能体的场景理解能力。

此外，LLaDA 通常是与用户直接交互，并主要处理文本信息。相比之下，自动驾驶系统则需要提供具体的位置和轨迹规划信息。基于这些差异，NVIDIA Research 团队专为自动驾驶领域设计出一种多模态大型语言模型（MM-LLM）TOKEN。TOKEN 通过将复杂的交通环境转化为对象级别的知识单元，增强了自动驾驶车辆在面对长尾事件时的规划能力。该模型还结合了端到端驾驶模型的优势，解决了数据稀缺和标记化效率低下的问题。相关论文收录于 CoRL 2024 。

在上述背景下，智猩猩与 NVIDIA 策划推出「智猩猩公开课 NVIDIA 自动驾驶智能体专场」，并将于10月22日以视频直播形式进行。公开课邀请到 LLaDA 论文第一作者、NVIDIA Research 自动驾驶方向研究科学家李柏依进行主讲，主题为《探索基于多模态LLM 的自动驾驶智能体》。

李柏依博士首先会重点讲解 LLaDA 如何利用 LLM 生成适应不同环境的驾驶策略和指令；之后会解读如何使用 Wolf 框架生成字幕提升智能体的场景理解能力。接下来，李柏依博士会讲解如何基于 TOKEN 分解复杂交通场景提升智能体在长尾事件的规划能力，最后会分享在自动驾驶智能体上的未来研究方向，并进行展望。

公开课信息

主题

《探索基于多模态 LLM 的自动驾驶智能体》

提纲

1、LLaDA 利用 LLM 生成适应不同环境的驾驶策略和指令

2、使用 Wolf 框架生成字幕提升智能体的场景理解能力

3、基于 TOKEN 分解复杂交通场景提升智能体在长尾事件的规划能力

4、未来研究方向与展望

主讲人

李柏依，NVIDIA Research 自动驾驶方向研究科学家

李柏依是 NVIDIA 自动驾驶汽车研究小组的一名研究科学家。博士毕业于康奈尔大学，师从Serge Belongie 教授和 Kilian Q. Weinberger 教授。她对计算机视觉、机器学习和多媒体艺术感兴趣，研究重点是多模态与数据高效的机器学习。

直播时间

北京时间10月22日上午10点

报名方式

对此次公开课感兴趣的朋友，可以扫描下方二维码添加小助手小艾进行报名。已经添加小艾的老朋友，可以给小艾私信，发送“自动驾驶智能体”即可报名。我们会为报名成功的朋友推送直播链接。

同时，本次公开课也组建了交流群，直播开始前会邀请相关朋友入群交流。

http://mp.weixin.qq.com/s?__biz=MjM5ODgxNTk4Mw==&mid=2689942300&idx=1&sn=0ce6b9ac4641c313bc03a676dd4e5dbc

车东西

未来汽车看车东西！智能汽车产业专业新媒体车东西专注智能汽车产业创新，重点关注自动驾驶、智能座舱、整车创新等；用专业视角，大众认知传播智能汽车新技术新体验。

最新文章

12万人面临降薪！大众集团动荡不断，或爆发大罢工

中国TOP3智驾供应商赴港IPO！估值超60亿，吉利是股东

Arm年度技术大会再秀肌肉，软硬件协同加速，车载AI未来已来

长城华为联手搞智驾！最贵越野车首搭，比亚迪也已投出选择票

蔚来销量创新高，但又亏了50亿！李斌剧透三款重磅新车

比亚迪30周年王传福万字演讲：从手搓电池到国产车一哥的血泪史

阿里腾讯齐聚，10位学者在列！年度生成式AI大会即将登陆上海，最新演讲嘉宾揭晓

太顶了！鸿蒙智行尊界未发先火，余承东三大招硬刚迈巴赫劳斯莱斯

报名倒计时！新思科技汽车处理器论坛将在上海举办，新思/芯擎/英飞凌的12位专家将同台演讲

极氪、领克战略整合！吉利两大品牌协同发展，1+1大于2

智界新S7广州车展首秀！余承东：正式售价有惊喜

华为智驾“攻陷”广州车展！海外豪华车也投降了

小米230天下线10万辆车！雷军学马斯克睡工厂，刷新车圈量产速度

华为带飞江淮！市值狂飙超千亿力压蔚来，鸿蒙版“劳斯莱斯”广州车展首秀

小米周销大增重回5000+！小鹏蔚来下滑，7家新造车销量走低

日产全球裁员9000人！拥抱华为自救，中国市场三年内推8款新能源车

无人出租车燃爆旧金山！日订单远超出租车，全球自动驾驶竞争进入新阶段

“大疆教父”捧出一个IPO！自动驾驶矿卡第一股，估值超90亿，百度红杉是股东

周鸿祎投的新造车也扛不住了！被曝大规模裁员，上千名员工或降薪

车东西对话芮勇：联想为什么要做车计算？

重磅！小鹏宣布入局增程，自研芯片算力超英伟达，连发5大黑科技

要裁7000人！全球最大汽车供应链巨头预警，CEO坦承难实现KPI

小米周销接近腰斩，BBA重新超越理想，车企开启新一轮销量大战

车企价格战更狠了！上汽13个品牌超百款车参战，最高狂降12万

蔚来或加入增程大军！传第三品牌配备混动系统，只在海外销售

比亚迪月销首超50万辆！11家车企创新高，李想或到手近6亿奖金

对话长城汽车CTO吴会肖：魏建军的智能化底牌

深度解析高通车规级双“王炸”芯片！挤爆性能牙膏，抢跑舱驾融合

81.49万预售！小米车皇敢和特斯拉同价卖，雷军真硬气了，十分钟入账3680万

小米提前实现月销2万辆！小鹏周销稳步增长，新势力竞争加剧

大众集团或降本300亿！销量营收双下滑，计划关闭部分德国工厂

黑芝麻智能山海工具链与全栈量产智驾应用算法部署｜在线研讨会直播预告

刚刚，全球Robotaxi第一股诞生！文远知行开盘大涨27%，市值一度超380亿

讯飞星火落地六大车企！端侧大模型年内可用，打响规模落地战

刚刚，地平线上市！开盘大涨35%市值647亿，北京跑出一家超级智驾公司

刚刚，高通连甩两颗车芯王炸！智驾座舱全面AI化，理想奔驰首批用

小米月销2万稳了！单周交车5600辆创新高，小鹏交付增长仍被用户催单

文远知行更新IPO文件！计划募资28亿，争抢国内Robotaxi第一股

38天行驶15000公里！问界横跨亚欧大陆，从车间到车展

NVIDIA Research 研究科学家李柏依：探索基于多模态LLM 的自动驾驶智能体 | 公开课预告

刚刚，小马智行正式递表IPO！累计融资86亿，估值已超600亿

余承东雷军碰头放大招！华为明年推L3自动驾驶，小米两年狂砸540亿造车

自动驾驶中将轨迹和高精地图统一的环境表达方式TOFG | 香港城市大学（东莞）助理教授张祎凡主讲预告

小米周销4600辆创新高！零跑连超特斯拉问界，新势力座次大调整

地平线10月24日上市！传阿里百度等优先认购15亿，估值超400亿

刚刚！理想100万辆新车下线，历时58个月，比特斯拉还快

月销暴跌近8成！海外三巨头同比少卖77万台，留给合资车的时间不多了

汽车座舱大模型开外挂！“智”霸车市竞争下半场

特斯拉无人出租登场！没有方向盘和踏板，50辆现场接客，马斯克四连发炸场自动驾驶圈

特斯拉Robotaxi对阵萝卜快跑：中美无人驾驶竞赛拉开序幕

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉