首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
理想汽车直播为何公然逆行,原因是靠不住的视觉语言模型
汽车
2024-11-26 17:50
山东
业界专家一致认为,常规的端到端方案最终只能实现L3级自动驾驶,生成式AI大模型才能实现L4。
那么,大模型技术真正在车端落地,需要突破多少难关呢?
对大佬们的话做阅读理解,一定要结合他发言的上下文,否则很容易断章取义。
比方说,特斯拉前自动驾驶部门负责人Andrej Karpathy曾经说过,大模型的幻觉是特点,不是缺陷,大语言模型的工作机制就是做梦,幻觉是正常现象。
从助力科学发现的角度来看,大模型的幻觉问题的确不是缺陷。
但是,对于汽车驾驶这种高安全要求、约束边界非常明显的场景而言,幻觉问题是必须解决的一道难关。
定量来看,当下大模型的错误率和L4级自动驾驶能容忍的错误率到底有多大的差距呢?
华为在《云计算2030》中表示,L3级自动驾驶的容错率为0.1-1%,L4级自动驾驶容错率在0.0001-0.001%之间。
随着参数量的加大、训练数据规模的提升和新方法的引入,大模型的准确率一直在稳步提升。
2020年问世的GPT3错误率在40%左右,到了2022年底,GPT3.5的错误率已经下降到了20%,GPT4更是百尺竿头、更进一步,将错误率降低到了10%。
不过,饶是如此,10%和L4级自动驾驶的容错率0.0001%依然差着5个数量级。
前段时间,理想汽车的双系统方案在直播测试中公然逆行,暴露了由LLM改造而来的视觉语言模型输出错误率依然不低的现实。
理想的视觉语言模型DriveVLM基于阿里巴巴的Qwen-VL或Meta的LLaMA2-3B改造而来。
即便在它们的基础上新增训练了一些驾驶场景数据,做了RAG检索增强、AI对齐、强化学习、优化提示词等工作,准确率的提升也相当有限。
幻觉问题的解决任重而道远。
前段时间,李彦宏在百度世界2024大会上表示:过去两年AI行业的最大变化就是大模型基本消除了幻觉。
我们无从揣测李彦宏是不是出现了幻觉,但他这个观点非常值得商榷。
在绝大多数情况下,文字只不过是无关痛痒的表达,操纵钢铁巨兽的自动驾驶系统面对的却是可以直接决定他人性命,务必要慎之再慎!
有人说,人生最大的幸福就是在对的时间和环境下,和对的人一起做对的事,一旦时间变了,一切就都变了。
自动驾驶也要在对的时间、空间下,及时地做出对的决策,实时地行驶出对的轨迹。
交通场景瞬息万变,自动驾驶系统必须及时感知车辆周围环境、实时预判周围交通参与者的潜在轨迹,经过整体的统筹,即时规划出安全、舒适、高效的行驶路径。
要保证复杂车流环境下的实时性,模型的运行频率至少要在十几赫兹。
目前,理想汽车视觉语言模型的运行频率在3.3赫兹左右,只能起到辅助提醒的作用,无法参与实时的轨迹规划。
现在坊间有一个简单粗暴的观点,理想汽车如果在下一代智驾系统中将Orin升级为英伟达下一代舱驾一体芯片Thor。
NPU从254 TOPS提升到1000 TOPS。
再加上Thor对Transformer架构的原生支持,应该有望将DriveVLM的运行频率提高到十几赫兹。
这个看法相当门外汉。天上云追月,地下风吹柳,更高等级的自动驾驶对模型的参数量必然有着更高的需求。
目前,理想汽车用来实现L3级自动驾驶的视觉语言模型的参数量只有22亿参数,这种参数规模的大模型无法实现L4级自动驾驶。
可以拿特斯拉FSD的模型参数量做个对比。
2022年的AI Day上,特斯拉披露了其分模块方案FSD的参数规模为10亿(1B),进化到端到端方案之后,FSD模型的参数量必然有增无减。
特斯拉曾经表示过,从V12.4到V12.5,FSD模型参数量提高了5倍,从V12.5到志在实现L4级自动驾驶的V13,模型参数量再次提高了3倍。
做一个合理的推算,FSD当前的模型参数量恐怕得在200亿左右,比DriveVLM的22亿参数量高了整整1个数量级。
这就意味着,除非降低对自动驾驶能力等级的需求,即将量产的智能驾驶芯片标杆英伟达雷神芯片也无法解决车端运行大模型的实时性难题。
万丈高楼平地起,那是因为有地基。
进入2024年下半年,本土智驾企业纷纷开启在车端自动驾驶大模型上的实践,并非因为他们自己水平有多么强悍,而是因为头部AI企业训练出并开源了具备图像理解能力的多模态大模型。
智驾企业们在这些涵盖多个不同科目和子领域、具备通用多模态能力的视觉模型/视觉语言模型/视觉语言动作模型的基础上,再设计一些面向驾驶场景的问答,进行简单的微调训练,自家的视觉语言智驾大模型就顺利出炉了。
这些万亿美金市值的AI巨头提供了免费的午餐,也顺带着决定了基于它们改造而来的智驾视觉语言模型的性能天花板。
先说乐观的一面,这些大模型具备图文识别能力,可用于识别潮汐车道、公交车道、路牌文字,理想汽车的VLM可以结合当前时间段给出使用或驶离公交车道的建议,其能力就来自这里。
这些大模型也具备一定的场景理解能力,比如判断路面的坑洼情况,给出减速建议。
当然,如果自家的车型具备真正的魔毯能力,或许只需要适时调节空悬和CDC就可以了。
再说悲观的一面,这些面向数字世界的AI大模型并不具备真正的空间理解能力。
建立空间理解能力的关键在于可以同时输入车前、车后、左前、右前、左后、右后的多个摄像头的图像输入,站在3D视角下进行综合的判断,BEV前融合的价值就在这里。
反观视觉语言模型,虽然可以依次输入前视、后视、周视摄像头采集到的图像,但它只能像BEV出现之前的自动驾驶算法那样做后融合,直接杜绝了建立精准的空间理解能力的可能。
目前的智驾视觉语言模型只能给出车道、加减速这些中间层的建议,而无法输出最终的轨迹,本质原因就在这里,特斯拉和蔚来汽车死磕具备空间理解能力的世界模型的本质原因也在这里。
生成式AI爆发之后,业界对自动驾驶能力的进展速度一度变得非常乐观,但是,从以上分析可以看出,通过生成式AI大模型提升自动驾驶能力,这条路依然任重道远!
Myautotime
燃擎APP旗下深度报道栏目,林燃同学的自留地,联系邮箱1518383550@qq.com
最新文章
智能底盘,磨刀霍霍
像我这样的顽固的人,被比亚迪天神之眼教育到恍神
计划赶不上变化,长安、北汽“2025停燃”有点尴尬
特斯拉车型虽老,战力却依然拉爆
内卷上强度,降本上手段
大单品样板的昂科威Plus:用爆款方法论的笋,扎透情绪价值的壳
理想汽车All in AI的Why What and How
深度 | 新年第一车,售价36.38万,坦克500 Hi4-Z的后视镜里其实还没有对手
磐石底盘杀气腾腾,宁德时代:走华为的路让新势力按我路走?
雷克萨斯国产,没有特斯拉的命却得了特斯拉的病
智能底盘绝非雷军说的那么简单
奥迪 A6L:豪华 C 位的坚守与革新,续写半个世纪的传奇
中国汽车威胁论下的本田日产大合并
蔚来:萤虫之火,能否燎原?
小鹏汽车,不装了,就是要为人民造车
超越理想零跑分两步:模仿理想,干翻理想
比亚迪智驾两手抓:左手全栈自研,右手智驾平权
极越,今夜请为我哭泣!
理想ONE停止OTA的底层逻辑
哪吒汽车:张勇时代八十一难,方舟时代能否七十二变
上汽通用,杀出黎明!
理想ONE车主的万字悲鸣:科技平权最重要的,是OTA平权!
乐道产能问题,是因蔚来账期?
翻身无望,年销跌破20万辆,现代该不该学三星一走了之
为什么年轻人不买东风本田了?
端到端平权,是新势力的转型包袱,还是老法师的磨刀霍霍?
深度研判,小米SU7的自动泊车为何出现集体事故?
哪吒启示录:抱上大腿,满盘皆活
上汽大众,油腻中年
理想汽车直播为何公然逆行,原因是靠不住的视觉语言模型
为自动泊车BUG埋单,小米给新势力打了个样
各家的视觉方案,各有各的盘算
新势力自研芯片,大概是条不归路
全新魏牌蓝山,就是新势力第一端到端
《台州宣言》的站得高、看得远、抓得准:领克并入极氪上演新势力超级合体!
魏派蓝山为长城汽车高阶智驾代言的底层逻辑
字母标奥迪,是臭棋,还是大招?
在华扩产,丰田阳谋
大模型没有标准答案,世界模型才是终极方案
堆电池太Low,卷能耗才硬
一直以为高阶智驾只是高端车的灯塔,走近才发现燃烧着平权的火把
卢薛组合破局立新,上汽通用闪电反攻
增程大行其道,蔚来被架在火上烤?
新势力三匹最快黑马,就是理想问界和零跑
车企做芯片,这笔账该怎么算?
东风日产启辰:转型之后长出翅膀,狂卷价值飞得昂扬
点评吉利10月销量:均衡是主旋律,爆款已成习惯
十年饮冰,难凉热血,贾跃亭和他的FX真的来了
豪华平权看中国星,油车排面得东方曜
比亚迪智驾野心:不是高阶智驾逐渐下放,而是真正智驾平权
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉