造车两茫茫,轻图摆中央,谁不希望荷包鼓囊囊?

汽车   2024-10-08 15:05   广东  
随着自动驾驶技术的飞速发展,曾经被坚守的技术路线可能被迅速推翻,在技术难度、研发资源、成本、时间、营销等多重要素的制约下,一度被扫进历史垃圾堆的技术也有可能翻身农奴把歌唱。
轻量级高精地图或定制版标精地图就是这样的技术。



这个世界是一张网,做任何决断从来都不能只沿着其中一个方向,视线和角度要尽可能地来自四面八方。
从技术演进的角度,既然已经完成了重图到轻图的转变,从轻图到无图可谓顺理成章、自然而然。
从营销的角度,重图到轻图标志着车端自动驾驶算法感知能力的重大进展,轻图到无图岂不是显得更为强悍,更加有利于宣传?
但是,从成本的角度,轻图方案或许更省钱。
人间两茫茫,利字摆中央,谁不希望自己的钱包鼓囊囊?
如果轻图方案可以让消费者更省钱地获得同级智能驾驶体验,相信很多用户的思想观念会迅速扭转。
毕竟,自己辛辛苦苦挣来的钱花起来会心疼的。
最近这段时间,乐道L60比较火,这个20-25万价格带内的水桶车肩负着不成功便要成仁的重担,被宣传为全身毫无短板。
但是,这款车乍一看有一个明显的缺陷-不仅没有使用激光雷达,而且只用了一颗Orin X,这样的系统配置怎么实现城区NOA?
在2024年下半年这个时间点上,20万+的车型不提供城区NOA功能,多多少少有点说不过去了。
且不说蔚来系车型堆了4颗Orin X+1颗激光雷达,小鹏、理想、极氪、小米这些友商们也都使用了2颗Orin X+1-2颗激光雷达。
百度搭载在极越车型上的高阶智驾方案和小鹏今年第四季度即将推出的AI鹰眼视觉方案虽然取消了激光雷达,但也要使用两颗英伟达Orin X。
从4颗Orin X+1颗激光雷达到1颗Orin X,乐道智能驾驶系统减配如此凶猛,背后必有倚仗。
蔚来方面当然黑不提,白不提,但是大家不要有质疑,乐道给出的解法大概率就是轻地图方案。
因为如果没有采用轻量级高精地图,一颗Orin X实现城区智驾就有些涉嫌虚假宣传了。



一个“钱”字,道尽天下事。轻图方案能省钱,是因为可以少用一颗英伟达Orin芯片,再深入思考一步,之所以能少用一颗芯片,是因为轻图方案能够节约车端算力资源。
当然,能够提供车端算力芯片的不只有英伟达,大疆车载新一代智能驾驶系统使用了高通的Ride芯片,依靠等价于轻量级高精地图的定制标精地图实现了城区NOA功能。
要理解轻图方案为什么可以节省车端的算力消耗,需要回到这件事情最初的原点去看一看。
在车端算力较低、自动驾驶感知算法比较落后的那个年代里,本土车企都重度依赖高精地图,是因为车辆行驶过程中需要感知到的道路结构拓扑和语义要素可以完完全全地包含在高精地图里。
怎么理解呢?
华为曾经做过相关的“科普”,智能驾驶系统要想开得好,感知层需要完成两大任务:看得懂物、看得懂路。
GOD实现“看得懂物”,指的是能够识别车辆、行人这些动态交通参与者和异形障碍物, RCR实现“看得懂路”,是指可以推理出道路结构的拓扑。
从原点再往前走一点,随着车端算力的提升和自动驾驶算法的进步,道路拓扑推理这件事的解决方案从重地图、轻感知走向了重感知、轻地图。
在感知和地图此升彼降的过程中,地图提供的语义元素越来越少,车端感知识别的语义元素越来越多。
不过,要实现车辆的自动驾驶,语义要素的总量保持不变。
红绿灯、交通标牌、动态信息标牌、车道边界、车道标志、车道行驶线、车道线、车道箭头、车道宽度、自行车道、障碍物、电线杆、人行横道、停止线、道路边界、道路参考线、路牙……
为了实现自动驾驶,该识别的元素一个都不能少。

既然车端感知可以给地图减负,反过来,轻地图当然可以提供车端感知需要消耗大量算力才能识别的语义元素。
卸载了车端感知的一部分负担,当然可以节省算力资源。



三个臭皮匠不一定能抵得上一个诸葛亮,但是一个好汉三个帮,大家互相帮帮忙,齐心协力能把泰山扛。
在过去两年里,地图的担子一点一点往车端系统的肩上放,是因为依赖高精地图的智驾方案经不起算总账。
虽说英伟达Orin X芯片的价格非常坚挺,但一颗也不过3000元,而且,随着以地平线为代表的本土自动驾驶芯片厂商的不断追赶,国外友商智驾芯片的价格迟早会慢慢下降。
而和标精地图相比,高精地图每年的使用成本多出几百元,按15年的生命周期来算,整车厂在地图上多承担的成本至少在5000元左右,几乎相当于两颗Orin X。
不过,生意生意,是生的,不是死的。地图成本的降低会改变上面的逻辑。
目前,轻量级高精地图的成本介于100-200元之间,高出标精地图100元,还是按15年计算,整车厂多负担的成本只有1500元,相当于半颗Orin。
两颗变半颗,还有没有必要在道路大模型上死磕呢?
毕竟,死磕的代价实在太高了。全无图必须解决复杂信号灯、左转等待区、道路曲率这些难以识别的道路要素带来的感知挑战。
根据目前公开的消息,小鹏汽车采用大语言模型技术来识别这类道路要素。
在小鹏汽车的端到端方案中,XNet鹰眼视觉对应人类的眼睛,通过动态XNet+静态XNet+占用网络对现实世界中的可通行空间进行3D还原,这里的静态XNet和占用网络均可以用于道路拓扑的实时在线重建。
但是,快系统形式的XNet无法实现对复杂路牌文字、潮汐车道、特殊车道的语义理解,这时必须引入具备慢思考机制的XBrain。
理想汽车目前正在开展万人公测的双系统方案,一颗Orin跑端到端系统1,一颗Orin跑视觉语言模型系统2。
它的视觉语言模型也在部分程度上承担了复杂道路要素的识别任务,比如它可以识别潮汐车道、判断公交车道的限行时间,给出合理的驾驶建议。
其实,这些道路要素的识别都可以通过轻地图的形式实现,算总账也更省钱,两个人的担子为什么非要让一个人来承担呢?
头部智驾车企之所以头也不回地推行无图方案,大概率是在为人形机器人做准备。
人形机器人的工作环境里连标精地图都不存在,更不用说轻量级高精地图了,自动驾驶算法全面无图,才能将算法平移到人形机器人里面。
小鹏和理想让用户多花半颗Orin的钱推高自家感知算法的上限,不得不说,真的很划算。


Myautotime
燃擎APP旗下深度报道栏目,林燃同学的自留地,联系邮箱1518383550@qq.com
 最新文章