经过多年的探索和实践,经过一次又一次的复盘,在Transformer大模型和车端算力的双重打击之下,鲜度不够、使用成本高的高精地图终于走向了穷途末路。
在摆脱对高精地图依赖的过程中,介于导航地图和高精地图之间的车道级导航地图/轻量级高精地图一度成了大家共同认可的破局方案。不过,历史的车轮滚滚向前,随着自动驾驶技术路线向端到端范式转变,头部智驾车企或方案供应商在智驾模型的实时感知能力上取得了飞速的进展,于是,头部厂商们开始逐渐抛弃轻地图方案,转而追求技术上更加硬核、营销上更容易加分的全面无图方案了。
自此,国内的智能驾驶赛道再次分化出了两个阵营,一个是坚持使用轻量级高精地图的传统车企,一个是追求全面无图的新势力。
笔者曾经对比过重图和轻图方案,撰文阐述过轻量级高精地图的概念以及它是如何生产的,篇幅有限,当时并没有再接再厉地讲述轻图方案和真无图方案。
借着头部新势力车企和传统车企在全面无图/真无图和轻地图方案上的分化,本文谈一谈真无图和轻图的概念,以及车企选择地图时的出发点。
重图轻图无图 不要傻傻分不清楚
为了避免大家对重图、轻图、无图傻傻分不清楚,本文同时选择技术和营销两个角度对这三种图进行阐述。
“重图”指的是“重地图,轻感知”,将实现城区NOA的希望寄托在高精地图的身上。重图方案对高精地图的需求体现在时间、空间和丰富度三个层面,时间上要求鲜度足够高,空间上要求具有足够的覆盖面,丰富度上要求提供足够丰富且精度比较高的道路要素或特征。
天可怜见,如此的高标准、严要求,图商们纵使挑灯夜战,最终也只能是“嫔妾做不到啊”。
全国都能开的希望显然无法寄托在无法覆盖全国城区道路的高精地图身上,于是乎,轻量级高精地图和“重感知,轻地图”的方案闪亮登场。
图片来源:北汽研究院
在轻图方案里,感知困难且很少变化的语义要素诉诸云端,感知简单或变化较快的语义要素的感知在车端实现,就像哪里不会点哪里的步步高点读机一样,哪里存在感知困难,哪里就用地图元素来补,确实是一种非常自然而然的解决方案。
图片来源:吉利
在自动驾驶的营销还没有陷入癫狂的那段日子里,最初其实并不存在“无图”的说法,大家都温良恭俭让地把这种方案称作“轻图”。但是,正如那句“本土车企都是自动驾驶阵营第一梯队”的调侃里揭示的营销大乱战一样,如果连长城、小米之类的企业都在宣传“全国都能开”,小鹏不提“全国都好开”、理想不提“全球都能开”,就无法彰显与友商的差距了。同样,在友商们都在提“轻图”的情况下,不喊出“真无图”或“全无图”这种更加吊炸天的说法,就不足以体现自家方案对地图的使用更加轻量化的优势。
全无图也并非全然只是一种营销口号。不同厂家在自动驾驶系统的感知能力上确实存在差距,即便都采用轻量级高精地图,它们对地图的依赖程度也必然不同。头部企业提出真无图或全无图的说法,大概率就是为了让消费者了解到不同的轻图方案在地图使用程度上的差异。
图片来源:小鹏汽车
从技术的角度来看,真无图/全面无图指的是不仅不使用高精地图,也不使用轻量级高精地图,只使用标准导航地图。从理论上来看,真无图真的可以实现。
首先,车端算力的提升、BEV+OCC算法的进步、数据闭环的迭代大大提高了车端的实时感知能力,在端到端范式以及诸多小模型重构为大模型的推动下,车端智驾模型有希望攻克路口拓扑关系、车道连接关系、道路曲率这些特别难以克服的感知挑战。
其次,在大模型的加持下,标准导航地图的生产成本得到了大幅度下降,图商们可以在传统的SD地图上增加更多与自动驾驶密切相关的语义要素。
一方面,智驾方案对地图的依赖度继续降低,另一方面,升级版SD地图提供更多的语义要素信息,真无图方案真的有可能脱胎于车端感知能力升级和SD地图语义要素增加的双向奔赴之下。
真无图很强悍,轻地图更省钱
无论是真无图方案还是轻地图方案,都十分确定不再使用语义要素那么丰富的高精地图,不过,使用多少来自地图的信息进行道路拓扑结构的感知,使用多少车端算力进行实时感知,这之间是一种微妙的平衡。车企们在进行相关选择时,大致考虑的是技术先进性和成本两个维度,在技术先进性的视角下,真无图很强悍,在成本的视角下,轻地图更省钱。
轻地图方案之所以省钱,是因为使用轻量级的高精地图可以降低对车端自动驾驶芯片算力的需求。在全面无图化的情况下,依靠车道网络/道路模型进行实时在线建图,准确地再现道路拓扑是自动驾驶感知系统必须克服的一项挑战。
不管是国内车企的N段式端到端方案还是特斯拉的一段式端到端方案,如果要最终兑现全面无图化,车端芯片必然要将大量的计算资源用在感知上面,尤其在道路标准不统一、信号灯标准不统一的国内,真无图方案要在感知层面解决的挑战太大了。
小鹏汽车在23年的CVPR会议上就含嗔带怨地吐槽过广袤的中国大地上形形色色的交通信号灯、随性魔性且任性的左转等待区交通标识。
图片来源:小鹏汽车
体会到车端实时感知艰难的不只是小鹏汽车,同样是在2023年的CVPR会议上,特斯拉自动驾驶负责人提到了车道预测的困难。
图片来源:特斯拉
基于判别式AI的BEV和OCC无法应对这些魔幻的感知场景,必须依靠具备强大语义理解能力的生成式AI模型才能收敛这些感知长尾。在用于车端自动驾驶的生成式AI模型方面,小鹏和理想展开了有益的探索。小鹏使用XBrain进行潮汐车道、公交车道、路牌文字的理解,理想汽车在双系统方案中通过系统2-视觉语言模型-识别潮汐车道、公交限行。
图片来源:理想汽车
小鹏的XBrain和理想AD的系统2表现确实有点惊艳,但是,这种方式的显著缺点就是过于消耗车端的算力资源。
小鹏汽车没有披露XBrain到底消耗多少车端算力,但是,追求全面无图化的小鹏汽车公开表态过,没有两颗英伟达Orin X做不了城区智驾,而且,理想汽车在智驾系统发布会上表示,单独拿出来一颗英伟达Orin X运行系统2。而上汽、比亚迪、长城这些坚持轻图方案的传统车企,其城区智驾方案只使用了单颗Orin。
写在最后
理论上来说,来自轻量级高精地图的先验信息一来可以辅助车端感知,提供感知冗余,加速当前轰轰烈烈的城区NOA开城运动,二来可以降低车端自动驾驶系统的成本,一直处于盈利状态的传统车企虽然没有生存危机,但是,经历过经济周期的它们更加注重成本和盈利,这或许是它们选择轻图方案的“第一性原理”。
头部新势力车企一来更加注重便于市值管理的技术先进性,二来可以通过追求全面无图提前探索可同时用于人形机器人的感知基础大模型,倒也有其正当的商业逻辑。