一直以来,纯视觉技术路线和多传感器融合技术路线之争都是自动驾驶领域最为引战的话题,没有之一。
两年前,特斯拉推出占用网络之后,小鹏汽车自动驾驶部门负责人吴新宙大受震撼地表示激光雷达厂商应该转型了,两年时间过去了,激光雷达不仅没有被消灭,头部激光雷达厂商的营收反而继续录得翻番式的同比增长。
不过,危机始终存在,最近一年来,端到端范式的出现极大地提高了视觉神经网络的性能,纯视觉方案展现出了可以逼近人类老司机水平的美好前景,在这样的背景下,本土头部智驾车企小鹏、蔚来、极越纷纷推出了纯视觉高阶智驾方案,刚刚逃过一劫的激光雷达有可能再次面临生死难关吗?
端到端大幅提升纯视觉智驾系统性能
01
在2024年第三季度的财报电话会议上,马斯克表示,进入2024年以来,端到端形式的FSD性能提升了两个数量级,而且,从当前的V12.5到即将于11月份推出的V13,性能还将有5-6倍的提升。这么算下来,单看2024年,特斯拉FSD的性能提升幅度至少高达500倍。
鉴于马斯克在自动驾驶上的表态一向过于夸张,最好还是参考一些国内友商的说法。头部智驾方案商Momenta掌门人在最近的一次采访中表示,自转向端到端技术路线以来,Momenta面向量产乘用车的高阶智驾产品Mpilot的性能提升了不止10倍。
图片来源:Momenta
车企方面,头部智驾车企小鹏汽车在5月20日的AI Day上表示,将在未来18个月内将XNGP的性能提升30倍,于2025年底实现类L4级的智能驾驶体验。
尝到端到端范式甜头的还有理想汽车,在6月份的蓝皮书论坛上,理想汽车掌门人李想表示,理想汽车将在一年内实现L3,三年内实现L4,具体的数字上,在8月底的成都车展上,理想汽车对外公开了平均接管里程在端到端范式的驱动下肉眼可见的飞速变化。
自7月30日到8月26日,不到一个月的时间,理想智驾系统的平均接管程从12.21公里提升到21.8公里,一个月不到,MPI取得了近乎翻番式的增长,这种迭代速度在一年前简直是不可想象的。
图片来源:理想汽车
总之,端到端范式终于让高阶智能驾驶从理想走进现实。特斯拉、本土头部智驾车企和方案供应商的智能驾驶系统性能在一年内都取得了十几倍甚至几十倍的跳跃式增长,而且,系统性能迭代的速度肉眼可见大大加快了。
特斯拉FSD性能的突飞猛进以及特斯拉刚刚推出的无人驾驶出租车依然不搭载激光雷达的事实似乎表明,端到端纯视觉方案可以兑现通向高等级自动驾驶的美好前景。在视觉神经网络初步具备智能涌现能力且有望继续提升性能的情况下,激光雷达是不是可以退休了呢?
当然不是,因为激光雷达的核心价值在于提升行车安全,而纯视觉方案恰恰在安全上存在一定的天花板。
多传感器融合的核心价值在于行车安全
02
纯视觉和多传感器融合的争论由来已久,本文无意介入立场的争论,倒是可以转述几位大佬的看法:
在没有搭载激光雷达的乐道L60发布会后的媒体见面会上,蔚来汽车掌门人李斌表示,认为激光雷达没有用的人非蠢既坏;
刚刚推出AI鹰眼视觉方案的小鹏汽车掌门人何小鹏在发布会中表示,AI鹰眼视觉方案能够做到在99.9%的场景下性能不输于带激光雷达的XNGP MAX版本;
国内头部激光雷达厂商禾赛科技有一个类似的说法:激光雷达可以帮助应对1%的复杂场景。
图片来源:禾赛科技
我们无从得知何小鹏99.9%这个数字的背后有没有严谨的科学推算,也不用纠结从1%到0.1%到底发生了什么。直接拨开浮云遮望眼,站在第一性原理的角度,多传感器融合对比纯视觉方案的优势可以利用更大波长范围的信息。
据悉,摄像头检测的可见光的波长介于350纳米到740纳米之间,量产车用激光雷达发射和接收激光的波长介于740纳米到1550纳米之间,毫米波雷达的雷达信号波长在4毫米左右。
根据物理规律,波长越长,光的穿透能力越强,4D毫米波雷达可以处理的雷达信号的波长远超于可见光和激光雷达发射的激光,不会受限于光线的遮挡,它可以检测到前前车(位于前方车辆的前方那一辆车)的核心原理就在这里。
图片来源:华为
具体到激光雷达,激光的波长更长,穿透能力也强于可见光,不过,其核心优势不在这里,在光照鲁棒性和精确测量距离信息上。这一波端到端热潮较大地提升了视觉神经网络的能力,使其可以在一定程度上提升暗光、炫光、逆光场景下的表现,并通过海量的数据学习,掌握了从2D图像中准确估计3D深度信息的能力。
但是,这并非意味着激光雷达可以放马南山、刀枪入库了。
图片来源:小鹏汽车
在光照适应能力方面,激光雷达的工作可以完全不依赖有没有光、光照条件怎么样,而视觉神经网络无论怎样进化,还是要依赖一定的光照亮度的,在创世纪里,上帝说有光就有了光,要是说没光就没了光了呢?
在距离信息方面,由于汽车要在3D空间中驾驶,行车安全与自车与旁车距离、与障碍物之间的距离密切相关,激光雷达通过飞行时间测量到物体表面的距离,直接给出精确的距离信息,直给当然比AI估计具备天然的优势。此外,一些误导性的场景也容易使AI视觉神经网络得出错误的深度信息。
图片来源:德州仪器
其后果就是,虽然基于端到端大模型的视觉方案可以更省钱,能够基于L2的硬件实现L3+级的用户体验,但是,在1%(禾赛科技)的场景下,视觉方案无法保证行车安全。
图片来源:小鹏汽车
所以,虽然激光雷达的生存空间在能力突飞猛进的AI视觉神经网络的不断挤压下逐渐弱化,但它依然将AEB发展成了兵家必争之地。激光雷达的核心价值就在这里,保障行车安全,并提高安全的天花板。
坚守纯视觉路线的特斯拉刚刚推出的无人驾驶出租车Cybercab也没有使用激光雷达,一方面是因为马斯克可以“自研”L4等级的判断条件,另一方面则在于特斯拉没有把大幅度提高智驾安全作为自己的愿景。
如果取信马斯克的话,相较于年初的版本,特斯拉FSD V13将平均接管里程提升了至少三个数量级,但是,与行车安全密切相关的百万公里事故率只进步了20%!MPI提升1000倍,安全水平提升0.2倍,如此巨大的差距,原因就在于只使用摄像头的纯视觉方案可以极大地提升在99%的场景下的表现,却受限于光照条件、天气条件、AI神经网络的幻觉无法很好地应对那1%的复杂场景。
图片来源:特斯拉
写在最后
03
对于很多人来说,纯视觉路线的特斯拉FSD已经将安全性提高了10倍,十倍的安全性能提升足够了,生死有命,富贵在天,还要啥自行车呢?但是,人机共驾状态下的安全性提高10倍绝不等同于全自动驾驶状态下的安全性提升十倍,而且,坚守多传感器融合阵营的华为们也有着更高的追求。
全球累计投入自动驾驶赛道十几万亿,最终的结果是让几千万司机下岗,付出如此巨大的代价,为何不追求更高的安全目标呢?
关注视频号 - EEPW芯视角
了解芯动向,洞察芯看点