2024年即将过去,再不了解智驾端到端就要落后了

科技   2024-12-17 17:31   上海  
目录
1.智能驾驶算法演进路线
2. 当前车企的智驾能力汇总
2.1 算法路线
2.2 算力军备竞速
3.小结

2024年,几乎所有汽车新势力和Tier 1都在大力宣传自家的智驾端到端产品。
那么什么是端到端?端到端之前的智驾算法架构又是什么?我们来了解概念,并看看当前智驾竞争格局。

1.智能驾驶算法演进路线


在之前很长一段时间,智能驾驶架构都来源于机器人架构,即:感知定位 -> 预测 -> 决策与规划 ->控制,如下图所示:


  • 感知模块主要负责使用传感器搜集数据、数据处理等,例如激光\毫米波雷达、轮速传感器、摄像头等,用于识别行人、交通信号、道路标志和其他车辆等等,高精地图、IMU等则提供车辆位置等,感知处理模块将这些数据转化为车辆可以理解的环境模型,并送入到预测模块;
  • 预测模块主要用于模仿人类感知来预测其他道路使用者的行为意图,例如有人横穿马路、有车要突然抢道等;
  • 规划与决策模块则根据前两个模块的信息来设计汽车的行驶策略,生成详细的行驶轨迹,并发送给控制模块;
  • 控制模块,毫无疑问就是来执行上述行车命令的模块,包括油门、刹车、转向,还有HMI的显示,例如左后侧有车正快速行驶,但你想左转,这时候你不仅会看到中控大屏的警告,还会听到紧急蜂鸣声。

这个模块化的设计使得开发更加独立,问题追溯也比较容易,但是随着完全自动驾驶的提出,模块之间的信息传递存在损耗、代码量呈指数级上升,单一模型(One Model)端到端开始出现。

为什么提单一模型端到端?自然是因为上述各模块已经有端到端的使用案例。

最先尝试端到端的模块是感知模块,2021年7月,特斯拉推出的FSD Beta V9首次使用了BEV(Bird Eye View) + transformer的算法架构,实现了多传感器融合(Fusion),有效提升了智驾性能;其次预测、决策规划融入到同一神经网络,实现决策和规划的模型化;然后就是模块化端到端,如2023年CVPR best paper提到的UniAD,最后实现单一模型端到端。

那么什么是单一模型端到端呢?

深刻一点,它指的是从原始传感器数据直接到控制命令输出的一体化神经网络架构,这种架构摒弃了传统的模块化设计,转而使用深度学习模型来处理从感知到控制的全部任务。

通俗一点,把端到端大模型看成黑盒子,只需要输入摄像头、雷达、传感器等数据,经模型处理自动控制车辆的加减速、转向等。如下图:


这就好比人类大脑,你通过眼睛看到的道路情况,你的大脑会进行决策,从而控制刹车、油门、转向,但你确实不知道大脑里面干了些什么。 

2. 当前车企的智驾能力汇总

我们以文章开头提到的几家车企为例,从算法路线、算力方面进行汇总;

2.1 算法路线


2024年3月,特斯拉推出了FSD Beta V12,实现了有史以来第一个完全的端到端AI自动驾驶,据统计,在推出FSD V12时,特斯拉删除了超过30万行代码,而这些代码之前都是控制车辆的FSD功能,取而代之的是控制转向、加速和制动的神经网络。FSD V12的C++代码只有2000行,相比之下,FSD V11有30多万行。最近继发布FSD V12后,特斯拉开始内测史上最强FSD版本 V13.2,该方案介绍:实现了真正的“车位到车位”,只需要选择好目的地,然后在车库中启动FSD,就可以实现到目的地的全自动驾驶了。

2024年4月,华为推出了乾崑ADS3.0,依赖GOD(通用障碍物识别)网络和PDP(预测决策规控)决策神经网络,实现了车位到车位的高阶智能驾驶;


2024年5月,小鹏汽车端到端大模型量产XNGP+上车,并在7月的“小鹏汽车AI智驾技术发布会”宣布XNGP从“全国都能开”全面升级为“全国都好用”,并提出“全国都好用”的三大标准:不限城市、不限路线、不限路况;

2024年10月,理想汽车全量推送新一代双系统智能驾驶解决方案“端到端+VLM(Vision-Language Models)”,宣称该方案能应对日常城市驾驶中的绝大部分场景。


2.2 算力


目前行业主流的端到端发展路线是云端大模型,早之前企业是通过大量的规则控制室设计大量规则小模型堆叠出一个 “大模型”,发展到后来则直接将将端到端模型部署于车辆上进行学习,但受限于车端SOC算力(特斯拉FSD芯片算力144TOPS(每秒万亿次操作)),容易陷入瓶颈;因此云端大模型出现了,它利用多达几十倍车端参数的性能进行强化训练,从而更好服务于车端。

因此,各家企业的算力军备竞速开始了。

据统计,特斯拉建立的Dojo超算中心,在2024年末其算力可达87.5EFLOPS(ExaFLOPS,一种衡量计算能力的单位,1 EFLOPS 等于每秒执行 10^18(一亿亿次或一百京次)浮点运算),远超国内所有车企的算力总和;

小鹏建立的扶摇智算中心,规划2024年算力达 10 EFLOPS;理想规划2024年底到8 EFLOPS;华为的车BU云智算智算中心预计2024年底算力可达8 EFLOPS。

3.小结


智驾能力还有一个关键维度,那就是各家车企的智驾里程数,毫无疑问,特斯拉在这方面遥遥领先,这也是它能快速推出FSD V13的原因之一。但由于没有具体数据,就不晾晒了。

可以看到,智能驾驶从提出到现在不过短短数十年,但确实发生了很多变化,很多所谓的热门技术和方案也可能随时被新的技术发展推翻。我们要做的就是,每天保持进一步点点,跟上步伐,仅此而已。

焉知汽车
科技 · 创新
 最新文章