自动驾驶域控制器的来龙去脉(2024版):L3、大模型、还是舱驾一体?

汽车   2024-08-21 11:32   上海  

来源:汽车电子与软件 | 首图图源:网络 | 作者:木城

全文 7000+ 字,预计阅 35-40 分钟

进群交流:点此处

 
  

 

本文讨论域控以及三个行业趋势:L3、大模型和舱驾一体,最后我们再简单聊聊车路协同。



#01

行业大势:快速出清、头部聚集


去年域控制器的方案可谓是百花齐放,我在写上一篇文章(《自2023》)的时候也以为域控制器和芯片行业会出现极大繁荣,不想仅仅一年以后,行业就快速收敛,绝大多数智驾域控方案都惨淡收场,并快速筛选出了行业龙头。按照前文的逻辑,自动驾驶域控的核心是智驾芯片。我们先来看看2023年智驾芯片的表现:  
 

图1. 2023年智驾芯片出货量[1]

从2023年的数据可以看出,在国内智驾域控芯片领域,特斯拉和英伟达还是处于一骑绝尘的位置。

比较尴尬的是地平线。征程5 (J5)虽然位列第三,但出货量只有英伟达Orin-X的不到五分之一 (200,087颗 vs 1,095,019颗)。另外J5基本依靠理想L7、L8两款车出货(L6 24年第二季度才上市),其他押宝J5的方案商算是赔了个底儿掉,保护费交了不少,钱可是一分没挣到啊。另外,征程3 (J3)出货量也出乎意料的不尽人意。地平线目前只有征程2 (J2),既可做前视一体机、也可以用在座舱监测(DMS)系统中,出货量稳定,可以说是地平线目前唯一一颗商业上取得了成功的芯片。 
 
Mobileye凭借EQ4和EQ5,目前也是中国市场主流的智驾芯片和解决方案供应商。但未来不出意外的话,基本上会是一个逐渐出清的状态。

上图没有列出被寄予厚望的黑芝麻。按照黑芝麻自己的说法,截至2023年12月,所有芯片一共卖了15.2万片。目前A1000芯片在各个项目上终于都能用了,也许从下半年开始出货量会逐渐赶上来?

最后,回顾一下我在《自2023》里放的芯片列表在2024年的样子:   


红线划掉的芯片要么已经噶了(比如寒武纪),要么没有量,要么已经不是厂商主推方案,所以不用太关注了。哎,这个行业就是这么残酷。 
 
另外,在域控层面,多SoC混搭,比如“J3搭配TDA4”等等这种方案,今年也没打出什么水花。主流车企和Tier1的域控方案还是以单颗或者多颗同型号SoC搭配(比如大疆的双TDA4、理想的双Orin等等)为主。

伴随芯片表现的逐步明晰,智驾供应商也快速向头部聚集,也就筛选出了业界公认的四强,即地平线、大疆、华为、Momenta。

那么,2024年自动驾驶域控制器有哪些发展方向呢?



#02

域控支持量产L3自动驾驶?


在国内实现L3自动驾驶一直都是车圈很热的一个方向,2023年11月四部委联合发布了《关于开展智能网联汽车准入和上路通行试点工作的通知》,被认为是国家希望推动L3加速落地的一个信号。2024年6月4日工信部网站发布《四部门有序开展智能网联汽车准入和上路通行试点》的通知,确定9家首批智能网联汽车准入和上路通行试点联合体,更是掀起新一轮热度。


图3. 九家联合体列表,来源工信部网站

不过从使用主体可以很明显看出,第二个试点通知本意绝不是支持OEM做L3量产的,而是让车厂和出行服务商一起,搞类似最近大火的苕萝卜之类这种L4 Robotaxi。 
   

图4. 武汉苕萝卜,来源澎湃新闻

事实上,中国尚未进行L3自动驾驶立法。全世界目前也仅有欧盟UNECE WP.29 R157一个L3自动驾驶法规,戴姆勒即依据R157搞了Drive Pilot这个L3自动驾驶功能,并在德国和美国上线,正式宣称“管撞也管赔”——即承诺Drive Pilot自动驾驶期间发生车祸由戴姆勒负全责。R157最初把最高时速限制在60km/h,目前已经拓展到了130km/h。

但是!R157规定从“自动驾驶状态”切换到“人工驾驶状态”的切换时间是多久呢?10秒!

也就是说,你的宝贝奔驰正在以130km/h的时速自动驾驶,而你正吃着火锅唱着歌,突然自动驾驶系统故障将要退出,你只有10秒钟时间放下手里的事情,观察路面并接管飞驰的车辆。

为了写这篇文章,我把R157修正附件的原文又看了一遍,还是10秒没变。戴姆勒Drive Pilot官方操作手册,也注明了驾驶员要在10秒内接管系统。但我一直坚持一个观点:10秒钟的接管时间是远远不够、也不安全的,目前这个设定只是对现有技术水平和电子电气架构的妥协。
 

图5. L3及L3以上自动驾驶域控必须支持FailOperational状态

在功能层面,L3与L2最大的区别是系统故障以后,自动驾驶域控制器还能控制汽车继续安全行驶,为驾驶员接管争取时间。这种“带故障运行”的状态(上图中的黄色状态)即是功能安全里常说的“Fail-Operational”即“失效可工作”。带故障运行的最大时间就是留给驾驶员的接管时间。

车辆要实现“Fail-Operational”,首先要在整车电子电气架构上做充足的冗余设计。如下图所示,常见的冗余包括冗余供电、冗余通信总线、传感器冗余、驱动冗余、6相/12相转向电机、制动执行器备份(例如iBooster+ESP或者IPB+RBU)等等,光在域控制器层面设计冗余是没用的。


图6. 整车电子电气架构的冗余,来源文献[7]

自动驾驶域控制器要支持L3,最直接的方式也是备份。其实业界在这方面的研究由来已久。比如像下图所示,域控通过板载多颗Safety MCU来实现规划与控制算法在物理资源上的冗余;最近还有一些供应商提出,在做感知和规划的SoC里按流水线,精细区分不同核心完成不同任务,并把核间通信的数据备份存储起来。这样万一传感器或者哪个核挂了,至少流水线后面的核能利用前一级所备份的数据继续计算一段时间。   


图7. L3域控板级方案:SoC核心的冗余和MCU的冗余,来源文献[7]

那么回到主题。即便不计投入做到了所有这些,戴姆勒也只能提供10秒的接管时间,技术上还很有待完善。考虑到国内造车成本已经卷到极致,在没有明确利益的驱使下,国内OEM是不会盲目提升成本量产L3系统的。更何况“人机共驾”显著难于纯自动驾驶是业界共识,L3本身就还有极多应用场景和交互方面的问题需要推敲,离真正成熟还很远。

总而言之,2024年以及未来的一两年内,域控制器支持L3自动驾驶量产落地,不是主流的发展的方向。



#03

端到端大模型智能驾驶上车


如今应该没有哪个概念比“大模型”更火热了,火到无论做什么事,不扯两句大模型都会显得自己与时代脱节。拜特斯拉所赐,“端到端大模型”在智能驾驶中的应用在今年(2024)受到了以理想、蔚来、商汤、元戎为代表的各色公司的大力追捧。 
 

图8. 大模型内容已经成了网红们新的流量密码

我们先复习一下。传统自动驾驶软件可分为感知(Perception)、建图定位(Localization)、规划(Planning)和控制(Control)几大模块。出于自身算法特点以及对功能安全的要求,一般“感知”、“建图定位”运行在SoC(ARM A核)中,“控制”运行在MCU(ARM R或M核)中,而“规划”模块根据算法和计算资源的不同,可以灵活部署。


图9. 传统智驾算法架构划分(之一):感知、定位、规划、控制,来源网络
   
而所谓“端到端”,是指自动驾驶系统像人脑一样,以传感器原始数据为输入,只经过一个模型,就能生成对汽车执行器的具体指令、内部不再拆分成不同的模块,可以作为一个整体来进行训练和优化,以达到信息无损传递、决策全局最优、系统延时最小,同时系统框架复杂度显著下降、代码量显著降低。


图10. 端到端自动驾驶大模型,来源网络

其实端到端也不是什么新东西。早在2016年,英伟达就发表过一篇名为"End-to-End Deep Learning for self-driving cars"的文章,讨论了端到端模型应用的可能性。只是近年来由于特斯拉的自动驾驶技术路线,从HydraNet 到 BEV+Transformer,再到占用网络Occupancy Network,都一贯的正确且高效,使业界多少有了些“特斯拉迷信”。鉴于今年特斯拉“宣称”FSD V12应用了端到端大模型, 自然就引领了业界的端到端潮流。

那么端到端大模型是怎么从demo一路演进到真正上车的呢?特斯拉并没有发布自己端到端大模型的技术细节,我借用非常有代表性的理想的大模型PPT来说明一下。 
   

图11. 理想的端到端大模型技术演进,来源文献[9]

可以看出,理想把第一代系统分成了感知、定位、规划、导航、NPN(Neural Prior Net, 先验神经网络),以及没画进来的控制等部分。这是一种去高精地图的自动驾驶算法框架,但大模型还没有应用进来。

用NPN来替代高精地图,这其实非常像特斯拉“众包采图”的路子。具体方法如下图示,通过车辆传感器事先多次采集道路信息(多次,所以更完整、无遮挡),再通过神经网络提取出隐性的道路特征中间值(下图中的Road Features),并保存起来作为先验信息。等下次车辆再通过同一路段时,把这些先验信息和传感器实时采集的道路信息,以及导航高辅地图做比对,一起参与到BEV构建和规划计算中,最终得到精确的结果。

这个方法的本质是把自车当作地图测量车了。但是由于测量的只是道路特征值(还是隐性的)而不违反《测绘法》。   


图12. 理想NPN算法,来源网络
         

 


图13. NPN实时构建路网,来源文献[10]    

理想PPT里的第二个阶段,也是目前大部分声称搞“端到端”的公司所处的阶段,是“两段式”大模型。即感知是一个模型,提供结构化输出;规划部分由原来的“基于规则”演进到“基于数据训练”的大模型,最终的输出是行驶路径,再通过传统的控制算法(PID、MPC等等)变成执行器控制指令。

在我看来“两段式”大模型是一种“伪大模型”。简单而言两个模型在数据传输过程中自然就会发生信息丢失,数据存储也会产生较大冗余,而且无法联合训练、联合优化,没有真正发挥大模型的优势。

现在一些车企宣称在单Orin的域控上就能部署这种两段式大模型,如果实车效果确实不错的话,倒是能极大促进大模型上车。

第三个阶段,是单一大模型,也就是把感知模型和规划模型合二为一,由传感器原始输入直接生成行驶路径。这是一种能够最大化挖掘大模型潜力的方式,但也对域控上芯片的算力有更高的要求。单一大模型的上车,可能会触发域控的更新换代。

按照马斯克的定义,理想展示的这种单一大模型,都还不算是端到端,因为它的输出是路径,而不是执行器指令。不过我觉得也没必要较这个真儿,自动驾驶的瓶颈早就不是控制了,只要规划的行驶路径正确,用经典方法可以丝滑转化成执行器指令,不一定非得为了“端到端”而“端到端”。再说了,也得给广大规控工程师们留口饭吃,别赶尽杀绝啊!

其实,业界也在怀疑特斯拉有没有真的实现“端到端”,毕竟马斯克放嘴炮也不是一次两次了。下图是特斯拉在2023年CVPR会议上展示的大模型材料,前一页(图14)和2022年AI Day上展示占用网络时几乎是一样的,只是特斯拉强调现在用了一个统一的向量空间,或者说大模型,取代了原来复杂的内部架构(图15),直接输出交通参与者目标、信号灯和路面坡度等信息。  
 

图14. 特斯拉展示的自动驾驶大模型架构,来源材料[11]


图15. 用大模型取代原有架构,来源材料[11]

这种做法显然与马斯克说的从“传感器原始数据”到“执行器指令”的“端到端”有出入。还是希望特斯拉能早日再搞个AI Day活动来详细解答一下吧。

前阵子蔚来的发布会上提出了“世界模型”,被普遍认为是端到端自动驾驶的终局形态。世界模型的构建意味着AI能够真正的“理解”车辆运行的周围环境,理解一切行为的规则和因果,能够在不经训练的情况下推理做出正确的决策。世界模型的真正成熟应用还有很长的路要走。   

为了支持大模型在域控上部署,芯片厂商也在开发相应的产品。大家听到较多的英伟达Thor芯片,集成的Blackwell GPU架构在设计时就考虑了对部署大模型的支持,同时Thor本身算力也比较强大,未来可能会成为端到端智能驾驶域控的主力芯片。

一些二线厂商,比如安霸(Ambarella),也推出了基于CV3-HD架构的N1系列芯片,支持部署多模态大模型,这次北京车展上做了展示。不过N1不是车规芯片,真要上车的路还很长。


图16. 安霸N1系列芯片支持多模态大模型部署,来源材料[12]

智驾端到端大模型能否最终上车,是一件关乎智驾行业大洗牌的事。大模型的训练需要巨量算力和成本支撑,每年的花销数以亿计,绝不是中小公司能承担的。如果端到端智驾最终被证明可行,那么行业就会快速向几个算力寡头聚拢,同时对工程师的技术栈要求也会剧烈变化(比如感知融合、规控这些工程师的需求量会急剧下降),域控的形态、甚至整车电子电气的形态都会因之改变。

但是目前来看,端到端智驾也可能是一件“望山跑死马”的事:投入很大、硬件成本很高,最终的效果却可能与传统智驾算法差不多。而且,从制造噱头的角度,只要智驾算法里用到了大模型——比如“两段式大模型”——你也可以宣称自己是端到端。可能一年以后,所有公司的算法都宣称是“端到端”了,但真实情况如何,只有他们自己知道。
   
另一方面,安全性和可靠性也是挡在端到端智驾的一座大山。理想在单一大模型之外,还搞了VLM第二系统,这是否有效有待验证;大模型的计算过程是隐式的,不可解释也不可测,如何满足功能安全同样是个大问题。这一切都要留待实车表现去回答。

总而言之,未来两年自动驾驶域控支持端到端大模型,会是一个方向,但是存在一定不确定性。



#04

域控支持舱驾一体


2024年智驾域控另一个演进的重要方向是“舱驾一体”,也就是在一个控制器上,既实现智能驾驶功能、又实现智能座舱功能。它的本质是提高软硬件模块的复用性、整体降本。为了实现这些功能,控制器必须同时具备座舱图像处理所需要的大GPU算力和智驾需要的大NPU算力,同时还要保证充足的CPU计算资源,以及足够的网关接口,着实有点“既要又要”的意思。

具体实现而言,域控舱驾一体又分为两个阶段:

1. One Box,Two Boards (2019-2023)

顾名思义,这种舱驾一体架构是在一个控制器(中央域控)中集成一张智驾计算板(PCBA)和一张座舱计算板。典型例子是特斯拉 HW3.0和HW4.0 。从下图可看出,HW3.0域控的上层是以AMD Ryzen CPU和AMD Radeon GPU为核心的座舱PCBA(图中的Infotainment ECU,满足座舱控制和图像处理GPU算力需求),下层是以智驾芯片FSD为核心的智驾PCBA(图中的Autopilot ECU,满足NPU算力需求),他们共用了一套液冷系统。

(HW3.0中GPU是以模组小板的形式出现的,到了HW4.0中才真正和智驾PCBA融合在一张板上。)  
 

图17. 特斯拉HW3.0 剖面图和外形,来源材料[13]

除了特斯拉,小鹏XEEA3.5架构下的中央计算单元也采用了舱驾一体布局,并且更进一步,把智驾和座舱芯片集成到了一张板上,大幅提高了集成度。其他厂商包括德赛西威、零束科技、亿咖通等也有相应的规划和产品落地。


图18. 零束跨域融合控制器ZXD1,来源材料[14]

2.  One Box,One Chip (2024 - )    

进入2024年,迫于进一步降本的压力,舱驾一体开始快速向着“一片SoC同时实现座舱和智驾”的方向落地。代表性的SoC包括英伟达Drive Thor,高通Snapdragon Ride Flex平台的首款芯片SA8775以及黑芝麻“武当”C1200系列芯片。

部分舱驾一体SoC一览:

序号

公司

芯片

算力(TOPS)

制程(nm)

量产时间

拟搭载车型

1

英伟达

Drive Thor

1000-2000

4

2025

极氪等

2

高通

SA8775P

72

4

2024

哪吒

3

黑芝麻

C1296

<100

7

2024

未披露


以上几款芯片目前都有较明确的上车量产计划,但展现的思路却不尽相同。行业老大英伟达更倾向于“一步到位”,真正意义上使用一片芯片完成“座舱+高阶智驾的所有功能”,而高通和黑芝麻则选择“小步快跑”,从“座舱+一部分智驾功能”入局。   


图19. C1296,北京车展实拍。话说这物料上明显有个错别字...   


图20. 集成了座舱和智驾功能的高通SA8775P, 来源材料15

前面提到了,舱驾一体的主要收益是降本,但面临的问题也是突出的:

首先是舱驾融合使软件整合复杂度显著上升。以黑芝麻/均联智行展示的C1296开发工具链为例,整个软件系统要控制多个隔离的MPU、实时MCU、网关、安全岛,通过虚拟化来部署不同的操作系统等,核间通信是很大的挑战,整体稳定性和实时性如何保证也是个难题。另一方面,目前车企的人力组织架构普遍也是舱、驾分离的,部门墙必然会对舱驾一体产生阻力。舱驾一体的推进意味着组织架构也要进行调整,而这往往会比技术挑战更难以解决。 
 

图21. C1296的配套软件开发工具链,北京车展摄

从目前市场情况来看,竞争日趋白热化,降本还是压倒一切的首要任务。所以各个车企都对舱驾一体趋之若鹜。已官宣未来车型将使用Thor的车企包括理想、比亚迪、小米、百度(极越)、广汽(昊铂)、吉利(极氪)、长安、长城、小鹏,Tier1包括德赛、联想等等;高通SA8775的合作方也很多,OEM包括哪吒,Tier 1涵盖中科创达、车联天下、博世、航盛、华阳、大疆、镁佳等等。除此之外开展舱驾一体预研项目的车企就更多了。

组织架构方面,比亚迪被曝今年成立智能化技术研究院整合座舱和智驾研发,而博世在更早就布局了座舱和智驾的研发力量整合。相信未来会有更多车企顺应这个潮流。

可以比较确信的说,舱驾一体一定是未来两年域控制器的发展方向



#05

端到端大模型和舱驾一体冲突吗?


先小结一下,从前文的分析来看,未来域控支持端到端大模型可能是个方向,而支持舱驾一体一定是发展方向。那么我们自然会思考:这两个方向互相冲突吗?  
 
目前智驾域控领域经过多年厮杀,已经分化出了三个不同的市场。其实打开地平线的主页,也能看到它分了三个智驾产品线,大致对应了这三个市场。

(但地平线应对不同市场的具体方案,除了J2以外从商业上来说都是失败的。)


图22. 地平线的智驾产品划分:Mono, Pilot, SuperDrive

这些内容《自2023》里有提到过,再重复一下。智能驾驶主要市场一览:

特征/市场

AI算力(T

控制器形式

智驾系统成本(人民币元)

搭载车型价格区间(人民币万元)

实现的功能

实例

低算力市场

5左右

前视一体机

1000-2000

<15,或中端车型的乞丐版

基本L2主动安全、泊车辅助(独立控制器)

吉利帝豪S,问界M5非华为智驾版

中算力市场

10-150

域控

3000-5000

15-25

主动安全+高速NOA+自动/记忆泊车

途观L Pro

高算力市场

>200

域控

>5000

>25

主动安全+城市NOA+AVP

问界新M7


鉴于端到端大模型高额的训练成本,以及域控本身成本所限,端到端智驾是无法进入中、低算力市场的。而无论高、中、低算力市场,都可以通过舱驾一体的方式来进一步降本。

这就意味着,英伟达选择的“一步到位”模式,既可以支持端到端智驾,又能够实现舱驾一体;而高通和黑芝麻投身的“小步快跑”模式,由于算力的缺失,目前天然就已放弃端到端了。其他“One Box, Two Boards”的舱驾一体方案,由于配置比较灵活,可根据车企的技术路线(是否发展端到端)将不同芯片自由组合。所以从这个意义上来说,端到端大模型智驾和舱驾一体是不冲突的。



#06

总结和其他


除了以上的方向,自动驾驶域控制器还有一个大的方向就是支持车路协同。特别是上个月国家公布了车路云一体化试点城市以后,车路协同这个领域又热了起来。但目前车路协同的建设重点还是偏向于路侧基础设施。车侧在2024年还不会是发展的热点,也许明年写《自2025》的时候,车路协同会是浓墨重彩的一笔。

那么,总结以上,自动驾驶域控制器的2024-2025:

  • 不会向支持L3落地的方向发展;

  • 会支持端到端自动驾驶,但这个方向有一定不确定性;

  • 主流方向是支持舱驾一体落地量产。


参考

1.^https://auto.gasgoo.com/news/202402/27I70383513C601.shtml
2.^https://m.gxfin.com/article/finance/cj/default/2024-07-04/6137010.html
3.^https://unece.org/sites/default/files/2023-12/R157e.pdf
4.^https://unece.org/media/press/368227
5.^https://unece.org/sites/default/files/2022-05/ECE-TRANS-WP.29-2022-59r1e.pdf
6.^https://www.mbusa.com/content/dam/mb-nafta/us/owners/drive-pilot/S-Class%20DRIVE%20PILOT%20Supplement.pdf
7.^https://www.sae.org/publications/technical-papers/content/2021-01-0068/
8.^https://developer.nvidia.com/blog/deep-learning-self-driving-cars/
9.^https://chedongxi.com/p/322978.html
10.^https://tsinghua-mars-lab.github.io/neural_map_prior/
11.^https://www.youtube.com/watch?v=OKDRsVXv49A
12.^https://finance.yahoo.com/news/ambarella-brings-generative-ai-capabilities-100000974.html
13.^https://www.eetasia.com/teslas-hardware-retrofits-for-model-3/
14.^https://www.sohu.com/a/765313030_376050
15.^https://www.qualcomm.com/news/onq/2023/01/snapdragon-ride-flex-soc-central-compute-solution-bringing-software-defined-vehicle-vision-to-reality
16.^http://auto.cnfol.com/cheshidongtai/20240226/30627656.shtml
17.^https://cpnn.com.cn/news/hg/202407/t20240704_1716823.html

      

ADS智库公号👇发消息“我来了”,可直接领取“10G+自动驾驶相关资料”

<-  联 系 & 声 明  ->
【声明】除文内特殊声明外,本公众号内所有文章编写或转载的目的仅用于学习和交流,不予以商用,不代表本号观点及立场。本公众号内资讯及正文引用图片均由个人公众号 ADS 智库六耳基于官网或公开信息梳理或引用。本公众号所引用及转载内容版权均归原作者所有,凡是注明来源 “ XXX ADS 智库 ” 或作者为 “ XXX 六耳、XXX ADS 智库 ” 的文章转载或引用时请注明来源 ADS 智库。若有版权或其他任何问题请联系六耳( 微信号:adas_miao ),本号将及时处理。

转发、点赞、在看
,安排一下?

ADS智库
聚焦 ADAS \x26amp; ADS 相关内容,公号发消息『我来了』免费领取 10G+ 自动驾驶资料
 最新文章