人人都想当第一,但谁才是第一?
最近长城汽车董事长魏建军的两段发言连续出圈,都是出自魏品牌蓝山发布会期间。一个是有网友问为何不请周某人来试车,魏建军表示不需要,“不能用流量评价产品好坏,消费者认可才是好产品。”
长期以来,一个不懂车的外行通过流量思维把汽车圈搞得“乌烟瘴气”,魏建军的回复被网友称之为“拨乱反正”。
另一方面,魏建军的另一番言论受到了不少用户质疑,他称“长城汽车智驾就是第一”,甚至激进地说让团队把“梯队”的定语去掉。这也引起了不少网友质疑,长城智驾之前都没怎么听说过,怎么突然就第一了,认为魏建军吹嘘过度。
我们就以目前代表长城智驾最高水平的蓝山智驾版为例,看看它的能力到底怎么样。
蓝山智驾采用元戎启行的端到端方案,官方的说法是采用了一套SEE大模型,即安全Safety、高效Efficiency、体验Experience。这也是衡量一套系统最重要的三角平衡指标,可以很果断地说,现阶段没有哪个车企能够在这个三角平衡上做到足够好。而且端到端的特点就是上限高,但下限也低。刚开始学习时可能还不如新手司机。
评估长城汽车SEE系统的能力,主要是评估元戎的端到端能力。来看看元戎在端到端上的三步走战略:
第一,把后融合感知技术变成多传感器前融合感知技术。也就是把多个传感器感知的数据放到一个神经网络里。在物体检测层面,用 AI 能力把全场景感知能力建立起来,让感知准确率、鲁棒性大大提升。
第二,进一步让模型可以感知道路拓扑结构,让预测和规划由规则驱动变成了数据驱动。高精度地图其实就是规则驱动,通过人去标注好道路结构和场景信息,系统根据人的标注去识别道路。摆脱高精度地图的两个前提是系统有强感知能力和全场景理解能力。
第三,推出端到端模型,将感知、预测、规划三个模型一体化。可以理解为原本三个独立模块直接通过脑机接口直连。看到不同的路况都能做出相应的驾驶反应,“所见即所得”。
行业里典型的分段整合思路,理想是双系统+世界模型,即“端到端+VLM+世界模型”,蔚来是端到端+世界模型。世界模型主要是场景生产,配合训练系统。
世界模型的作用很简单,主要是提供系统上车前测试数据,保证“上车”时的能力,但是“上车”以后,系统需要通过大量真实数据不断优化。即便刚上车时能力一般,后期也能通过真实采集数据弥补。
端到端配合规则兜底算法,基本上业内的常规思路。自动驾驶公司Nullmax甚至在端到端之外做了双重兜底,“规则+鱼脑”。
元戎官方公布的信息显示,其在2023年8月就采用一体化端到端大模型测试,今年推上车。华为、理想的说法是今年底推一体化端到端方案,特斯拉目前的端到端属于什么级别官方没有透露。按照官方目前的宣传口径,元戎比头部新势力提前了1年时间,即便是目前的上车时间也比行业提前了差不多半年。这估计也是魏建军“吹嘘”的底气所在。
蓝山智驾版硬件能力一般,27个传感器,禾赛AT128激光雷达,单颗NVIDIA Orin-X芯片,理想MAX版本用的是双Orin-X,极氪007甚至20万的起步价都干到了双Orin-X的配置。
芯片算力决定软件能力上限,虽然不同企业通过软件优化可以提升芯片利用率,而且端到端架构升级以后代码量明显减少,但是现阶段高阶智驾需要承担的能力来看,单颗Orin-X已经快逼近极限,即便现在能部署上车,后期也影响升级能力,否则以理想这么抠门的风格,不可能上2颗。当然行业里也有更极端的案例,比如大疆车载通过高通8650芯片100T算力实现了高阶城市领航,并且还没上激光雷达。
关于长城这套系统的能力上限,元戎启行官方平台的描述如下:“2024年4月,元戎启行率先推出基于端到端模型的新一代智驾平台DeepRoute IO;2023年3月,元戎启行推出国内首款不依赖高精度地图、可实现全域点到点功能的高阶智能驾驶解决方案DeepRoute-Driver 3.0。”
到今天,其实已经是升级版的点到点能力。这是什么概念?华为最新的乾坤智驾3.0刚刚具备这样的能力,而且还没有推送,首批会在阿维塔车型上推送。
SEE特别强调了通过AI算法强化预测能力,一个大前提是提升感知范围,这套系统的感知范围数据前向250米,后向150米,侧向120米。各个方向的距离都不低,以侧视距离来看,行业比较好的是120米,也有100米,大疆车载采用环视鱼眼,视角更大,但范围小了,大概是60米左右。感知范围越大,越能提早发现问题,提前做出决策,这个逻辑没毛病。但是这里面有个问题,行业说的一般都是极限距离,真正的有效距离根据每个企业的感知算法能力有差异。而且侧向距离有没有必要一定看的足够远,因为车不可能横着开,闹市区更常见的是相邻车道突然cut in场景,预测之外更考验系统的控制精准度。
最后,我们再来看看冰山之下的基建,Coffee Pilot Ultra依托长城的九州超算中心,拥有超1.64EFLOPS算力。“E”指的是 Exa,1Exa 翻译过来是 10 的 18 次方,一百亿亿。可以简单粗暴的理解,数据越大,信息处理能力越强。
36氪汽车7月份的报道,同期华为该数据是3.5EFLOPS,小鹏、蔚来分别是0.6EFLOPS、1.4 EFLOPS,理想是2.4 EFLOPS。长城汽车的表现在头部新势力面前算得上旗鼓相当。
接下来就是数据量。长城通过毫末积累了2亿公里的里程,提取出2OPBs有效数据,训练数据达1000万clips。
理想7月份智驾发布会公布的数据是19亿公里,但并没有说有效数据;华为4月份称其智驾总里程为2.2亿公里。其他大部分品牌都没有公布相关数据。对比来看,长城在智驾上的数据比头部新势力还有差距。
而且每个企业对有效数据的理解不一样,其实就是车企在不同场景下设置的触发机制收集的数据,这个指标没办法量化。
总体来说,单纯说智驾算法,长城确实是第一,至少在官方口径上,除了长城,没听到哪个企业把one model大模型带上车,这也是元戎过早看到one model大模型潜力提前布局的优势,但是综合云端算力,数据,车端硬件的整体情况,蓝山的这套智驾水平挂一个“第一梯队”的名头不过分,但是说第一确实有些托大,仅数据积累这一块就跟新势力差距明显。