百度王亮:「一段式端到端」隐藏了很大的问题

汽车   2024-09-03 18:30   北京  


作者 / 还是Robo小曹‍‍‍

终于,极越也推出自己的端到端智驾方案了。有些信息在情理之中,也有些信息在意料之外。

8月28日,在极越CEO-夏一平发布产品信息后,百度智能驾驶首席研发架构师、百度智能驾驶事业群组技术委员会主席-王亮,又照例分享了许多技术干货和观点。RoboX将发布要点及王亮讲话内容进行了提炼。

“几十亿做不出好智驾”

“有人曾说过,没有200亿不要造车。如今,我可以明确的告诉大家,没有500亿也做不好智驾。今天如果还有谁说花几十亿就能干好自驾,这样做出来的产品必会成为马路杀手。”夏一平说道。

他认为,如今在半导体芯片和大模型智驾这些领域,都应该不计代价地投入。例如百度在AI和自动驾驶领域上,已持续投入超过1,500亿元。

在现场,夏一平宣布,极越PPA智驾升级为ASD(Apollo Self Driving), 极越07将首搭L4级自动驾驶端到端大模型,步入端到端大模型时代。

在价格方面,ASD高阶智驾包买断价为2.99万元,限时优惠4999元,按月订阅的话是599元/月;针对已经买断PPA智驾的老车主,将在当前优惠价格的基础上进行“补差价”。

到了2024年底,ASD即可实现全国都能开。

夏一平表示,纯视觉的方案迭代速度更快——系统可将多个小模型合并成大模型,并将多余的参数释放给视觉模型,使得在同一场景下,纯视觉可以获得更多的信息量,数据种类丰富,更适合大模型的训练。

“很多人都认为,纯视觉不如激光雷达的智驾安全,但我想说极越的纯视觉感知能力,已经超过了主流激光雷达。”

为何选择「两段式」方案?

王亮表示,两段式端到端与一段式的区别,是用感知和决策规划两个模型代替One Model。这两者都可以减少代码和规则,也都可以通过吸收大量数据提升驾驶体验的上限。

“One Model的一段式端到端,好像可以用数据来解决所有问题。那为何极越选择了两段式端到端?”

首先,王亮认为,技术手段不是目的:“并不是说哪个方案更性感迷人,我们就扑上去做什么。“

说到方案选择的大原则,王亮又提及了自动驾驶最困难的问题,那就是「不可能三角」——这三个角分别是安全、智能性和规模。

“如果极致的安全加上极致的拟人和智能,大概率这只能是一个Demo。而如果兼具极致的安全和极大的规模,那通行效率和舒适性又肯定会作出妥协。”

极越之所以选择两段式端到端,首先还是出于安全考虑——

1、模型的黑盒系统会影响用户的使用体验,因为很难控制系统输出的内容;同时它也缺乏透明度,工程师很难Debug系统在的决策逻辑。

“想用一个模型就达到系统极高的「Mean time between failure(平均故障间隔时间)」要求,确实也没有成功先例。”

2、即便现在最强的GPT大模型,尽管上限很精细,但有时下限也很无语,这样并不能绝对保证安全。

3、一段式方案面临更难的长尾问题:在这里,王亮套用了函数来进行说明——

假设用端到端系统来实现「一路向前」这一简单的自动驾驶功能:一段式和两段式的模型都在进行数据输入,然后通过函数拟合,再输出轨迹。

如果输入数据是x,那么就要去拟合F(x)这样的函数。

假设x1是感知模型任务的长尾问题——比如说模型漏检了视频中的一个罕见障碍物,或者一条磨损严重的车道线。

假设x2是「一路向前功能」自身的长尾问题,它通常表现为最后在控制层面出现的问题。

从中可以看出,一段式方案隐藏了一个很大的问题——一部分Corner case是因为感知结果错误,才导致了错误的规划,从而引发系统出现高风险问题。

如果以P(x)表示收集常有问题样本的概率,这个概率越高,收集越容易。目前看来,P(x1)要远远的大于P(x2),这意味着收集x1数据的容易程度,要远远高于收集x2数据的难度。

由此看来,One Model的端到端系统,会比分层的端到端更难收集长尾数据,这也会模型迭代。

“而且,这一概率的差异并非线性,而是指数级的。比起线性的复杂度,指数级的复杂度非常难处理。因此,完全式端到端的背后,还存在蛮大的不确定性,或许还需要很长的时间周期,才能真的产生价值。”

感知E2E大模型的优化

基于上述原因,极越坚定地选择了两段式。随着极越V2.0版本软件的推出,首先与用户见面的是感知端到端大模式,它基于纯视觉的单一大网络,拥有检测、跟踪、建筑和场景理解四大能力。

在新版本上,该模型提升了模型参数规模,以及视频流的分辨率和帧率,实现了如下优化:

1、感知视距提升至230米,对锥筒这类小目标的检测视距提升至180米,小目标的高速避障能力提升了60%以上。

2、在场景理解意图上,对于行人横穿马路,以及鬼探头等场景,处理时效性提升了两倍,碰撞风险减少了50%。

3、建图能力:识别101种道路元素,种类能做到100%全覆盖。通过新的建图能力,ASD行驶道路范围提升了三倍。

4、对静止车辆的意图判断更准确,绕行决策更加拟人,提前的绕障的通过率提升了40%。

三大能力进化

另外,ASD代表了极越三项能力的进化——行车能力、安全能力和泊车能力。其中包括:

1、行车能力:亮点在于避障——车辆可以做到每毫秒检测5000次碰撞风险,并进行5000次距离计算,主动探索最佳行驶轨迹。

2、路口通过能力。例如,当车辆直行到路口时,遇到对向的的左转车辆占道,车辆也会轻松绕行,而非傻傻的等在原地。

3、变道决策:车辆可以在变道时,提前识别间隔车道的大货车,实现自动远离。

4、AEB:前向AEB的最高刹停速度,提升至100km/h,而且增加了两段式制动的功能——第一段先减速,第二段进一步减速至刹停。

5、泊车能力:此次升级包括了暗光窄车位泊车,在暗光的环境下泊车成功率提升了一倍,同时在泊车过程中还会收紧后视镜,防止刮蹭。

在发布会的彩蛋中,夏一平也公布了极越07的预售价——21.59万元起,新车将于9月10日正式上市。

极越07将首发搭载全新的V2.0版本软件,该版本的更新覆盖了端到端大模型智驾、大模型智舱、智能车联等十几个主要模块共计947项新增功能和优化升级。

关于RoboX

「RoboX」聚焦智能汽车、机器人等具身智能体。

在关注行业动态的同时,我们也致力于成为用户的「信息补盲器」,提供权威、通俗、精炼的高价值内容。

我们期待与你共同探索AI在物理世界中的最新应用与可能性,也致力于提炼更多非同质化内容。










往期文章推荐

理想鸿蒙智行差距翻倍,小米连续三个月破万!16家车企交出8月成绩单

小鹏MONA - 智能座舱,智驾以及产品商业背景

关于小米做增程的两个猜想


3W AUTO
用干货,链接每一位汽车人。
 最新文章