在AI技术的不断飞跃演进中,端到端正逐渐成为自动驾驶行业的焦点。卡尔动力作为技术领先的自动驾驶公司,于近日发布了国内首个端到端L4自动驾驶编队解决方案——卡尔领航,并已率先完成量产上车。卡尔领航通过一体化整合感知、预测、规控等环节,减少信息传递损耗,并用海量真实数据对模型进行联合训练,让模型模仿经验丰富的货车司机学习驾驶技巧,从而大幅提升应对货运场景复杂路况的能力,为货运无人化提供技术保障。在此基础上,还采用多重安全兜底策略确保端到端架构的安全性,加速货运无人化进程。车如流水马如龙,端到端让车像老司般自如
端到端架构并不是一个新的概念,它的“翻红”来自2023年8月特斯拉发布的,基于端到端架构的FSD V12版本,它显著提升了自动驾驶的性能和用户体验,并迅速拉升了其自动驾驶订阅渗透率。此后,端到端架构火速成为自动驾驶领域的“当红炸子鸡”,最近随着FSD V12明年第一季度入华消息的传出,端到端自动驾驶也再次成为大家热议的焦点。理解端到端(end-to-end)架构前,需要先理解传统自动驾驶采用的模块化架构,后者衍生于机器人技术架构,是将自动驾驶分解为不同的独立任务模块,例如感知、预测、规划和执行。而端到端架构则是将多任务统一到一个完全可微分的框架中,更像是人类大脑,通过眼睛、耳朵等传感器接受信息,经过大脑处理后,下达指令给手脚执行命令。两者相比,端到端架构是将规则驱动变为数据驱动,可以拥有更强大的通用障碍物和道路结构理解能力,更拟人的路径规划能力,并打破泛化性的瓶颈,覆盖更多的驾驶场景。卡尔动力感知与AI研发总监王珂博士认为:“历经多年发展,自动驾驶已经形成相对成熟稳定的技术栈和软件架构,在多个细分赛道都取得了行业共识和广泛应用。端到端再度翻红,必然有其优势。经典自动驾驶模块化架构,模块的分界,依赖行业专家通过对信息的抽象,来界定模块接口。随着每个模块的进步,这个信息抽象的过程不可避免地带来了很多信息损失。为了减小这些信息损失,我们看到各家的软件架构上往往布满'飞线',极大增加软件的复杂度和维护成本。随着深度学习的进步,端到端的算法范式,不但对这类架构上的痼疾给出全新的解决方案,而且随着信息损失的减少,能达到更高的算法性能。”水能载舟亦能覆舟,端到端也不是啥都会
端到端架构给自动驾驶带来许多优势,但它也有局限性,业界普遍认为安全性和可靠性是亟待解决的问题。由于AI模型的不可解释性,端到端架构会存在遇到问题难以有效调试和修正的问题。其次基于模仿学习的模型是通过拟合自车轨迹数据分布来预测行为,推理出采样概率最高的输出,很容易忽略优化目标和边界约束,导致一系列问题。例如它很难保证完全避免碰撞,也无法保证遵守交通规则和沿车道中心线行驶等基本常识。这对于自动驾驶来说,是非常严重的问题。
如果是One Model(完全的)端到端架构,需要传感器仿真训练,但由于真实世界的复杂性和不可预测性,仿真系统很难完全复制还原所有的场景和条件,这可能导致在仿真环境中训练的模型在现实世界中泛化能力不足,带来诸如在未见过的交通场景下可能出现决策失误的问题。目前的技术还难以完全弥合仿真与真实世界存在的鸿沟。另外端到端架构需要大量的训练数据来学习复杂驾驶任务,需要车端、云端部署大量的计算资源,这对于技术的落地量产都是一个不小的挑战。卡尔动力作为一家以实现货运无人化技术与规模化运营商业化闭环为目标的自动驾驶公司,拥有无人驾驶卡车软硬件系统全栈开发能力,创新性的提出L4级自动驾驶混合智能编队技术解决方案,并率先完成落地运营。自成立以来卡尔动力持续投入和布局前沿软件算法,搭建最先进的技术架构,结合自身大宗货运物流的业务场景特点,在算法、工程、数据等层面做了大量优化与创新工作。团队提出的最新端到端算法,通过结合无监督学习和世界模型,可以在隐空间中学习环境表征变化的能力,提升了效率的同时保证了安全性。实现了比业内领先的端到端系统少消耗近一半训练资源,但推理速度快3倍,安全性还提升40%的能力。卡尔动力提出的最新端到端UAD架构
王珂表示,“端到端是手段不是目的,卡尔动力的端到端研发,是为了更好解决在干线大宗物流过程中所遇到的各类问题。一个优秀的模型,只有具备了很高的安全性和实际可行的成本,才能具有潜在的实用性价值。从这样的角度出发,卡尔动力团队探索出了在业界独树一帜的UAD框架。我们的端到端模型,不需要使用昂贵的海量3D感知标注,训练成本也仅仅是同行的几分之一,但是却拥有了更高的性能指标和推理速度。我们坚信,从业务中来到业务中去,才能让端到端技术走得更远。”
在此目标下,卡尔动力推出的卡尔领航是在算法架构上将感知、决策、规控等环节进行一体化整合,通过感知通用大模型、行为大模型,让自动驾驶系统像有经验的货车司机一样,识别障碍物无上限,并做出有预判、更拟人的行为决策,在此架构下还加入安全规则,确保系统不会做出违背越过安全“红线”的行为。
卡尔领航技术架构示意图
这一创新技术方案展现出四大优势:1、多重安全兜底确保安全性;2、强大的推理能力处理各种复杂Case ;3、落地可行提升实用性;4、海量真实训练数据加速迭代。
卡尔动力首先通过人类知识和经验丰富货车司机结合的数据对模型进行安全数据训练,提升概率分布与实际驾驶行为的吻合率,达到拟人和智能化的目的,同时也不违反安全边界。此外在端到端的架构下,将One Model的输出再由传统基于优化的规划器进行安全校验,多重设计确保安全性。引入视觉语言大模型,并对原本只能在云端高算力环境下才能运行的大模型进行了裁剪,在车端上线一个剪裁后可实时运行的模型,使其具备强大的推理能力和处理各种复杂Case的能力。可有效识别干线物流场景中常见的各种异形物品和遗撒物。例如自动驾驶卡车遇到一个水坑或者塑料袋,系统需要综合判断并推理出路上遇到的这样的障碍物,能不能压过去,会有什么后果。在此架构下,感知可充分利用历史数据进行训练和仿真,原本分块的的预测决策规划模块,整合升级为一体化的行为大模型。由于解耦了传感器数据的依赖,可以使用机器学习和仿真器生成海量的虚拟场景来进行训练甚至引入强化学习来训练,以泛化能力更强、开发效率更高的数据驱动模型迭代,取代人类手写规则代码。这样既保持了技术先进性,又充分考虑了车载计算和云端计算的成本。卡尔动力是唯一一个拥有上亿公里自动驾驶系统验证能力的自动驾驶卡车公司。过去很多数据因为传感器的不同,很难直接转化成为自动驾驶的训练数据,但是在端到端技术范式下,可以转换成为世界模型的训练数据,帮助生成场景和训练端到端模型。凭借领先技术,卡尔动力已组建300台行业最大规模L4自动驾驶车队 ,在内蒙、新疆等地展开自动驾驶编队货运常态化运营,达成包括自动驾驶编队运营里程突破820万公里、自动驾驶编队货运5500万吨公里等行业领先的成绩。日前还与陕汽重卡、中集车辆签订行业最大订单规模,1000台智能网联编队卡车战略合作协议。这些落地运营的真实数据构成了卡尔动力另一大核心竞争力,卡尔领航使用海量真实数据提炼和优化评估标准,加速模型迭代。结语
这些优势让卡尔领航成为国内首个在公开道路上实现常态化运营的端到端自动驾驶编队解决方案。在激烈的行业竞争中,卡尔动力已跻身行业第一梯队。在自动驾驶编队货运中,卡尔领航能更好地处理长尾场景,同时有效减少急停急车、安全接管。搭载卡尔领航的自动驾驶智能混合编队安全性比人工驾驶提升5倍;高稳定性做到百万公里不失效;人力成本最高降低80%;综合运营成本最高降低20%,给客户带来“安、稳、省、利”的多重价值。
随着技术的不断迭代和运营规模的扩大,卡尔动力已形成技术和商业相结合的强大正向循环,加速货运无人化进程,推动无人化技术在更广泛的交通领域应用,为交通物流行业发展注入更多科技创新元素,推动传统产业升级和新质生产力的形成。欢迎关注卡尔动力KargoBot公众号