编辑 / 还是Robo小曹
点击下方卡片,关注“自动驾驶之星”
近日,由汽车评价研究院及地平线主办的「地平线杯」世界十佳智能汽车、世界智能汽车品牌论坛如期举办。在大会现场,长城汽车技术中心副总经理——耿伟峰围绕端到端智驾方案的优缺点及解决方案,进行了详细介绍。
耿伟峰表示,长城也曾经历传统的CNN多相机感知+高精地图的高速NOA方案,但依赖地图并非长远之计。
“在整个行业刚开始推城市NOA的时候,还是基于高精地图的。这导致只能逐个城市地进行开城。长城认为,这样的路线是走不通的。”
由此,蓝山的智驾系统从一开始,就未采用高精地图,只用导航地图。而下一阶段,长城希望实现全场景的「车位到车位自动驾驶」。
他介绍称,高精地图能够弥补很多算法问题,的确能够提升体验,但是覆盖性很差。
“根据所有图商的并集统计,全国双向车道地图大概是1000万公里,真正的高速和高架只有3.6%。而在城市也只有10%左右有高精地图的覆盖。”
耿伟峰表示,一旦智驾进城,道路复杂度会指数级增加,面临的场景是无限的,其中也包括一些异常突发场景:违规自行车、违规行人、非机动车等等。如此看来,基于规则的开发难度是无法想象的。
因此,长城的智驾系统并未像其他车企那样,从分段式架构开始做,而是利用SEE一体化智驾技术架构。
“端到端架构是现阶段实现城市无图NOA的最优解。基于数据驱动,可减少约75%的人工编码。同时,算法能力会更强,迭代速度也会更快,极大提升了场景解决速度。”
不过他也指出,虽然目前最先进的端到端技术适用于大多数场景,但并非所有场景,这还是因为其下限问题。
“端到端的优势是能够处理复杂场景,更加丝滑拟人,而且不卡顿;劣势则是有时在一些莫名其妙的场景下,会犯一些低级错误,尤其是简单的场景。例如遵守交通规则,或者简单的压线、变道等问题,而且出现问题后定位非常困难。”
基于这些问题,长城设计的端到端智驾模型,思路是基于模型概率性的算法,加上确定性的算法,利用安全规则对端到端结果进行筛选。
同时,长城也会针对预测结果,以及端到端输出参考线,做传统的运动规划。其算法架构是两个衔接紧密的大模型:一个是负责统一的感知,一个是负责预测、决策和规划输出,多参考线和目标的意图规划信息,然后进行安全规则检查,基于时空联合规划生成最终的行车轨迹,然后再进行横纵向的车辆控制。
另一方面,蓝山智驾采用的基础数据,是基于长城多年积累所得,现已累计到数十PB,包括真实用户的回传数据和专业数采数据。
耿伟峰称,仅蓝山车型,每个月就会产生大概6000台的增量,上市几个月回传数据已经超过2PB。
但是,对以后的高阶智驾来说,数据的量并非关键问题,关键还是如何将这些数据有效利用好。
为此,长城针对数据治理做了详细设计。首先通过多维度精细的标签体系把数据进行拆分,每个精细场景我们都要保证数据的均衡,并且测试、验证也精细化细分场景。
另外,长城针对数据采用VLM视觉语言模型,提取向量特征;同时基于精细标签+AI向量特征,精准挖掘出稀有的数据,以及实车表现不太好的关键场景。
“这些手段能够保证我们数据分布的合理,而不是简单的靠猛堆数据的方法进行学习。”
他表示,传统数据标签的挖掘方案中,筛选效率不足,针对场景挖掘数据也需要耗费大量的人力和时间。而采用智能标签体系+AI特征的方法,可以最大程度缩减挖掘时间,节省人力。
“目前,人工只需要对数据进行确认,就可以针对感知、预测、决策进行一些标注处理。”
除此之外,长城的九州超算中心可动用的总算力超过3 EFLOPS,并且正在持续指数级增长。
“基于大模型、数据和算力资源,我们会将原计划上市4个月的开城时间(原计划在12月底开城),缩短到2.5个月,在11月份实现了所有城市公开道路都可以行驶。”
耿伟峰表示,上次OTA版本已可支持掉头等复杂场景,下次的OTA将会实现待转区、环岛通行等场景支持。
知识星球,新人优惠券来袭,结识一群志同道合的小伙伴一起成长。
下一个风口会不会是生成式AI 与具身智能的时代,我们特意创建了生成式AI与具身智能交流社区,关于大模型,机器人的相关业界动态,学术方向,技术解读等等都会在社区与大家交流,欢迎感兴趣的同学加入我们(备注具身智能)!
自动驾驶之星知识星球主打自动驾驶量产全技术栈学习,并包括: 学习板块,求职面试,有问必答,论文速递,行业动态五大板块!星球内部包括端到端大模型,VLM大模型,BEV 障碍物/车道线/Occ 等的学习资料!
生成式AI与具身智能知识星球,我们相信生成式AI 与具身智能会碰撞出出乎我们意料的内容,本知识形象并包括: 学习板块,求职面试,有问必答,论文速递,行业动态五大板块!星球内部包括生成式AI大模型,具身智能,业界资料整理等的学习资料!
👇点个“赞”和“在看”吧