变阵“端到端” 理想的智驾之路能否走上正轨?

科技   2024-08-27 20:00   北京  

本文系深潜atom第835篇原创作品



"

大幅度投入进端到端方案,

可能也会是竹篮打水

"

徐太良丨作者

深潜atom工作室丨编辑


经过漫长又曲折的智驾自研,理想的智驾之路似乎终于走上了正轨。


近日理想汽车内部确定成立“端到端自动驾驶”实体组织,团队人数超200人,同时要求公司的其他智能化团队灵活支持该项目。这足以证明理想的这次变革,是下了狠心的。


至于端到端方案是“智驾正轨”的说法,并不是因为行业巨头特斯拉先用、其他新能源车企都在研发,而是这确实是目前所有技术路线内最靠谱的做法。


并且最为重要的是,“端到端”已经成为了目前所有技术路线中,最能突破天花板的技术


靠代码支撑的老智驾方案“规则控制”已经近乎到头了,再往后也只不过是在繁重的代码上增加量,代码之间很容易产生BUG,还会影响车机的内存和运行效率。再加上现在大家都在降本,激光雷达、高精地图、传感器和摄像头的成本都很高,端到端在成本上也有极大的优势。


毕竟底层逻辑就是训练AI来驾驶,喂数据就好了。



同样都是端到端的方案,但理想也有自己的不同。


在近日的“理想汽车智能驾驶夏季发布会”上,理想汽车公开展示了他们的端到端自动驾驶技术架构,由端到端模型、VLM视觉语言模型和世界模型三部分共同构成。李想表示,最晚到明年初,理想汽车就会正式推出端到端+VLM自动驾驶的方案。


其实端到端只是一个范本概念,很笼统地讲就是“数据推动”,但是获得数据的模型却大不相同。比如特斯拉用的是BEV+transformer的模型,小鹏的XNGP用的是神经网络XNet+规控大模型XPlanner+大语言模型XBrain构成的模型。


可是“模型越少,输出越精确”。


不对啊?难道不是模型越多,数据越多,输出的也就越精确吗?


要解释清楚这个问题要用到很多的专业术语,模型之间的“显式输出”会导致部分信息的损失,简单一些来说其实就像“接龙传话”的游戏,传话的人越多,到最后就越有可能跑题,最精准的反而是两个人玩。



ONE-Model是所有做智驾车企都在追求的路线,理想目标是在近两年达成,但想要彻底达成再上车,可能还需要三五年的时间。


在这三五年中,大家比的是数据量。


前面我们说了,端到端的底层逻辑就是训练AI,怎么让AI更智能?那就只能喂数据。


或者说,在这三五年里,大家比的是“资源”,数据的资源。


马斯克曾经对端到端模型的训练量做出了精准的描述。


“用100万个视频case训练,勉强够用,200万个稍好一些,300万个,会感到WOW,到了1000万个,就变得难以置信了”。


1000万个视频片段训练成的智驾方案,是理想在今年年底要达成的目标。


想要获得数据,要靠自家用户的驾驶数据,其次就是靠训练芯片。


马斯克在4月份疯狂购入英伟达H100AI芯片,从原本的3.5万采购量加到了8.5万。


后知后觉的理想,最近也开始高价收购英伟达的芯片。



除了数据之外,算力也是影响智驾能力的重要一环。车机芯片的算力以目前来说,Orin X芯片算是天花板了,想要突破这个天花板以及再进一步降本,比的是智驾算力中心的云端算力。


在算力上,华为仍然是国内的第一梯队,算力达到了3.5EFLOPS,小鹏仅为0.6EFLOPS,蔚来稍好一些1.4EFLOPS,理想做到了2.4EFLOPS。


在“理小蔚”的阵线中,理想已经逼近行业头部的水平。



从各种角度来看,理想对这场“端到端大战”,已经做好了招兵买马、备足粮草的准备。


甚至比以往对智驾所有的准备都充足,因为对于理想来说,赶紧追上端到端模型太急迫了。


“有图NOA”和“无图NOA”,理想都算是晚入局者,无图城市NOA在今年7月才正式推送AD MAX用户。在这个特斯拉FSD即将落地中国的紧急时刻,再不搞端到端的模型,就又一次被行业甩在了后面。



加大投资、组建团队,可以说理想汽车对端到端模型的重视程度已经放到了全公司最高的级别,目标就是把自己的智驾路线拉到所谓的“正轨”上。


可“规则控制”的老传统代码方案也曾是“正轨”,端到端只是目前“前景最大”的方案而已。


谁都不知道下一步还会出现什么新的技术路线,大幅度投入进端到端的方案中,可能也会是竹篮打水,但没有车企能承担错过这一风口的代价


理想做好了全部的准备,但也不过是其中的一员,跟风而已,谈“正轨”为之尚早。

深潜atom
科技趋势 财经动向
 最新文章