大模型干掉算法工程师?

文摘   科技   2024-06-04 11:31   北京  

作者:钟声(微信:zsheng518)
编辑:Mark
出品:红色星际(ID:redplanx)
头图:征程合作伙伴图片
红色星际小程序/移动端快报

据悉,某新势力开始对智驾业务进行组织架构的重组。这次重组是以端到端为重心,对感知、规控、地图等部门进行了改组,以便组织架构适用于端到端的研发。其中变化比较大的是规控部门,规控直接改组为交付部门了。

从该新势力这次动作来看,端到端并不是一次简单的进行技术切换,想要做端到端,需要先行调整组织架构。以往按感知、规控、地图等功能划分的组织架构,适用于传统手写规则的研发方式,而端到端是基于数据驱动的,传统的组织架构并不适用,新的研发方式需要重组出新的组织架构。

该新势力并不是唯一一个为了端到端做出组织调整的。另一家新势力更激进,内部All in端到端模型,开始大规模裁减工程师规模,连感知算法工程师都裁减。据悉上周创始人体验了内部研发的端到端模型之后,体验的反馈不错,然后继续裁算法工程师。(交流新势力情况,请加作者微信:zsheng518)

在去年特斯拉发布FSD 12的时候,算法工程师圈子就在担忧一种现象:如果未来智驾都用端到端模型做了,算法工程师们该怎么办?从现在的形势来看,未来已来。


1. 组织架构先行

某新势力在自研智驾上投入可谓不小,名列业界前茅。本身该新势力在业界以慷慨花钱闻名,创始人对智驾的支持非常的慷慨和包容,要钱给钱,要人给人,要资源给资源,智驾需要内部其他部门配合时也会亲自去协调。

不过,过去两年该新势力在智驾上却颇受争议。争议的一个关键点,投入上位居业界前列,技术成果却没有进入第一梯队。

按说该新势力的智驾团队的技术能力并不差,智驾的一号位是天才少年出身,算法能力在整个全球华人圈子也是大牛的水平,感知、规控用的也都是闻名业界的能手。整个技术团队拥有顶尖名校、博士title、paper大拿的人非常多。

一个带有“星味”的技术团队,在智驾上的表现却是节奏慢、效率低,进度上落后于第一梯队。在第一梯队都开始卷城区NOA的时候,该新势力才做完高速NOA,在技术节奏上落后第一梯队接近一年的时间。

在智驾行业,有时候“顶尖名校、博士title、paper大拿”也往往对应着另一个概念,这类所谓的“大牛“在量产上干得并不好。一个重要的原因是“大牛“兴致偏向搞科研、发paper,而量产是充满了苦活脏活,”大牛“们干起来并不适应。

另外,第一梯队之所以能做的好,一个很重要的原因是内部用类似于军事上强行军的风格搞研发,对SOP的节点抓的非常紧。而该新势力在抓SOP节点上,就比较几个月的现象,在内部。

内部无法给予压力,就只能等外部的压力了。

到了2023年,第一梯队在城区NOA上的快速推进,高阶智驾都开始卷城区NOA,使得该新势力的智驾团队感受到了压力。如果在城区NOA上跟不上节奏被拉大差距,无论对内还是对外都交代不过去。其实该新势力内部也开始着急,一度传出高层接触供应商准备联合开发城区NOA。

感受到压力的智驾团队,从23年开始风格突变,斗志拉满。智驾的一号位亲自带队小黑屋集中开发。通过强行军突击开发的方式,终于在24年把城区NOA量产上车。

众所周知,智驾的技术路线是一波一波的,所以智驾是是车轮战,无图城区NOA已经接近下半场的尾声,端到端正式登场,成为要卷的下一轮技术路线。在无图城区NOA上,该新势力是通过补课的方式过关。在端到端上,不敢再有丝毫怠慢,也开始撸起袖子玩命卷,力争在端到端上进入第一梯队。

在近期该新势力的一次内部高管会上,智驾一号位做汇报时表示将押注端到端,并对智驾的组织架构进行重组。

以往智驾的组织架构都是按功能来划分,按感知、规控、地图等功能来建立组织架构,这适用于传统手写规则的研发方式,而端到端是基于数据驱动的,传统的组织架构并不适用,需要重组出新的组织架构。

该新势力以端到端为重心进行重组,感知升级为大模型部门,规控改为交付部门,地图变时空信息部门。

从该新势力这次的重组来看,规控的变动比较大。众所周知,以往规控在智驾行业的需求比较大,属于比较稳定的,而现在规控用端到端模型来做,成了最先被干掉的。

类似这样的组织架构调整,预计陆续会在行业内发生。

2. 竞争的新范式

端到端模型,将引发智驾行业竞争的新范式。无论是自研的新势力还是头部智驾公司都在调整资源,以应对新一轮的技术竞争。

传统的智驾方案是基于规则的,研发方式主要是靠工程师手写规则。大部分公司都是靠堆工程师去竞争,堆的越多规则写的越好。所以也诞生了人海战术,谁投入的人力最多,谁就更能赢得竞争。正是这种竞争范式,成就了资源最雄厚、最擅长人海战术的华为。

而端到端的研发是基于数据驱动,传统的堆人头的研发方式效果不大了。AI人才、算力、算法和数据,是端到端最核心的四要素。

这将决定企业的投入方式,也就是把钱花在什么地方上。传统手写规则的研发,大多数都是把钱花在了工程师身上。虽然大家都喊数据+算法的飞轮效应,但大部分都是PPT。

而到了端到端,智驾开始进入数据+算力的“暴力美学”催化的时代,这将是一个硬性门槛。一个典型的案例是特斯拉,在马斯克去年8月直播FSD的时候,特斯拉即将上线由一万个英伟达H100组成的GPU集群,来训练新版FSD系统。

特斯拉早期的GPU数量是一千五百,到了FSD 12时已经增长到了 1万+。而今年马斯克更是宣布将会投资约一百亿美元购买GPU,用于AI的训练和推理,当然其中包括用于xAI的Grok模型,而推理主要用于智驾。

可以预见的是未来可能会出现一种此消彼长的局面,花在训练数据算力上的钱占大头,花在工程师身上的钱占小头。这也是一些自研的新势力开始裁减工程师规模的原因,每年投入研发的钱是有限的,花在算力上的多了,花在工程师上的就少了。

无疑工程师们面临端到端模型的挑战,工程师们在新的技术范式冲击之下,需要转型。面临挑战和转型的不止工程师,还包括已经成功取得领先的头部公司。

这并不是一件容易的事情,不仅意味着巨大的沉没成本,而且极易引起内部的阻力。各职级的leader都是在智驾过去手写规则的时代立下战功的,打破重组组织架构就意味着动了这些leader的既得利益。

而人性本质上最擅长的是对过去成功路径的依赖,最抵制的是革自己的命。

结束语

现在业界流传一种观点——端到端模型将会给智驾带来颠覆性的体验,其实这种颠覆不仅表现在C端用户的使用体验上,而是整个智驾的行业生态上,从企业到工程师都要做出变化。

面对新的技术范式,企业需要调整组织架构,重新分配资源。而算法工程师们也需要在新的技术范式之下积极的转型,寻找自己新的定位,找到能够发挥的价值点,才能走好自己的路。

-END-
打开移动端,查看更多内容
红色星际小程序/移动端快报

加作者微信

关注我们,获取更多深度解读




















































红色星际
让更多人,更深入地了解自动驾驶行业!
 最新文章