自动驾驶的三个临界点

科技   2024-07-26 19:01   广东  
最新百度的无人驾驶萝卜快跑Robotaxi项目在落地应用的过程中出现各种状况引发行业内的热议,无论是在技术层面还是社会影响层面又一次让自动驾驶行业甚至是人工智能技术应用有了新的思考。技术的发展是为提升社会运转效率而存在,而社会的运转效率反作用
技术的进化,两者之间存在一定的联系。当自动驾驶行业进入理性发展期之后,一边是人工智能行业的突飞猛进,一边是自动驾驶行业陷入工程化的漩涡。甚至有人会说,自动驾驶的场景已经挖掘殆尽故事已经讲完,剩下能做的只是不断的优化和测试,所以会出现各种内卷。自动驾驶创业公司面临生存困难,同时自动驾驶技术面临转向困境。看似一片荒凉的背后其实蕴藏着巨大的能量,这个能量是可以提升社会运转效率,正如物理领域的临界点。例如在一个磁性材料里面每一个电子自旋的行为在相变点之上和之下并无多大区别,但决定整个体系宏观性质发生定性改变的是随着空间尺度的扩展和自由度的增加,其有序性是增强还是减弱。
第一个是自动驾驶技术的临界点,从技术层面来看,同样是智能化,大语言模型的智能化效果突飞猛进,而自动驾驶的进展似乎在负重缓行,虽然两者之间具有一定的行业特殊性,但是在人工智能这个大的框架内,对智能的认知是一致的,尤其是基于Transformer这种神经网络架构被引入到自动驾驶领域后,两者之间的鸿沟逐渐在收敛。自动驾驶算法网络训练架构和自然语言处理一样,也是从监督学习逐渐转向生成式框架,模型的参数也是不断的增加,可以看出自动驾驶的算法范式在向自然语言处理领域靠拢,这也是端到端自动驾驶路线又一次火热的根本所在,端到端的方案可以在神经网络中利用梯度传导从局部优化到全局优化,也是和以往工业时代引以为傲的模块化产品研究思路完全不同的一条路径。

在人工智能行业,大模型的再次火热让机器智能看到通用智能的新曙光,数据和算力的加持下大力出奇迹让机器产生智能。自动驾驶行业紧随着人工智能技术的发展迎来新的契机,在大语言模型领域,模型的运行范式和人类的思考过程相似,基于以往的经验,也就是用数据进行训练,经验会影响模型的偏好,如果出现错误,模型不会自动进行思考去判断和修正。面对智能化这座山峰,从符号主义、联结主义到大模型,每一条路径都是攀登山峰的一个方向,自动驾驶也是同样的逻辑,端到端方案本质上是一种类人的智能,首先是有利于机器系统和用户之间建立信任的关系;其次通过数据和算力的不断积累无形中提高了自动驾驶的期望,也就成为行业热捧的方向。
然而,从技术发展的历程中亦或是哲学认知的阶段性来看,随着自动驾驶新技术的推广应用,可以预见的是首先是端到端并不会是自动驾驶的终极方案,而只是众多方案中可期望的一种;其次端到端自动驾驶方案并不是万能钥匙,也一定存在天生的缺陷或者挑战,例如数据的问题、算力问题、开发方式以及组织架构的调整等等;最后是自动驾驶行业对于端到端方案的期望过高一定程度上会误导自动驾驶的产品应用,这一点从特斯拉的2024年Q2的财报中也可以看出一些端倪,其端到端自动驾驶方案并没有挑起资本市场太大的兴趣。

在众多的人工智能路线之中,大模型涌现出的智能是依赖更多的数据、更多的参数,这条路径比起人工设计更能带来智能水平的提高。OpenAI推出ChatGPT大模型的成功,很重要的一点是OpenAI在早期坚定的选择了这一路线,ChatGPT的出现是继2000年左右神经语言模型问世之后,又一次成为自然语言处理技术的临界点,也是将自然语言处理带进新的技术发展阶段。虽然大语言模型不能直接移植到自动驾驶领域,但是自动驾驶作为人工智能技术的一个应用子集,在解答智能的思路上是和自然语言处理相通,例如Transformer架构的引用、通过增加模型规模和数据量提升模型的性能。再加上特斯拉在自动驾驶领域的影响,也将为端到端自动驾驶方案添一把火。所以,从人工智能技术发展的层面来看,自动驾驶技术将进入一个临界点,同时也蕴藏着新的能量,自动驾驶系统的智能化也进入新一轮的增长周期,进而影响整个自动驾驶行业的发展方向。

第二个是自动驾驶的社会影响的临界点。一般来说,自动驾驶技术在乘用车领域的商业化应用可以分为两类,一类是自动驾驶技术面向To C端的产品主要以辅助驾驶为主,可以完成高速、城市点对点和泊车方面的驾驶任务,对于自动驾驶系统的性能参考仍然是以人类驾驶员的表现为目标,所以会衍生出各种接管率、测试里程等评价指标。也就是说,从本质上来看,是以人类智能去验证机器智能,这种方法类似于计算机领域的图灵测试,关键问题在于无法将自动驾驶系统的发展水平进行定量分析。也就是说,自动驾驶系统的智能化水平是无法通过接管率或者测试里程来进行评价,尤其是大模型和端到端方案的应用。如何评价或者定量分析自动驾驶系统的智能不能简单的参照智能对话,需要从更多的维度去分析。从广义的时间段、空间领域和人类群体三方面去测试,即所有的人类在所有时间和空间中都分辨不出人与自动驾驶系统之后,才算其人类智能与机器智能等价。数据不仅是测试里程和接管率两个维度,而是以不同的人类驾驶员、不限定的运行时间、不确定的运行空间三个坐标进行评价;
另一类是面向To B端的高级自动驾驶,最常见就是Robotaxi的形式在各个城市遍地开花进行运营服务。前面提到,随着大模型和端到端方案的火热,自动驾驶技术进入一个临界点,不管是跟风还是引领,自动驾驶行业的头部企业似乎在刻意引导这一临界点的变化,从而加速自动驾驶行业的变化。在社会影响力方面,社会运行效率的提升不是一蹴而就,而是一个缓慢的过程,在这个缓慢过程中仍然是以人类为主。以瓦特改良蒸汽机为启动标志的第一次工业革命,开始于18世纪60年代,完成于19世纪40年代,而第二次工业革命是从19世界下半叶开始到20世纪初完成,第三次工业革命是从二战后到20世纪70年代,将社会的发展周期拉长可以看出一个规律,人类社会的运转效率在提升并且完成迭代的周期也在缩短,但也不是几年之内可以完成社会效率的提升。这就需要自动驾驶行业对社会运转效率的实质性提升周期有一个大致的时间范围,而不是拔苗助长式的空欢喜一场。Robotaxi的运营和人类出行服务两者之间形成了竞争关系,站在Robotaxi运营者的角度是想一夜之间用Robotaxi替代所有的出租车或者网约车将Robotaxi进行规模化应用,最终形成出行市场的垄断,而站在运营管理者的角度,无论是高科技的Robotaxi还是传统的出租车都是社会运行的组成部分,两者之间是一个平衡的关系,而不是竞争,Robotaxi永远不会完成替代出行驾驶员,只是以另外一种形式出现。所以,从社会或者商业层面来看,自动驾驶行业也出现了临界点。各个城市运营的Robotaxi、自动驾驶示范区从封闭逐渐走向开放道路、L3级自动驾驶的准入等等一系列的社会变化都指向同一个问题,那就是自动驾驶的商业临界点的到来,也就是自动驾驶技术对整个社会运转效率提升周期的最高点。

第三个临界点,自动驾驶运行的思考逻辑。正如在AI领域一样,一旦AI跨越临界点将迅速成为与人类并驾齐驱的信息处理者,将人类的思考过程转移到GPU的计算之中,自动驾驶也是同样的逻辑,将人类驾驶任务的过程转移到GPU的计算之中。前段时间,某新势力造车企业的专家将自动驾驶系统划分为两个子系统,系统1的特征是反应快,但要改变比较慢,主要完成一些下意识地完成已经熟悉的工作,不假思索地回答问题,系统2需要深度思考,完成一件事情的速度比系统1要慢,但是可以更快的改变做法,主要完成一些逻辑和需要语言描述的问题。这两个系统其实不能以系统的思维去看,更多的是是两种思考的逻辑或者运行范式。
这个分类参考Daniel Kahneman的作品《思考,快与慢》,深度剖析人类思维的运行过程。按照Daniel Kahneman的论证,人类的思考过程是分层级,两者之间是可以相关转换,所以两者之间也会存在一个临界点。对于自动驾驶系统或者AI系统来说,如果要实现类人或者超人的智能,两个系统的思考临界点就是关键。很显然,目前自动驾驶无法将辅助驾驶和高级自动驾驶的临界点找到。



每个人都是生活实践者与行业观察者
欢迎转发并关注 
汽车行业观察者联盟 





汽车观察者联盟
聚集产业发展变化,打造第三方独立意见平台,交流、共享促进产业的发展。