打开自动驾驶的正确方式

科技   2024-07-05 19:00   广东  
眼花缭乱的自动驾驶技术和产品宣传与黯然伤神的自动驾驶公司之间的纠葛。
自动驾驶作为汽车智能化的关键支撑,既是人工智能技术的应用载体也可能是新一代智能移动终端。自动驾驶技术从实验室到产业界的迁移过程中,车端算力、数据量以及算法网络架构也同步在变化。人工智能的火热带动自动驾驶可谓是汽车行业的塔尖科技,从自研还是合作到技术实现路径的探讨和争论,毫无疑问自动驾驶的未来是光明的但是过程似乎是痛苦的。
不管是汽车行业还是人工智能领域笃定自动驾驶很重要,但是面对自动驾驶的商业化的速度确实阴云密布。在这个发展的过程中自动驾驶行业出现几个值得思考的现象:
第一是自动驾驶技术在市场推广过程中出现各种出乎意料的操作,例如,岚图汽车展示在悬崖边的泊车技术、各车企直播自动驾驶功能在闹市区的性能表现、无人驾驶实现载客商业化运营反而导致交通拥堵,甚至出现某品牌在为消费者演示自动驾驶功能,刻意不接管导致发生事故;
第二是自动驾驶创业公司竞相寻求上市,并且进程在加速,每家自动驾驶创业公司都宣称已经获得了量产车型的订单,以此进行资本市场的新运作,反观在消费市场将自动驾驶功能进行普及的车企却是寥寥无几,一切仍然停留在期货状态;
第三是自动驾驶产品的工程化速度在加快,也就是自动驾驶行业淘汰也在提速,工程化即为六便士,而对汽车智能的探索如登月,二者不可兼得。这也就为自动驾驶相关的创业公司造成进退两难的境地,退一步登月面临无米之炊,进一步弯腰捡六便士将面临工程化的漩涡,唯一能做的就是不停的适配各种demo,无限期的拖延死亡时间。登月侧重于理论研究和方法探索,而工程化是更侧重组合创新提高产品的生产效率,从产品层面进行内卷。所有的这些现象背后透露出一个自动驾驶行业的焦虑,看似一片形势大好,实则每个人表现出或多或少的迷茫和空虚,甚至有不少人离开自动驾驶行业转向大模型、机器人领域。

自动驾驶行业经过近十年的发展后出现这些现象的背后其实隐藏着一个自动驾驶行业一直没有解答清楚的问题,那就是研发端对智能的定义和消费者对机器智能的理解。再进一步此问题可以分解为两个层面,一个是供给端交付给用户什么样的智能产品,也就是人工智能的工程化的能力体现,另一个用户真正需要什么样的智能产品,这一点并不是简单的用户调研询问获得或者行业内外的参考对标,而是基于汽车和智能化技术的发展趋势预估一个值,正如乔布斯的经典言论:不要问消费者想要什么,一个企业的目标就是去创造那些消费者需要但无法形容和表达的需求。所以,能问出来或者表达出来的需求其实都是过时的需求,从产品的始发就已经落后了,更不用讨论创新。尤其对于自动驾驶技术的产品化,无论是咨询公司还是车企对于用户需求在现阶段都没有建立完整的理论,大多是还是沿用传统的方法或者直接借鉴互联网行业,这样的产品势必会出现一个期望和实际之间的落差。
从研发产业端来看,自动驾驶的需求最开始是完成超越人类的驾驶任务,比人类驾驶员更安全,而随着产品化落地的过程中,自动驾驶的需求转变为类人驾驶,自动驾驶系统的智能主要体现在达到人类驾驶员一样的性能水准。站在哲学的角度,人类对事物的认知是有阶段性的,也就是大家对自动驾驶的期望也是在不断的变化。所以,对于一个人不忘初心很难,同样对于一个行业或者公司也很难,在面对复杂环境约束中,没有一劳永逸的模式也没有一招制敌的必杀技。

另外一个问题,自动驾驶的智能体现,也就是智能在自动驾驶领域的工程化,将研发端的智能以产品的形式应用到消费市场,从而提高社会运转效率。如何实现这个过程,不仅需要在技术方面的创新,还需要新技术的市场推广过程中找到打开自动驾驶的正确方式。

现阶段,自动驾驶产品其实是无法证明自身的安全性,无论是从软硬件的组成还是测试里程的数据,自动驾驶系统始终无法证明自证安全性,总是存在长尾问题,。所以,在以人类驾驶员为核心的辅助驾驶中,智能化的参考对象是人类驾驶员,这样也可以更直观的进行自动驾驶技术的推广,自动驾驶是辅助人类驾驶员,是人类驾驶员能力的延伸,而非替代人类驾驶员;下一阶段中以自动驾驶系统为核心的驾驶任务中,人类驾驶员仍然是在驾驶任务闭环之中,尤其是端到端自动驾驶方案再次应用之后,无形中提高了自动驾驶的产品落地门槛,智能的天花板依旧存在,通过大量数据的训练,端到端方案确实可以在某些场景中表现达到超越人类驾驶员的表现,但是无形之中也无法保证自动驾驶系统的下限。在这个机理之中,自动驾驶系统的安全性仍然是一个无法证明的问题,了解这个问题需要回归到人工智能的领域,由人工智能推导出自动驾驶的智能方向。

自动驾驶虽然和自然语言处理不是同一个领域,但是核心一致的都是对时间和信息的处理,在这里空间是可以转化为时间的维度,信息是用来量化不确定性,自动驾驶需要做的事情就是将时间和信息进行有机的处理组合。系统越复杂不确定性越高,同时信息也越多。根据香农的信息熵原理,一条消息i的信息量是这个事件发生概率pi的函数I(pi)。如果一个事件有i=1, 2, , n个不同可能性,那么平均的信息量就是:

。而如果我们要求两条不相关的消息i和a的信息量等于它们之和,这就会要求I(piqa)=I(pi)I(qa),由此得知I(pi)是一个对数函数。
在信息处理领域,一条消息中包含的信息量,只和这个概率有关,而与这条消息是通过电话、文字、图片还是口头传递的无关。这正是反映了信息这个概念特别普适的一面。所以,人类一切活动都伴随着信息的传播和演化,自动驾驶也是同样的逻辑。仍然以人类为参照物,人类的生物信息传递通过遗传和变异的方式,而在社会活动中,语言的出现可以描述人类复杂的场景,也为人类提供了交流和思考的方式,不断促进人类的进步发展。从人类的出现到至今,信息的本质没有变,变化的是信息复杂度,信息的传播和处理速度在不断增加。自动驾驶作为信息处理的一种方式,在自动驾驶中,量化驾驶任务计算的复杂度,是在给定基本单元的情况下,需要多少次运算才能完成这个任务,而驾驶任务信息复杂度则是定义为需要多少次运算才能从一个给定的初始条件出发生成出这样的信息。在自动驾驶中,需要根据环境信息、自车位置、交通标示信息等等信息系统计算得出一个推荐的行驶路线,从数据的并行处理效率中来看,这种并行计算复杂度的能力系统远超于人类大脑处理的水平,人眼看不到的障碍物,自动驾驶系统可以识别出来,人类大脑没有反应过来的操作,自动驾驶系统可以反应。
这种针对驾驶任务复杂度的计算被很多人认为是自动驾驶系统的智能,然而在信息处理的来看,衡量驾驶任务的复杂度不仅是计算的复杂度,还应该包含输入和输出的信息的复杂度,自动驾驶任务的计算复杂度很高,但是输出的信息却是严格限定的,在一定的时间范围内拟合出一条安全的行驶路线。正如在人工智能领域机器人下棋一样,机器对于信息处理的复杂度已经完全超越人类,熟读的棋谱规则远远超过人类。但是信息的输出只限定于下棋这个特定的任务。自动驾驶系统也面临着同样的问题,识别物理世界的精度更高,运行的信息计算逻辑更复杂,但是信息处理输出的结果就是单一的驾驶任务。自动驾驶和下棋的例子中可以看到一个规律,那就是整个信息链路中都存在一个bug:输入、处理和输出三个环节中,至少一个环节的复杂度受到了限制,导致机器整体上能够完成的任务受限,只能一次性地完成一个任务,然后把信息再次交换给人类。

自动驾驶的方法随着人工智能技术的变化而变化,尤其是大语言模型的出现,让人工智能看到通向通用智能的曙光。人工智能领域的大语言模型在信息计算复杂度的基础上解决了信息输入和输出的能力,一个模型的输出就可以直接变成另一个模型的输入,模型之间可以构建复杂的合作网络,就像人类个体构建社会组织一样,形成蚁群智能效应,一个模型加一个模型产生的效果可以大于二的效果。这种方法引入到自动驾驶领域将会产生巨大的影响,可以解决自动驾驶中梯度传递的优化问题,并且Transformer这种架构更适合GPU的计算,也是一种全局的优化。

随着行业对自动驾驶的认知变化以及新的网络架构的应用,自动驾驶体现出的智能会不断靠近人类甚至超越人类,这个变化的临界点在语言处理领域已经出现并且逐步在向自动驾驶转移。所以,打开自动驾驶的方式不仅是将自动驾驶系统认为是一个类人系统,从而和人类驾驶员进行对标或者比较,而是将自动驾驶作为一个信息处理系统,从计算复杂度到信息输入输出的复杂度去理解整个系统。



每个人都是生活实践者与行业观察者
欢迎转发并关注 
汽车行业观察者联盟 





自动驾驶71

汽车观察131

自动驾驶 · 目录


上一篇小鹏为什么没有获得自动驾驶准入和上路试点资格?

汽车观察者联盟
聚集产业发展变化,打造第三方独立意见平台,交流、共享促进产业的发展。