李克强院士:新一代AI驱动的车路云一体化,智能汽车产业化探索的“中国方案”

汽车   2024-07-10 18:38   上海  


7月5日上午,在由WAIC 2024战略合作伙伴商汤科技召开的「大爱无疆·向新力」人工智能论坛上,中国工程院院士、清华大学车辆与运载学院教授李克强分享了智能网联汽车关键技术创新运用方面的现状与思考,以下为演讲实录:

尊敬的各位领导,各位来宾,各位业界同仁,大家上午好。非常高兴能参加本次论坛,也非常高兴能有机会就新一代AI驱动的中国方案智能网联汽车关键技术创新与应用方面的一些工作情况,跟各位交流。

我们都知道,智能汽车是新一轮科技革命的代表性产业,已经引发世界各工业强国之间的竞争,欧盟、美国、日本等国家都有一系列的国家项目或规划。当然,我国也高度重视智能网联汽车产业的发展,它是我国推行的制造强国和交通强国战略的重要任务之一。

智能汽车的发展有不同的技术路径,迄今为止主要还是以单车自主式智能为主。大家通过长时间的实践,也发现这种技术方案还是存在一系列问题,所以也在探索网联协同式智能的研究途径。

在国家项目、产学研合作项目支持下,清华的团队提出了智能网联汽车云控系统,也就是车脑/云脑一体化的技术新思路,创建了云支持的自动驾驶体系架构。

具体说,就是基于新一代的移动通信技术,将车、路、云融为一体,形成实时动态数据汇聚、能提供关键基础服务以及形成协同的感知计算的环境。我们称之为智能汽车产业化探索的中国方案,它的特征就是云支持的自动驾驶系统。

给这个技术方案下一个定义,以“123”来表示。“1”就是车路云一体化架构,“2”是具备两大技术特征“分层解耦、跨域共用”。现在许多单车智能企业有数据并且形成了闭环,对外宣传是车路云一体化,但是大部分方案没有分层解耦,是烟囱型。所以,1和2是我们这个方案的内涵。“3”就是3个标准,也就是在中国的道路上行驶、满足中国的联网要求以及新产品下打造中国的标准,要满足以上3个标准。

未来,在车路云一体化的架构下,汽车的行驶一定是在智能化的基础设施之上,一定是联网运行,一定是会强调信息安全。在推进整个系统的发展过程中,首要任务是进行信息物理融合系统架构的总体设计,然后根据智能网联融合的特点,打造五个新的基础平台。以这几个平台为抓手,形成完整的人、车、路、云一体化的体系。

当然,这是一个复杂的系统,涵盖很多关键技术,包括环境感知、决策控制、芯片、操作系统,以及WAIC的主题——人工智能。针对汽车行驶的感知、预测、决策、控制等一系列的问题,都可以通过人工智能技术来推进解决。

其中,自动驾驶的算法是核心,算法有专家规则型,也有以人工智能为基础的模仿学习型、类脑学习型。清华大学团队也比较早的在强化学习、类脑学习型等领域进行探索。

以交通参与者行为的长时域预测为例。交通行为预测是自动驾驶决策控制的前提,然而,由于交通环境的复杂性,现有的预测方法存在一系列问题,如网络结构复杂、计算成本高、中间变量多以及信息损失大等。

针对这些问题,我们团队提出了时空分离的预测网络结构,将周车的轨迹以及路网结构信息压缩为动态特征量,并在此过程中实现时空模块之间的相互解耦,使得各模块更易于组合或替换,避免不必要的中间态变量,获得更强的场景表征能力。

国际知名的权威行为预测数据集Argoverse有超过340个参赛队伍参加,我们的技术方案在7项指标中排名第一。

还有一个强化学习、类脑智能的案例,在自动驾驶里面,团队用高准确的最优策略进行强化学习求解。强化学习求解在实际应用到工业控制的过程中有一个很大的挑战,就是所谓的“过估计”。贝尔曼算子的存在使算子迭代导致的误差累积增大。现在“过估计”也是各个团队,包括学术界、工业界都在研究的,而在自动驾驶这样复杂控制系统里面,这些问题尤其严重。

为此,我们团队提出了DSAC分布式的、柔性的自动判断准则。SAC是国外所提出的强化学习领域中的一种算法。根据SAC可以看到在强化学习中,算法中的最大化选择器在选择评估行动时都使用同样的Q值,如果把它增加到若干个分布式以后,会发现它可以变成一个分布式贝尔曼算子。

遵循这个思路,估计的误差可以得到一致,信息的实时性,包括准确性、估计偏差方面,相比现有的方法都取得了显著的提升。

现在,大模型是被热议的话题,也是本届大会的主题,我认为落地到垂直领域,进入自动驾驶行业,大模型绝不是只提供娱乐这么简单,更需要关注的是如何做到替代人的感知决策。

在自动驾驶行业谈大模型,在数据、算力、算法层面,各有挑战,并且这一系列的挑战远远不像一般人所理解的那么简单。

目前,单车智能不仅仅是指做单车智能的车企,还有高科技企业,大家都在做或者想做大模型的平台,但是现阶段在原理上仍然存在两大问题。

第一,数据体量有限,无法实现训练数据的海量性。第二,数据种类不全,保证不了数据的完备性,这并不是依靠大量资金投入就能解决的。举一个统计学上的例子,一个企业如果有十万员工,其中有一千位工程师,一种统计方式只统计了九万九千个普通员工,漏掉了工程师,将其统计为零,另一种方式,统计八万普通员工的同时统计到了八百工程师,那么后者的统计结果肯定比前者准确,因为种类更加齐全。

大模型落地自动驾驶也一样,如果只是依靠单一车企,数据再多也统计不全。只有通过车路云一体化的系统,才能够真正意义上覆盖各家车企的数据。更重要的是,整个系统需要路侧信息进行补充,相当于“上帝视角”,看得更远、更全,数据的覆盖更广泛。这不是一家企业靠投钱能做到的。

没有这个体系,数据不全,训练不出可信赖的自动驾驶。毕竟大模型的一个重要关键在于数据的训练,数据有三个要素:海量性、完备性和准确性。如果完备性不具备,系统在很多场合会出现问题。

现在大家谈特斯拉的FSD V12确实取得了很大的进步,对自动驾驶行业是一个鼓舞和激励。

不过行业里也出现了两个不太全面的观点。第一个观点认为,新一代FSD就是无人驾驶,第二个观点认为新一代FSD是单车智能,车路云一体化是可有可无的。这两个观点都不全面。

首先, 特斯拉对于FSD V12的表述并不是无人驾驶,它还是一个高级别的自动辅助驾驶,必须要注意辅助驾驶和无人驾驶是两个概念,大家一定要有正确的理解。其次,现在的FSD不是传统的单车智能,它有“影子模式”+“大模型”,是车和云之间的协同。

此外,如果只是靠一个企业做,没有路侧数据,再多数据也不意味着数据的完备性。不具有数据的完备性,大模型就很难训练准确。

基于上述思考,智能网联汽车国家创新中心根据行业技术发展趋势、整合全行业共识,提出了云控基础平台的新思路。

云控基础平台,将产业链上企业具备共性的技术底座进行打通,形成一个基础平台,包含交通管理、出行服务、娱乐服务,包括自动驾驶。这也就是“中国方案”。

如果各家都做烟囱型的云控平台,不符合技术发展的趋势。只有依托云控基础平台,才能够真正做到众源数据的汇聚,海量信息的打通,时空连续对齐,对于实用化且符合高标准要求的自动驾驶AI大模型的构建、训练与迭代,这些都是至关重要的。 所以建议大家在研发垂直领域大模型的时候,都应该有这样一种思路,否则在技术上还是有很大风险的。

现在国家智能网联汽车中心正在向全行业进行推荐和推广“云控基础平台”的架构和技术路线,包括已经公布的五部委联合下发的车路云一体化城市示范。

在全新的架构和标准之下,车脑、云脑形成有效连接,所有的基础数据都能够实时汇聚,中性、不涉及隐私和保密信息的数据进行共享、交互,从而形成数据底座,支持训练、OTA等等,从而促进行业的健康发展。

目前,端到端大模型是自动驾驶行业绕不开的话题。对端到端的定义,不是一个简单的黑箱化的神经网络,它是全栈的神经网络化,仍然会有感知网络、决策网络、预测网络,是以特征向量的方式减少数据传递过程中的信息丢失。黑箱化是不可解释的,这不符合自动驾驶所需要的高可靠性、高实时性。

因此,我们团队把端到端自动驾驶分成了环境感知、行为预测、决策控制三个模型,强调数据的海量性、完备性和准确性。

这个端到端自动驾驶方案既有分块模型的预训练,也有模块集成的微调,每个模块都是大模型,把三个模型合起来也是大模型,整个系统也是端到端的。同时,我们的端到端自动驾驶系统也在开放道路上进行了测试验证。对于端到端自动驾驶未来的发展,大家要有信心,坚持走有中国特色的道路,并进行持续快速迭代。

例如,清华团队在2018年提出IDC集成式决策控制,在国际上来说也是很早的端到端模型,当时有七百多万参数。自2018年开始,IDC不断迭代,包括关键的核心算法、产业化的应用,都在快速推进。

总的来看,智能网联汽车是自动驾驶发展的新阶段,车路云一体化的智能网联汽车,在系统的定义、关键技术及产业生态等方面具有“中国方案”特色。

同时,智能网联汽车正进入人工智能驱动的「大模型-端到端」发展阶段,重点是要推动主要功能模块的全栈神经网络化和数据闭环的训练,已取得重要的应用进展。

另外,基于车路云一体化智能网联汽车计算基础平台、云控基础平台的建立,我们正在为自动驾驶大模型训练同时打造具备海量性和完备性的智能数据底座,能够真正的促进产业的高质量发展。

谢谢大家。

绝影智能SenseAuto
商汤绝影是加速智能汽车驶入AGI时代的战略合作伙伴,致力于为每一个人提供灵活自适应、深度个性化、安全可信赖、有人文关怀的未来出行方式。
 最新文章