理想汽车高管:未来每年不拿出10亿美金投算力,将会被淘汰

汽车   2024-08-08 15:43   北京  

编者按:腾讯汽车编辑部把过去十年的电动化浪潮称之为中国汽车工业的"狂飙年代”,如今,站在2024年这个被誉为"智驾元年"的历史节点,我们不禁要问:产业主要参与者将坚持怎样的技术路线?又如何构筑各自的竞争壁垒?腾讯汽车特别推出智驾系列策划,通过访谈、实测、横评、综述等多种方式,力求站在历史的原点,进一步洞悉汽车工业未来十年可能发生的巨大变革,从而为读者和行业提供更全面的内容导引,能够为行业留下宝贵的历史注脚。

腾讯新闻《远光灯》作者 傲敦

编辑 石丁

“端到端”(End-to-End,E2E)解决方案正在成为业内公认的智能驾驶最优解,但当人们尝试拨开迷雾探寻真相时,一万家车企眼中似乎有一万种“端到端”。

去年12月,特斯拉推出 FSD V12并提出端到端方案,端到端一词一夜间被智驾圈高高举起;紧接着,华为、小鹏、地平线、蔚来等企业先后提出端到端解决方案,7月底,小鹏汽车董事长、CEO何小鹏称,小鹏汽车是全球唯二实现端到端大模型量产落地的车企。

7月5日,理想汽车发布了基于端到端模型、VLM视觉语言模型和世界模型的全新自动驾驶技术架构,初版已经在7月底开始向千人规模的测试用户推送。李想在今年6月预告说,该方案最快今年、最慢明年上半年全量推动。

据理想汽车智能驾驶研发副总裁郎咸朋介绍,上述架构设计受到诺贝尔奖得主丹尼尔·卡尼曼在《思考,快与慢》中提到的快慢系统理论启发,在自动驾驶领域模拟人类的思考和决策过程,形成更智能、更拟人的驾驶解决方案。

快系统,即系统1,由端到端模型实现,接收传感器输入,并直接输出行驶轨迹用于控制车辆。慢系统,即系统2,由VLM视觉语言模型实现,其接收传感器输入后,经过逻辑思考,输出决策信息给到系统1,双系统构成的自动驾驶能力还将在云端利用世界模型进行训练和验证。

与业内友商横向比较,郎咸朋强调,理想汽车的端到端模型是第一个One Model端到端模型,跟其他分段式模型有很大区别,“One Model是传感器数据输出直接出轨迹,中间没有任何的其他的规则和模型,其他的端到端可能还需要用一些规则来串一串”。

从公开信息看,业内认为小鹏汽车和华为是分段式端到端。小鹏汽车量产上车的端到端大模型由神经网络XNet+规控大模型XPlanner+大语言模型XBrain构成;华为端到端系统的感知部分采用GOD(General Object Detection,通用障碍物识别)大感知网络,决策规划部分采用PDP(Prediction-DecisionPlanning, 预决策和规划)网络实现预决策和规划一张网。

过去,智能驾驶系统可分为感知(Perception),预测(Prediction),规划(Planning),控制(Control)几个主要模块,几个模块分别负责不同任务,这也被称为自动驾驶规则时代。而如今火爆的端到端,准确说是一个AI大模型,它可以通过深度学习技术,把原始输入数据直接生成输出结果,输入数据即摄像头、激光雷达等传感器获取的数据,输出结果及加速、减速、刹车等驾驶行为。

在实践过程中,上述构想并不能一步到位,单在技术端就要解决模型架构、数据、工程验证等系列复杂问题。从用户体验层面看,端到端解决方案的终极目标是无限接近人类“老司机”,甚至通过不断挖掘能力上限去超越老司机,不过这个目标何时能实现业内尚无定论。

在理想汽车智能驾驶技术研发负责人贾鹏看来,目前大家到了智能驾驶无人区,“别人也没说它的端到端是怎么做的,大家也‘盲人摸象’”。不过他认为,端到端的意义并不是说一个模型两个模型,它最大意义是从本质上改变了整个研发流程,“有了划时代的AI流程之后,才有可能让你的系统真正拥有像人类一样的驾驶能力”。

端到端虽然被认为是智驾最优解,但目前仍处于早期阶段,业内尚无一个明确定义或评判标准。郎咸朋认为,目前国内汽车厂商在端到端的同一起跑线上,但如果看One Model,可能理想会领先一些。在他看来,理想汽车的端到端方案是当前在物理世界实现人工智能的最优方案,“因为它非常好的模拟了人类认知和思考机制,真正的让系统拥有了像人类思考和理解世界的能力,这就是双系统的优势”。

而从更长远看,端到端或许是一场资金实力的比拼和较量。郎咸朋认为,或早或晚,头部玩家一定都会做端到端方向,届时差距也一定会被拉大,真正到了人工智能时代,大家就拼两件事:一、有没有足够多的高质量数据;二、有没有与之相匹配的充足的训练算力集群。

“大家到最后做的事拼算力和拼数据,但这两件事门槛非常高,如果资金储备不足以支撑每年训练的花费,你是不可能玩到后边的L3或L4的,如果说车企保有量不多的话,数据其实也支撑不住训练需求。”郎咸朋称,按照初步估算,目前理想每年投在训练上的花费是10亿人民币,预计将来花费要到每年10亿美金,“这只是训练算力的费用,还不包括其他的人员各种费用,所以说如果你一年拿不出10亿美金来去做训练的话,可能会在将来的自动驾驶的竞争当中会淘汰。”

以下是腾讯新闻《远光灯》等媒体与郎咸朋和贾鹏的对话节选(经编辑):



大家都在“盲人摸象”,
理想交出了最优方案


问:从传统智驾技术要转到端到端技术,契机是什么?理想推的这套技术方案与特斯拉、华为和小鹏相比优劣势在哪?

郎咸朋:至于这套系统架构方案的优点,要从我们去年八九月份对自动驾驶的一个思考开始讲起。去年一年时间我们做了三代的技术研发,从最开始做高速,一直到做城市的自动驾驶,城市里边我们先是用了NPN(NeuralPriorNet,神经先验网络)这种带有场景的方案,又转换到现在的无图方案,再迭代到现在的端到端方案。

在这个过程当中,我们发现这套方案对于后期的L3、L4级别自动驾驶来说,它还有一个非常大的缺陷或问题。问题在于,我们人对于未知的场景和没有去过的地方可以理解,正常开车的稍微适应一下就行。但无论是现在的端到端方案还是无图方案,本质上还是看过的场景或者训练过的数据,才能执行的比较好。如果一个新的场景,可能他就没法正确的处理,但是如果想做到完全把车交给系统替代人来开车的话,那么我们的系统它就得像人一样有应对未知场景的能力。

举个简单例子,就是咱们的红绿灯,天津红绿灯和其他地方红绿灯都不一样,天津的红绿灯是一个进度条式的红绿灯,但是其他的咱们地方要么是灯泡似的,要么是倒计时的,这种很好理解。但是我相信任何一个有正常常识的人去了天津,你一看到那个路口立了这么一个东西,你也会认为它就是红绿灯,并且根据红绿灯的指示,正常的停止启动。所以我们需要让系统也有这种对场景的理解,或对这种知识的逻辑推理的能力,这种能力怎么去获得?我们在这个时候看到双系统的理论,它是对人类的认知的这种机制进行了一个很好的阐述,快系统做出及时的处理响应,慢系统对应复杂的思考逻辑判断,双系统共同的组成了人类认知和思维的机制,那么我们就想这套系统的理论怎么运用到自动驾驶上来。

那么系统一到底用什么来实现系统化,到底用什么来实现?我们最终选择了系统应用端到端模型来实现,系统二用VLM的视觉语言大模型来实现,这是我们具体的两个实现的方式。我们经过预研和研发,现在这两套系统我们都落地在我们真正的量产车上了,我们认为它是当前在物理世界实现人工智能的最优方案,因为它非常好的模拟了人类认知和思考机制,真正的让系统拥有了像人类思考和理解世界的能力,这就是双系统的优势。

我们的双系统有一些独特的地方,第一我们的端到端模型是第一个One Model的端到端模型,跟其他的分段式还是有很大的区别的。第二,我们的 VLM模型是第一个能在车端部署并且量产的模型,其他的模型可能在他自己的训练集群上去做训练做测试,但真正用Orin X 这种量产的车端芯片去优化并且部署到车上的我们是第一个,而且这个模型足够大,有22亿的参数量,这已经是一个实际意义上的大模型了。我们这套双系统也是我们第一个提出来并且落地的,从系统架构到系统实施上,我们有自己的一些优势和特点。

问:端到端加视觉语音模型,这套方案它能够支持L3、L4的开发吗?

郎咸朋:至少站在当下来看,我觉得方式上应该是可以,但具体是端到端加VLM两个模型还是两个模型合一,还是更大参数的模型,或其他结构,我觉得可以慢慢去迭代,但我觉得整体的思路上应该是可以的。

问:系统一和系统二是如何分工的?

贾鹏:我们是两个模型,有两颗Orin X ,一颗是跑端到端的模型,模型相对小一些,大概三四亿的参数量,然后跑到十几个赫兹,他会高频的去控车,因为要实时控车。VLM虽然参数量大,但也不能一两秒钟控一次,现在我们把它优化到大概3.4赫兹的准实时水平,大概三百毫秒的延迟。他每时每刻都在做决策,输出两个决策,比如一个是让行减速还是避让,然后第二个它会给出参考的轨迹,比如说我是朝这条车道还是朝那条车道,这两个信息都会直接喂到模型里,然后同时出结果,大概是这么一个结构,系统一并不是完全采纳系统二的意见,系统二是增强系统一的决策。

系统一发挥主要的作用,系统二只是一个参考或者是咨询特殊情况,到L4的时候,系统二发挥作用会更多,不是说系统二时时刻刻都在控车,而是它真的在发挥非常重要的决策和判断作用,在一些未知场景下,系统二的能力决定了能不能到L4,但系统一的基础能力是L3的必要保障。

问:未来两个系统会合二为一吗?

贾鹏:这个是我们在预研的下一步,其实现在的想法量产的还是两个模型,目前无图6.0已经全国都能开了,我们想端到端+VLM这套东西可以做到全国都比较好开,那再往后,到底怎么做一个量产级的L4,我们的思路可能是把模型的规模变得更大,容量更大,同时把它的帧率变得更高,或者有机会是不是这两个模型可以合一,是否是走系统一还是系统二让模型自己去决定。所以如果将来有更大的算力的芯片,有更好的平台,这个就可以发挥极大的作用。

问:VLM为什么不能被称为是端到端,在我看来它也是一种端到端。

贾鹏:如果将来的算力足够大,VLM本身能跑到实时,对比如跑到十几赫兹甚至20赫兹,或许它也可以做到端到端的快速响应,但目前VLM其实是多轮问答,我要问它在这样的工况下我怎么开?为什么这么开,开了之后有什么结果?

郎咸朋:其实端到端这个说法,在我们来看,只要是纯数据驱动的模型它就是端到端,它输入就是数据,输出就是结果,只不过这个结果在系统一上是轨迹,系统二的结果是决策,这里再强调一下,端到端到底是多个模型的端到端,还是一个One Model端到端,这是有很大区别的。因为像我们理想这边做的One Model就是传感器数据输出直接出轨迹,中间没有任何的其他的规则和模型,其他的端到端可能还需要用一些规则来串一串。

问:现在这套系统能力上限大概是在哪里?

郎咸朋:现在VLM应该是站在了一个无人区的边界,再往前探索,各家包括我们在内,都要做端到端,但是我相信我们是最开始做的公司,我们在这个过程中还会有自己的探索,现在我们在做的过程当中,就会发现数据规模带来的性能提升,现在还没有看到上限。我们现在还在摸索数据提升和性能提升的这样边界,现在还没有摸到。

我们有个分析,芯片算力是有限的,所以参数规模就有局限性,现在我们是大概三个亿左右的端到端参数规模,三个亿左右参数规模它能吃掉多少数据训练量,其实也有上限,不可能给他无限灌进去,那不可能。

贾鹏:虽然算力提升,但现在对于大模型来说,目前车端芯片更严重的瓶颈是内存带宽。大家真的到了比较无人区的地方了,别人也没说它的端到端是怎么做的,大家也“盲人摸象”。

我们的端到端模型是到了轨迹,轨迹之后加一些安全兜底,因为在模型没有达到上限之前,还是要有一些处理的东西,比如说猛打方向盘这样的事,给他兜掉,这是我们的方案。



端到端最大意义是
从本质上改变了整个研发流程


问:怎么去定义一体式比分段式模型更厉害更高级,端到端最终发展的天花板是怎样,未来还有没有更厉害的模型出现?

郎咸朋:首先我觉得不存在什么好坏,适合不适合,如果说你想做L3、4级别更高级别的自动驾驶,我觉得这种一体式的端到端是你必须要选的模式,因为它不但是选择这个模型本身,它更多是你选择了一种更高级的迭代的或者研发的流程和方式,分段式的和之前的一些模式,他们做L2级别的这种辅助驾驶也是非常合适的。

从端到端开始,它的变化并不是说一个模型两个模型这么简单,而是他整个的思维就是他做事情的研发的流程和方式发生了巨大的改变,这里面没有任何的规则,我能做的是喂给它高质量的数据,再加上训练提升模型能力,所以它能做出更好的规划和决策。

那我要把模型的框架架构进行合理的迭代,最重要的方式是怎么去找到更优质的数据,这个数据一个是量要足够大,二是质量要足够好。我们现在基本上做到300万参数的量级了,而且我们数据的选择是非常有讲究的。首先我们跟我们的产品团队和我们的主观评价团队开车这些人都是老司机,这些人开车的经验是非常优秀的。

他们跟我们一起去制定了一套老司机的标准,比如它的安全驾驶情况,它的这种驾驶的风格,有了几个维度迭代完了之后,我们就拿这个规则去跟我们已有的80万的车主做了一个筛选,90分以上的我们就要,这个片段是需要筛选的。因为我们有这个基数,所以说我们能筛出来高质量的这100万 、1000万的片段,可能表面上看就只有1000万,但实际上它是从12亿公里的数据里边筛出来这么可能这几千万公里的这样一个数据,这是其一。

我们筛选数据的时候,背后有一套自己的工具链,不是说简单的去挑一挑,而是我们也有自己的一些配比和数据的配方,这也很关键。

问:有企业说以前的数据在端到端时代有很多用不上,他们现在正在经历一个最痛苦的事,拆以前的桥,同时在搭新的桥,又要建能够检验它的安全体系,你怎么看这个说法?

郎咸朋:在我看来,他这句话前后矛盾,他是说数据不那么重要,但他这句话又说明数据很重要。实际上对于理想来说,我们早就意识到这一点,自动驾驶最重要的是什么?是人才资金吗?我认为是数据,没有数据的话,将来算法的训练、验证,都是没有基础的。

我们从2019年交付第一辆车开始就去积累数据,并且搭建我们的数据平台。从理想L9开始,我们都是套娃,套娃对自动驾驶有极大的好处,所有的摄像头规格和安装的位置都是一致的,虽然说有细微的长短的差别,但是这些数据我们就完全可以复用了。但是有的厂商他可能有轿车、有SUV,有可能传感器也不太一样,所以说对他们来说可能确实是个挑战。

问:有观点说端到端会简化智能驾驶开发流程,降低人力成本,你怎么看?

郎咸朋:如果一旦用这个方案的话,我们确实用不了这么多人,端到端的整个研发流程简单点说就是挑选数据、训练模型、评估模型、世界模型,世界模型内部叫系统三,它是一个考试系统,系统一加系统二能力是由我们这个系统三去评价和认证的,但是之前来说我们对于这种自动驾驶系统的评价和测试是由人去执行完成的,不管是跑大的路测还是跑场地的什么测试是由人去评价的,但是人是评价不过来的。

全国几百万公里道路一年四季的变化,不可能拿人去跑过来,它不像高速,你在北京的高速跟跟广东高速也差不太多,但是到了城区场景下确实跑不过来,所以说我们有个系统三,它会帮我们去考系统一和系统二的能力,考完之后,如果通过了迭代上线,下一轮就开始了。

在这套流程里,除了研发这些系统平台的过程需要人,其实并没有很多人参与到实际工作中,会大大减少人的使用,对于我们的组织内部的优化管理,人员使用也会有很多好处。所以,我们接下来的一些调整其实也是基于这个业务的变化来去做的,并不是一个大家想象的就是为了调整而调整。

问:从消费者和用户的角度,当端到端技术走向落地的时候,体验是有什么样的升级?

郎咸朋:从用户角度来讲,不管你是端到端还是其他技术,也不看你的技术方案和路线,用户只是需要体验,所以我们将来端到端加VLM这套产品推送给全量用户的时候,希望能给用户带来一个非常老司机的人在帮我开车的一个感受就好了。

用户没有必要知道这到底是什么样的技术,但如果他们有兴趣了解的话,我们可能也有很多的参考。我们不会过分强调对于用户来说,我们用了什么样的技术方案,我们只是跟用户去沟通你有什么样的产品体验。

问:端到端要直接正式推送给用户的话,你觉得好的标准是什么?什么时候可以正式推了?

贾鹏:标准我觉得还是用户体验。我们为什么要有千人早鸟,而不是自己去设定一些接管目标,如果千人用户和万人用户,他们体验都挺好的,我觉得可以推,或者是超越无图版的体验就可以。在现在参与早鸟测试的人当中,我们经过一些评估,它的体验,它的稳定性,它的安全性都已经达到了标准。

问:渐进式的这种方案,它会转向One Model吗?One Model它是一个唯一正确的方向吗?

贾鹏:从我们这个角度上来看,One Model才是端到端,其他的说法其实就不是端到端,但是如果说有人想这么去加也可以,其实我们无图就是分段式的。那时候我们就叫感知模型和预测规划模型,我们就这么叫来的,但你说给他一个叫什么分段式,也可以。

端到端它的意义并不是说一个模型两个模型,它最大意义还是说它从本质上改变了整个研发的流程,有了划时代的AI流程之后,才有可能你真正的去让你的系统拥有像人类一样的驾驶能力。

之前只是叫功能,我有一个过匝道的过收费站的功能,但现在我有一个老司机的驾驶能力,大家可能等会能去体验我们端到端,当然这个车我开的是非常多的,可以说我们从第一个版本歪歪扭扭的开,到现在也开得很好,经常会惊讶于这个模型的它的一些表现和能力。

80万数据的时候,它还不会过环岛,但是给了100万的时候,突然有一天就会过环岛了,其实我们也没有刻意的去弄一些什么环岛数据给它,只是不停的喂数据而已。这就跟你教一个孩子一样,今天他上个什么课,明天上什么课,突然有一天他过来给你飙两句英语。

端到端跟以前的研发都不同,以前的产品研发是我就知道你将来会是这样的一个表现,因为我就这么设计你的。端到端模型有自己成长能力和能力涌现,或者说你可能只能发现它的能力,你不能去设计它的能力,我觉得这个是非常大的一个区别。

问:做端到端过程中,有没有遇到比较大的挑战?

郎咸朋:其实里面的挑战很多,最主要的一个点是我们提前有一些预研的工作,这是其一。

其二的话,公司从理想到我们团队之就是上下对智能驾驶的理解和认知,对人工智能认知我觉得都是一致的,而且都是非常深入的。最大的挑战是大家对这个事情的理解和认知是不是一致的,是不是有人觉得激进的有,人觉得是保守的,或者有人觉得方案靠谱不靠谱的。

我其实花了很长时间去解释我们怎么一步步从NPN走到无图,走到端到端。这中间就是发现问题解决问题的过程,认知对齐后决策就非常快,然后理想汽车很强的执行力是我们过去几年的锻炼和积累。

从组织和效率上,我们过去5年来对数据驱动的工具链或者这套系统的基础设施的建设,是非常关键的,即使我们现在有人、有算力、又有数据,但是如果你没有完整的高效工具链,你是无法高效的去运转,我必须要通过自动化的数据闭环能力基础设施去进行数据收集、样本标注、自动化标注到自动化训练,然后自动化评测以及自动化迭代发展,这些内容我们是从2019年从第一辆车开始陆陆续续的迭代到现在,因此理想的数据闭环的基础建设的能力绝对是行业顶级的。



每年拿不出10亿美金投算力,

将会被淘汰


问:你们曾经提到过,理想的智驾体验落后特斯拉半年,这个结论是怎么推演出来的?

郎咸朋:从特斯拉FSD V12.3开始,我们其实定期都会去美国去试,西海岸东海岸都试过,这是我们自己总结下来的。其实目前特斯拉在美国西海岸确实非常棒,因为它现在加州的数据是最多的。但到了波士顿、纽约,你会发现它的性能就会急剧下降,尤其到了纽约之后,它其实已经基本MPI(Mileage Per Intervention,接管里程) 到10、11左右了,其实在纽约的接管水平上和国内头部表现没有拉开代差。但即使是纽约路况,它比中国上海、广州复杂程度还是差很多的,所以也是我们敢去下这个结论或者敢去这么说的原因。

另一方面,特斯拉(在美国)可以获得很多国内没有的信息,比如像地图信息,其实谷歌给了很多这种道路结构,在国内导航地图是不会给你这些信息的,特斯拉其实是在很好的基础之上做到了这个体验,所以我们才说FSD如果到了中国,其实它现在应该是在上海测试了,我觉它要做很多工作,包括地图,因为他在地图上拿不到这么多丰富的信息,它得做大量的修改,所以我们做出了这样的判断。

问:理想今年的目标是成为智驾领域绝对头部,用什么样的维度去定义?

郎咸朋:我觉得最终还是看量,今年我们的AD Max车型销量数量是否在市场上是领先的?其实这是最硬核的指标。我只看Max的车,我不看总量,这个月我卖了5万辆车,但是AD Max如果只卖了1万辆,说明我AD Max做的是失败的,但是如果说我成功,Max占比就会高。

我们从6.0推出到现在端到端推出这一个月以来,我们的车主实际上进店量是多了些,而且销量也提升了。我们用户选购AD MAX的定单占比从5月份的37%提升至49%,在L9车型方面已经达到75%的定单都选购AD MAX。用户实打实的掏钱买你的产品,我觉得这是最有说服力的。

对于我们内部来说,今年3月份战略会我们也有个反思,就是不要过分的看竞争。为什么今年上半年大家吐槽我们的无图第一版质量一般,其实当时问题是在于我们过分的看竞争,当时我们把华为作为一个非常好的竞争标杆,那么它的接管率、产品指标成了我们追逐的对象,其实单看这些指标,我们那版其实并不差,但是用户体验不好,所以最后改成以用户体验和评价来评判,而不是仅仅看指标了,但指标是一个参考,我们是需要看的。

问:特斯拉FSD落地并解决了中国路况的一些问题之后,一些头部车企可能都会站到同一个起跑线上,那个时候大家拼什么?

郎咸朋:这也是跟我们后续的一些规划有关,从端到端开始,大家真正的用人工智能的方式去做自动驾驶了,我相信或早或晚,头部玩家一定都会做这个方向的。一旦进了这个方向,大家的差距一定会被拉大,而不是像现在做个辅助驾驶,你看7000块钱的也能做是吧?用1个Orin也能做,用2个Orin也能做,用4个Orin也能做,但是你真正到了人工智能时代的话,大家其实就拼两件事。

一是你有没有足够多的高质量的数据,二是你有没有与之相匹配的充足的训练算力的集群,所以大家到最后做的拼算力和拼数据,但这两件事门槛非常高,如果说你企业的资金储备不足以支撑你每年训练的花费,你是不可能玩到后边的L3或L4的,如果说你车企的这种这种车的保有量如果不多的话,你的数据其实也支撑不住你的训练的需求。

我们初步估算过,目前理想每年投在训练花费上是10亿人民币,我们预估将来花费要到每年10亿美金,这只是训练的算力,还不包括其他的人员各种费用,所以说如果你一年拿不出10亿美金来去做训练的话,可能会在将来的自动驾驶的竞争当中会淘汰。

问:10亿美金一年,这个是怎么去推演出来?

郎咸朋:从这个模型参数来看是最直接的,以特斯拉为例,FSD V12.3—12.5扩大5倍模型,算力也是扩大5倍,我们现在端到端的模型大概三四亿参数,然后VLM是22亿参数,到了Thor这一代它本身的算力就已经提升了非常多了,模型不可能保持不变,为了提升更高的上限做L3、L4,自然而然训练算力也得成倍增加,我觉得是这样的一个逻辑。

问:现在国内厂商在端到端路径上是在同一起跑线上吗?

郎咸朋:国内厂商在端到端的同一起跑线上,但我觉得,如果看One Model,可能理想会领先一些。在One Model的基础上,我们首先是发布了自己的鸟蛋版本,而且是千人规模的这样一个比较大量的一个发布和交付,而且大家在使用过程中也确实切身体验到了这个端到端与之前无图的这样一个带来的性能和体验上的提升,我刚才的判断是在这个基础上。

问:关于算力、买卡的问题,公司支持吗?

郎咸朋:咱们公司也很支持,现在李想隔三差五过来问一句,郎博你们卡还够用吗?你不够不够用的话,让人帮你解决,我说好的谢谢。虽然说我们各方面都经营做得非常极致,但是我觉得李想他对人工智能这块了解还是比较透彻的。所以说,对于算力等,我们其实并不是特别担心,想哥这边要批预算时,我觉得他都会考虑这些。

问:你提到不是每一家车企都能够做自动驾驶,在算力层面,需要有多大的储备,才够达到入场券标准?

郎咸朋:现在我们理想实践下来,一年10亿人民币的算力花销,这是一定要有的。如果你没有的话,要不迭代速度慢,要不产品竞争力不足。未来我们觉得可能10亿美金一年是必须要有的这么一个算力投入,我们自己大概也估算过,我们现在大概15000张卡,现在已经挺紧张了,我天天协调卡怎么分配,但是随着模型参数量增长,我觉得至少是3-4倍(投入),这种感觉是比较合理的。因为算力本身就提升了很多,那么它带宽存储都提高很多,我觉得基本就是照着小10万张A100这种感觉去对应,可能就是大概30亿Flops的算力。

问:这种投入它是无止境的投入,还是会有一个上限,或者说在某一个点它可能是趋于平稳的,怎么去保证商业化的平衡?

贾鹏:这两年模型参数从原来的几百亿到现在到万亿级,甚至是10万亿参数。这是一个非常陡的曲线,但是最近大家又在反思一个东西,是不是越大越好,现在又开始稍微有点缩了,可能做一些专业领域的大模型不需要这么多参数,我只要数据质量足够好,我的模型参数量可能不需要那么大,这就是一个HYPE曲线,可能过段时间又往下掉,但我觉得最终到一个平稳的状态,你无论是模型参数量还是算力也好,都会有一个这样的过程,大家会先爬坡爬得很快,然后到最后可能回归一些,然后走到真正的实用,是这么一个过程。

问:上半场的电动化竞争中,特斯拉、比亚迪等已经把后面的选手甩得很远了,接下来下半场的智能驾驶竞争,会呈现怎样的格局?

郎咸朋:上半场是电动化,下半场肯定是智能化,接下来大家肯定会看到我们在智能化方面的一些投入和表现,端到端只是一个开始。


- END -


版权声明:腾讯新闻出品内容,未经授权,不得复制和转载,否则将追究法律责任。


往期推荐



点击“阅读原文”获取更多汽车资讯





腾讯汽车
腾讯新闻旗下腾讯汽车官方账号
 最新文章