和往常一样,主打「AI基因」的小鹏汽车,还是没有在巴黎车展上细讲技术逻辑。但何小鹏强调的那个「不明觉厉」的名词——AI鹰眼视觉方案,还是成功刷了屏。
率先搭载该方案的小鹏P7+,一下子成为了何小鹏口中的「全球首款AI汽车」
在8月的MONA发布会上,何小鹏曾简单介绍过AI鹰眼纯视觉方案。而在那场发布会的第二天,百度智能驾驶首席研发架构师王亮,也详细介绍了极越的端到端纯视觉方案。这两场发布会都绕不开「纯视觉」和「AI汽车」这两个关键词。
如今,多家定位相同的车企不可避免地要进行交锋,在这场「AI汽车大战」中,作为吃瓜群众,我们发现了三个沉浸在一片沸腾信息中的「真相」。
真相一:
不是谁「第一」,就算胜出
汽车行业的研发紧迫感,是由软件价值卷起来的。如今的智能车研发速度,几乎需要与AI行业同步。
最明显的案例就是大模型应用之后,人们发现了汽车结合AI的潜力所在,一时间,业内纷纷抢着实现「大模型上车」和「端到端」。
到了今年,大家干脆将产品直接定义为「AI汽车」。其中,典型的转型系统包括小鹏今年5月推送的AI天玑,p7+搭载的AI鹰眼视觉方案、蔚来7月发布的「SkyOS·天枢」,NWM(蔚来世界模型)等等。
这些由数据驱动的方案为汽车带来了无限可能,但是直到现在,许多愿景也只停留在「可能」。
前路美好,从不妨碍道路曲折。指出由于参数、训练不足等原因,许多功能尚待完善,上车时间较为缓慢。
实际上,「AI汽车」的概念在前两年开始就已不新鲜:2023 年 10 月,极越就已提出「全球首台 AI 汽车机器人」的概念。但是概念终究不能只是概念,与其看「谁是第一个」,不如看「谁能高效迭代」。
从极越的迭代进程来看,从今年1月的 V1.3 大版本升级,到8月推送全新V2.0版本,每个月都会进行重要更新升级。且每一次升级,都涵盖了数百项功能,涉及智能驾驶、智能座舱、智能互联、三电等各个领域。
众所周知,AI汽车的快速迭代能力源于便捷、的反馈数据闭环。而对于极越用户来说,如果想反馈问题,只需要说:「SIMO,我要吐槽。」SIMO就可以将用户描述的场景或者问题进行筛选分类,提交反馈。这让极越得以快速收集大量数据,直通研发人员。
到了现在的V2.0版本,极越不仅将PPA升级为ASD,同时发布原生AI大模型智能座舱,SIMO 2.0能做到「唇动识别上车」,共计实现了106项新增功能和能力进化,AI张力拉满。
其实,如果非要论哪家车企「第一个」强调了AI的重要性,当属特斯拉;但现在特斯拉正在被疯狂内卷的中国选手快速追赶,在赛道上难分高下。讲真,如果用特斯拉的FSD来中国的复杂路况跑一跑,还未必能比极越的ASD好使。
真相二:
不是会交互,就算AI
「大模型上车」这件事已不再新鲜,从去年开始,各家车企都将大模型搬进了智能座舱。这些交互功能是人们体验AI功能最多元、最直接的区域,因此大家都想方设法利用AI在交互功能上玩出花样。
近日发布的小鹏P7+车型,应用了AI天玑5.4.0版本系统,该系统能够进行主动的思考推理。基于此,AI小P具备更高级别的理解能力,为用户提供「管家式服务」。
7月,蔚来发布了NOMI GPT架构,并全面引入Agent多智能体框架,基于大语言模型重构NOMI的认知和复杂任务处理能力,包括学会使用不同的软件工具、进行复杂的规划和编排、建立记忆等等。
根据蔚来9月上线的Banyan 3.0.0来看,NOMI的能力的确有了质的提升。但由于数据尚待完善,所以一些功能还是「敬请期待」的状态。
不过,大模型和大模型之间也有差距,这主要要看算力和参数量。
而在车端芯片上,极越是第一家应用8295芯片的玩家。虽然到了现在8295也不算新鲜事了,可实际上很多竞品也还在用8155芯片。
在模型参数量上,曾有专家表示,单靠一家车企的数据肯定是不完备的。在这点上,极越也是能用上百度的资源,充分利用其海量语音参数。
另一方面,虽然多数车辆的语音助手虽然能做的任务更多了,但依然比较生硬、冰冷。在此背景下,极越从推出01开始,就在语音交互上几乎要高出一个Level。如今再体验SIMO2.0就会发现,其语调更加拟人,甚至还会有自然停顿和呼吸声;而且从车外对话的效果水准来看,基本上还很少有竞品企及。
而且,SIMO能做到所有指令免唤醒词,这很考验语言模型能力——不仅要实时待命,还要在长时间的语音识别里大幅降低失误率。不然,这种功能可能会反而影响体验。
(SIMO功能演示)
对语音大模型来说,最重要的是准确度、泛化性,前者决定用户是否会用,后者决定使用频率。如果都不高,那只能作为一个摆设功能。
在今年8月,中汽智测对多款车型的智能座舱大模型进行了测试,结果只有小米SU7和极越01通过了测试。这也能说明现在的智舱仍普遍存在「虽然有,却不好用」的现象,更别说展现AI能力了。
真相三:
不是开了城,就算好智驾
从去年到今年,多家车企大张旗鼓地喊「开城」,虽然目前还没到约定的期限,但现在这一呼声逐渐弱了下来。这是因为才过了区区几个月,AI的发展和「端到端」就改变了一切。
也在5月发布端到端规划的小鹏汽车,表示要以新的轻地图方案已可实现「全国都好开」,甚至要在2025年实现L4级自动驾驶体验,并于2026年实现部分低速场景可以「人不在驾驶位开车」。
这种规划,听起来比「开城」口号还要激进。
不过,小鹏在 P7+ 这样的战略车型上应用新的纯视觉方案,也算是其宏大目标中的重要一步。因为这一步,意味着小鹏或许开始全面向纯视觉路线切换。
而且,从当下市场中搭载纯视觉方案的中高端车型来看,「去激光雷达」已经不再是成本主导的选择,而是AI能力的选项。
“纯视觉感知的端到端智驾方案,代表了自动驾驶的未来。”7月,在发布了自动驾驶大模型DriveAGI后,商汤绝影总裁王晓刚这样说道。这句话,已经逐渐成为业界共识,因为利用「人脑思维」的纯视觉技术,是验证AI能力最直接的方式。
这一点,特斯拉无疑是最早意识到的,极越则是在国内最早意识到的。
当业界还为路线分歧争论不休时,极越已经量产了纯视觉方案——从一开始,极越01就已确定将搭载量产纯视觉城市领航方案,并在去年10月交付时得以实现。
今年3月,纯视觉OCC以及VTA网络(Vision Takes All),彼时,其大底座基础模型已经有了「端到端内味」,因为它的核心能力包括:目标检测、实时建图、持续跟踪障碍物,以及对场景的阅读理解能力。
8月,极越PPA智驾全面升级为ASD,它基于L4级自动驾驶大模型Apollo ADFM全新打造,也同样可以月月进化。由此看来,如果说小鹏是想从L2进阶到L4,那么极越就是从L4降维至L2-L3,但是后者明显实现了更快的量产和迭代速度。
夏一平表示,纯视觉的方案迭代速度更快——系统可将多个小模型合并成大模型,并将多余的参数释放给视觉模型。但是更关键的一点是:「百度在智能化上已累计投入了1500亿元,极越则是将其这么多年积累的智能化能力给产品化了。」
以最关键的「数据」举例,百度AI超过170亿参数的视觉大模型、BEV+OCC精标训练数据过亿(帧),高标准的自动化标注产线实现日均产能过百万(帧)……
今年,第二届中国智驾大赛比以往更受关注——华为、小鹏与极越等智驾头部公司都参与了赛事。其中唯一采用纯视觉方案的极越,更是连续在北京、杭州、上海和广州四个城市赛场夺冠,可谓为纯视觉智驾结结实实地做了一次宣传。
同样在8月,华为也推出了纯视觉智驾方案——华为 ADS 基础款。该方案搭载在问界新 M7 Pro 上。虽然该方案在部分决策上还需要驾驶员介入辅助控制,但到底是智驾三大车企「华小极」终于在纯视觉路线上又靠近了一些。
「现在华为、小鹏应该都在往纯视觉的方向转。如果想做到全国都能开,又想做好泛化,又想做端到端,那么纯视觉是现在最好的选择。我相信越来越多的品牌会加入纯视觉的阵营。」夏一平近日表示。
大模型、端到端、纯视觉,AI管家......这些都是 AI 车企们鲜明的特征。大家蜂拥内卷智舱、智驾,甚至全域系统,就像李斌说的,「一个成功的智能电动汽车公司,一定是一家成功的AI公司」,而且小鹏也早已将自身定位为「AI汽车公司」。
至于极越,更是从刚成立起,就提出要「集百度 AI 之大成」,是一家以 AI 为立身之本的车企。由此可见,相比于其他「AI车企」,百度的资源共享倒像是一条「捷径」,超起车来也更便捷。
但更重要的是,技术归根结底是要为人服务的,谁能将方法论尽快量产上车,谁能把 AI 在车端的应用更加泛化、准确,安全,实用,谁才能胜出AI大战。
按照目前的发展态势,「华小极」等车企在 AI 汽车这个命题上必有一战,尤其是在智驾的争夺上,战事将愈发的激烈。
自动驾驶之星和生成式AI与具身智能知识星球,新人优惠券来袭,结识一群志同道合的小伙伴一起成长。
下一个风口会不会是生成式AI 与具身智能的时代,我们特意创建了生成式AI与具身智能交流社区,关于大模型,机器人的相关业界动态,学术方向,技术解读等等都会在社区与大家交流,欢迎感兴趣的同学加入我们(备注具身智能)!
自动驾驶之星知识星球主打自动驾驶量产全技术栈学习,并包括: 学习板块,求职面试,有问必答,论文速递,行业动态五大板块!星球内部包括端到端大模型,VLM大模型,BEV 障碍物/车道线/Occ 等的学习资料!
生成式AI与具身智能知识星球,我们相信生成式AI 与具身智能会碰撞出出乎我们意料的内容,本知识形象并包括: 学习板块,求职面试,有问必答,论文速递,行业动态五大板块!星球内部包括生成式AI大模型,具身智能,业界资料整理等的学习资料!
👇点个“赞”和“在看”吧