在社交平台“消失”了大半年,李想回来了。这一次,李想带着他对AI世界的理解,向外界分享了其关于理想产品的新规划:智能驾驶、智能空间、智能商业以及智能工业。核心还是那个初心,为家庭用户服务,但思路迭代、拓宽了——要为用户提供一个真正的移动智能空间与高质量陪伴,连接车和人。长远来看,理想希望能提供超级智能的硅基家人,延续我们的记忆,以及与这个世界的所有关系。
时隔九个月,车圈“网红”理想汽车CEO李想,带着《2024理想AITalk》重新回到公众视野。刚一露面,李想就向外界投掷了一枚重磅炸弹——不想造车了。
不过,所谓“不造车”,是指不造传统意义上的汽车。业内公认“电动化是汽车转型的上半场,智能化是下半场”。在李想看来,其中的智能不只是软件智能,而是人工智能。要想继续造车,人工智能是必经之路。最终,汽车将从工业时代的交通工具,进化为人工智能时代的空间机器人。其实早在2023年1月,李想给全员发布的一封内部信中就提出了这样的愿景:2030年,将理想打造为全球领先的人工智能企业。将时间再回溯两个月,OpenAI推出了一款人工智能技术驱动的聊天机器人——ChatGPT,迅速引爆了社交媒体。短短5天,ChatGPT注册用户数就超过了100万,截至2023年1月末,ChatGPT的月活用户已突破1亿。随着ChatGPT横空出世,国内大模型应用也迎来热潮,互联网大厂和创业者纷至沓来。外部环境的改变,验证了李想的判断,也更坚定了其向AI公司转型的决心。李想在AI Talk中回忆,“2022年9月,我们已经确定,要把人工智能包含自动驾驶作为真正重要(发展)的方向,这是未来竞争的关键”。公布自己在AI领域的野心后,理想开始加速搞研发,其中一个重要方向体现在智驾领域。在理想内部,有RD和PD两条脉络研发智驾,PD是产品交付研发,推送给全量用户、千人团测的版本由该团队负责,RD可以理解为“超前作业”,负责预研技术,探索理想通向未来人工智能的方向。在这样的架构下,理想研发的“端到端+VLM(视觉语言模型)”方案,只用了一年多的时间便完成了三代迭代。2024年7月初,理想端到端+VLM智驾技术架构面世,并在10月23日开启全量推送。这让在智驾领域并没有先发优势的理想一鸣惊人,跻身行业第一梯队。与其他车企不同,理想的端到端+VLM是两套系统,前者称为快系统,采用One Model结构,没有人工规则,完全由数据驱动,输入的是传感器数据,输出的就是行驶轨迹,类似于人类司机凭经验的驾驶行为,可以应对95%的驾驶场景。后者称为慢系统,这种模型能够处理多模态数据,从而深刻地理解物理世界,形成推理、分析的能力,就像是老司机的思考方式,用来解决更复杂或未知的驾驶场景,也就是剩余的5%。除此之外,理想还在研发世界模型,通过重建和生成技术把问题场景形成模拟题,为智驾系统的学习和测试提供了虚拟环境,提高其泛化能力。将AI技术应用于智驾业务,这是理想迅速赶上,且逆袭的原因。如今,从技术架构角度来看,理想只比特斯拉晚了半步。来到端到端时代,车企们拼的另一个重要维度是算力与数据。理想整体算力目前已达到8.1EFLOPS,智驾训练数据达到500万Clips,这两个数据在业内已经算得上领先水平。这成为理想智驾大范围、快速迭代的基础,也是高上限和高安全的保障。11月底,理想智驾再次迎来重磅升级。OTA之后,车主上车即可开启一键智驾,车辆自主泊出车位,处理复杂场景,实现车位到车位的智驾功能。伴随着此次升级,理想还新增了高速收费站ETC通行功能,这是目前业内唯一能做到VLM识别ETC的车企,且泛化表现也不错,全国用户都能用。理想在智驾领域的持续投入,在市场端得到了积极反馈。理想汽车自动驾驶研发副总裁郎咸朋透露,2024年2月,理想AD Max的交付量占比只有20%左右,到下半年已经超过50%了。
在李想的AI版图中, 智驾只是其中一个分支,理想面向C端的AI产品还有理想同学。
理想同学是理想车内的个人语音助手,能够为车主提供知识问答、导航、娱乐等功能。2024年12月27日,理想同学进化为一款App,成为一款类似于ChatGPT、Kimi的通用人工智能助手。也就是说,跳脱出汽车这个封闭空间,理想同学还可以在手机端为用户继续提供服务。理想同学App是理想汽车基于Mind GPT大模型打造的一款AI助手,可以实现知识问答、视觉问答、文本处理、规划建议等功能。将理想同学外扩为App的想法,是因为很多理想用户,尤其是家庭用户中的孩子们,接触的第一个AI产品就是理想同学。李想说,很多用户的孩子在使用完车内理想同学后,拿着手机也会习惯性地喊理想同学,这是真实的需求场景。
虽然目前来看,理想的智能驾驶和理想同学是两个产品,源于不同的基座模型,但李想坚信,二者最后一定会变成VLA(融合视觉、语言和动作的多模态模型)。在理想内部,习惯把Mind GPT(理想自研大模型,理想同学基于该模型打造)称为语言智能,把自动驾驶叫作行为智能。如果把智能体比作人类,人脑可以同时处理语言、图像,并作出决策;智能体也是一样,行为智能和空间智能缺一不可,这是李想作出上述判断的理由。因此,对于理想来说,理想同学走下车,并不单纯是将业务范畴拓宽,而是通向人工智能时代必然的产物。与去年的百模大战不同,2024年业内更加重视大模型的落地,OpenAI不再一家独大,国内厂商进步飞速。李想认为,如今大模型应用还谈不上同质化,大家都有机会。未来,厂商比拼的也不再是应用产品,而是体系化能力。在这个过程中,基座模型是一个分水岭。“基座模型是人工智能时代的操作系统+编程语言。基座模型所构建出的人工智能超级产品,是新一代入口——它会在所有设备之上,在所有服务之上。”李想说。这一次回归,李想的一个明显变化是,人变得低调了。他“蛰伏”的这段时间,汽车圈依旧热闹,但李想不再热衷于评论圈内热点,他更愿意分享对未来发展趋势的理解。回到业务本身,李想更敢说了。“今天大家听到各种各样做机器人、具身智能的公司讲‘系统一’、‘系统二’。大家可以回头看一看这些论文,最早是我们自动驾驶研究团队做的。”现在,在大语言模型和基座模型方面,理想是跟随者。而理想希望对标最优秀的选手,把能力排名划分为一个个阶段目标,按照目标进行有效投入。目前,理想汽车累计交付量已经超过100万辆,服务的用户人数达到数百万之多。相比于一般的创业公司,理想有更大的用户基础。这是理想的优势,而理想智驾和理想同学现阶段的成绩已经证明了上述方法论行之有效。李想对AI的兴趣最早可以追溯到2000年,其创办泡泡网时,李想就萌生了以技术改变物理世界的想法。
创立汽车之家后,李想把想法付诸行动,但没有成功。那段创业经历包裹着李想“人生中的一大遗憾”。因为那是“一个非常垂直的领域,虽然你做得很好,但是可能为了一棵树,错过了一个森林,所以在第三次创业时,我要选择一个森林”。这片森林,依然是“以技术改变物理世界”的初衷,但是应用范围不再局限于某个单一领域。现阶段,李想对AI发展的构想已经非常清晰,他将此分为三个阶段。第一个阶段称为“增强我的能力”。也就是说,该阶段AI的能力还不够强,它只是作为一个辅助功能,为人类提供便利、提高效率。人类进行监督、决策,以及为责任兜底。理想的两大AI产品智驾与智能助手,便是两个很好的例子。第二个阶段即“成为我的助手”,放在自动驾驶中相当于L4级。这时候,人类只需向AI发送任务,它可以独立完成,并对结果负责。此时的AI已经发展为一个智能体,它会在人类的生活中得以大规模应用,是真正的“iPhone4阶段”。第三个阶段,即“成为我的硅基家人”。“‘硅基家人’就是家庭成员,甚至是家庭重要的‘组织者’”,李想说,它了解家人朋友,甚至比自己还了解。它不需要再接受任何指令,就可以自主完成很多事,把家庭管理好。
甚至,“硅基家人”可以延续人类的记忆,哪怕人类的躯体已经不存在,但记忆会变成硅基家人的一部分。“硅基家人”是李想构想的终极AI产品,他很笃定,在有生之年可以实现第三个阶段。“硅基家人”这个概念也许听起来很陌生,但其中的一些想法,其实与特斯拉CEO马斯克研究的脑机接口有一些相似之处。去年5月,马斯克作为联合创始人之一的科技公司Neuralink,进行的一项人体临床试验通过了美国食品药品监督管理局(FDA)的批准。该实验通过机器人将脑机接口芯片植入人类大脑控制意图的区域,芯片采集、分析大脑产生的脑电信号,并无线传输到解码运动意图的应用程序,从而实现对相关设备的控制。无论是“硅基家人”还是脑机接口,都是跳脱了人类肉体,与现实世界产生关联。但在无人驾驶方面,李想与马斯克作出了不同的选择。李想明确表示,理想不会做Robotaxi,理想的使命是“创造移动的家,创造幸福的家”,“移动的家终极是L4,而幸福的家是硅基家人”。Robotaxi和个人自动驾驶车辆到底谁能成为主流,可能未来几年就会见分晓。李想认为,当一个空间变得更舒适、高效,人会更倾向于拥有这个空间。“归隐”九个月之后,李想变得低调之外,也平和许多。有人质疑他前不久买了一台法拉利,他的第一反应不是回怼,而是解释。
理想在品牌方面接下来的挑战是如何升级,在汽车行业,李想最认可的品牌有两个,一个是宝马,另一个是法拉利。他毫不讳言,理想ONE、理想L系列之所以能够赢得数十万用户,一个很大原因在于李想是宝马X7、奔驰GLS的深度用户。“法拉利我还没体验过。只有通过体验,才能变成我的认知和能力。” 基于人工智能企业的定位,理想要做的不是汽车的智能化,而是AI的汽车化,并推动AI普惠每一个家庭。通过AI将物理世界和数字世界融合,让有限的空间实现无限的延伸。到2030年,理想有可能会造一辆有趣的超级跑车,且一定是人工智能的跑车。而现在,李想做的一切都是为了拿到通用人工智能L3和自动驾驶L4的门票。这是李想实现关于AI所有畅想的入口。