“已与超30家国内外车企达成合作,覆盖100余款车型,开悟生成场景库预计2025年对行业开放。”
2016年,本田开始在中国寻找智能驾驶合作伙伴。当时他们提出的要求颇为苛刻,合作伙伴需要抛弃激光雷达、抛弃高精度地图,完成自动驾驶功能。尽管这一要求与今天纯视觉端到端自动驾驶的技术路线高度一致。
“2017年3月,日本自动驾驶测试场地下起瓢泼大雨,当时基于激光雷达等昂贵且复杂的系统完全无法正常启动。但绝影的纯视觉方案仅靠两个摄像头便顺利完成整个测试,从此与汽车结缘。2022年,我们提出行业首个端到端自动驾驶解决方案,迈入智能汽车创新之路。”
11月27日,商汤绝影在2024“绝影实力AI DAY”大会现场,全面展示了「驾-舱-云」三位一体的通用人工智能(AGI)产品体系与战略布局,并发布智能座舱交互革新、端到端智能驾驶等前沿领域的创新成就。
商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚在回顾绝影成长的同时,对绝影的未来目标作出进一步明确——成为主机厂加速驶入AGI时代的战略合作伙伴。
王晓刚透露,截至目前,商汤绝影已与超30家国内外车企达成合作,覆盖100余款车型,预计至2024年底,量产交付累计将突破350万辆。
“商汤绝影将与车企伙伴进行全方位深度合作,共享大算力与大模型,共建数据基础设施,共同打造智能汽车大模型创新应用。”他强调,单打独斗难以在AGI时代脱颖而出。
现场,商汤绝影行业首发智能座舱大模型创新产品「A New Member For U」,让汽车拥有「有趣的灵魂」;同时面向智能驾驶,构建了「车云一体」的产品矩阵,发布涵盖高速、城区以及泊车等全场景的高阶智驾、端到端智驾等绝影量产智驾产品体系。
现场亮相的全新标杆级世界模型——「开悟」是亮点之一,将为绝影打造坚实的数据基础设施。“智驾高端局的竞争不止是车端模型的比拼,端到端的决战,战场在云端。”王晓刚认为,在基础设施、大模型能力和全栈数据闭环进行深度合作之后,双方才能进一步挖掘出AGI在智能驾驶和智能座舱领域的潜力。
「端到端的决战,战场在云端」
据商汤绝影公布的信息,其智驾量产交付正在稳步推进,基于J6平台的智驾方案预计2025年第二季度将量产交付,而量产端到端智驾方案则预计会在明年年底量产落地。现场,绝影还全面展示了基于J6E、J6M、Orin等不同算力平台打造的全场景高阶智驾、端到端智驾等绝影量产智驾产品体系。
不过,当研发范式从规则驱动转变为数据驱动,端到端智驾模型对于高质量数据的需求呈指数级的增长。这令数据的数量和获取成为一个难题——受限于高阶智驾的量产规模、算力资源,目前大多数车企和智驾公司都面临相同的问题,即高质量驾驶数据的获取难度大、效率低、成本高。
商汤绝影提供了一个新的解决方案,即通过实车采集和仿真生成「双轮驱动」的数据闭环,构建量产智驾产品体系和世界模型深度融合的「车云一体」智驾新范式。
“智驾高端局的竞争不止是车端模型的比拼,端到端的决战,战场在云端。”王晓刚表示。为此,商汤绝影全新升级并发布行业标杆级别世界模型「开悟」。该模型最基础、最核心的能力是生成高质量视频数据。高质量数据的关键在于「真实」。基于多模态大模型打造的绝影世界模型,能够理解真实世界的物理规则、交通规则,生成的视频数据也更加逼真——晴朗天气下,汽车、路灯都是有影子的,右转车辆会主动让行优先级更高的直行车辆。
《财经涂鸦》在现场交流中获悉,目前开悟的训练数据中约20%为生成数据,明年大部分训练数据或将都采用生成数据。
根据公开数据,开悟生成效果的各项指标开源均达SOTA,优于包括GAIA-1、DriveDreamer在内的国内外主流世界模型。从2023年开始,在全球知名的自动驾驶仿真模拟任务竞赛Waymo Sim Agents的比拼中,开悟连续两年获得第一名。
值得一提的是,通过多模态大模型,开悟可支持多样化自动驾驶场景及Corner case的可控生成。目前商汤绝影基于1024类场景,能够泛化出更多的平行世界,打造了千万级的生成场景库,预计2025年对行业开放。
由此带来的一个行业变化是效率提升。“从训练范式的进化来看,前两代范式由于比较依赖人工,效率比较低,也同步延长了智驾系统的迭代速度。”一位专业人士解释道,而今,实车采集的真实数据和云端生成的仿真数据在「车云一体」的新范式下进行闭环流转,使得端到端智驾系统的训练更加全面、高效,大幅缩短了研发周期,成本也同步降低。
预计年底累计交付将超350万辆
王晓刚在现场透露,绝影智驾方案已量产交付广汽埃安、一汽红旗等3家车企6款车型,目前已与本田、比亚迪、长城、广汽、红旗、极氪、奇瑞、蔚来等超过30家国内外车企携手合作,覆盖超100款车型,预计到2024年底,累计交付总量将超350万辆。座舱AI大模型产品已上车小米SU7、智己、LEVC L380等车型。
截至目前,以中国为起点,商汤绝影已在中国(上海、北京、深圳、广州)、德国、日本等地设立研发中心。第三方调研数据显示,商汤绝影在座舱视觉AI软件市场的份额连续五年蝉联第一。
面向海外市场,商汤绝影同步升级了座舱视觉AI产品矩阵,助力极氪X的DMS系统斩获ENCAP历史最高分,并在「绝影实力AI DAY」首发ENCAP2026 OOP离位检测、身材检测功能。
不过,“单打独斗难以在AGI时代脱颖而出,主机厂和AI公司必须以全新的方式进行深度战略合作才有可能形成行业竞争力。”王晓刚强调,商汤绝影愿意和车企合作伙伴共享算力丰沛的商汤大装置,行业领先的20,000 P算力将为合作伙伴提供强有力的基础设施保障;同时,绝影将开放性能全面的基础大模型能力,提升车企的AI实力。
目前,商汤绝影已和大卓智能、东风汽车等合作伙伴签订战略合作协议,在高阶智驾量产、端到端量产、AI云服务、AI大模型等领域开展全方位的深度合作,加速自动驾驶的落地与进化。
在共享大算力和大模型的基础上,双方能够加速研发体系的对齐,共同建设以高效率世界模型和全流程数据闭环为核心的数据基础设施。未来,数据的数量、质量和利用率等都不再是问题和阻碍,在智能汽车与云端平台之间流动的数据,将成为加速大模型上车的高效燃料。
让智能汽车拥有「有趣的灵魂」
大模型上车伊始主要扮演工具角色,为用户提供基础的对话、信息查询和问题解答服务。不过,这类车机都只是听话和服从的「被动智能」。
“在AGI时代,智能座舱将实现‘叛逆’的自我进化,而非仅仅是服从指令。但这个叛逆是积极意义上的,不是对抗。”现场,商汤绝影发布具备察言观色、无时不在且与你心有灵犀三大特征的智能座舱大模型创新产品「A New Member For U」(家庭新成员)。比如在驾驶旅途中,它会注意到坐在后排的孩子睡着了,就会主动把空调温度升高、音乐的声量调低,底盘和驾驶模式都调整为舒适模式,给小朋友一个舒适安心的睡眠环境。
让智能汽车拥有“有趣灵魂”的,是绝影强大的原生流式多模态大模型。在OpenCompass多模态评测榜单中,绝影多模态大模型的理解和推理能力排名第一,以此为基础,「家庭新成员」能全面感知用户的语音、表情、手势、以及环境数据,并进行深度理解和推理思考,具备理解世界、理解人类的能力。
如果要让汽车与用户心有灵犀,它还必须有拥有「记忆」。为此,商汤绝影打造了国内首个「车载类人记忆框架」,让系统实现类人的记忆能力。
商汤绝影的记忆框架与人类的记忆机制非常相似。它有临时记忆,能记得一些瞬时信息,比如车里的物品、人的搭配、有没有系安全带等;也有长期记忆,就像是一个“档案库”,存储用户的基本信息、行为模式和偏好等,它可以自我迭代,能从用户长期使用中总结规律并不断优化。而通过场景记忆,车机能针对当前场景进行毫秒级的动态记忆检索,提取关键信息,进行决策,主动服务。
该“新成员”还具备能够持续推理的Always-on运行框架,可将多模态感知到的信息与各种记忆相结合,依托端云协同架构,数据延迟控制在1毫秒以下,时刻感知用户需求。
“在追求智能和情感化的同时,商汤绝影始终坚持将用户隐私与安全放在首位。”针对大模型上车带来的安全性问题,王晓刚坦言,通过全方位的隐私保护与数据安全体系,绝影可做到“数据跟人走”、“隐私数据不出车”、“不该说的不说”,确保系统在安全合规的前提下提供更佳体验,打造用户专属的安全空间。
本文由公众号财经涂鸦(ID:caijingtuya)原创撰写,如需转载请联系涂鸦君。
添加涂鸦君个人微信(ID:tuyaclub)
加入【公司情报社群】
参与资本市场讨论
获取一手情报