【研报】智能体专题报告:智能体时代来临,具身智能有望成为最佳载体

财富   2024-11-09 08:01   北京  

(报告出品方/作者:中银证券,杨思睿、刘桐彤)

具身智能临近 IPHONE 时刻

具身智能有望成为智能体最佳载体

具身智能由本体和智能体组成。具身智能是一种基于物理身体进行感知和行动的智能系统,其通过 智能体与环境的交互获取信息、理解问题、做出决策并实现行动。具身智能的核心要素包括本体和 智能体。本体作为实际的执行者,在物理或虚拟世界负责感知和执行任务,而智能体则是具身于本 体之上的智能核心,负责感知、理解、决策、控制等核心工作。区别于机器人,具身智能具备自我 决策能力。根据卢策吾教授在机器之心 AI 科技年会上发表的《具身智能是通往 AGI 值得探索的方 向》中提到,智能体通过感知器和执行器与环境进行交互后,能够实现获取信息、理解问题等功能, 并根据环境的变化做出相应的决策和行动。

小型端侧设备无法消化大模型大算力,具身智能有望成为智能体最佳载体。2023 年,GPT-4 Turbo 发布,其参数量高达 1.8 万亿。2024 年 4 月,国内商汤科技“日日新”大模型体系正式发布,其中 中文语言大模型参数达 1800 亿。随着大模型参数量的大幅增长,传统穿戴设备、手机等无法消化大 模型大算力。从目前市场上的端侧大模型来看,通常设备端越大(功能越多),其端侧大模型的参 数量也越大。例如,面壁智能联合清华 NLP 实验室发布的开源端侧大模型面壁 MiniCPM 参数规模 为 20 亿;小米手机大模型参数达 13 亿;荣耀端侧平台级 AI 大模型参数规模 70 亿。而具身智能需 要处理更复杂的任务,如环境感知、运动控制、决策制定等,其算法和模型需要快速处理大量数据 并做出决策,因此具身智能需要更大的模型参数来支持其更广泛的功能和更高的智能需求。谷歌开 发的 PaLM-E 具身多模态大模型参数量达 5620 亿;华为盘古 Pangu S 大模型参数达万亿。相比小型 端侧设备,具身智能机器人能够消化大模型、大算力。



智能体使机器人由被动编程控制走向主动决策

由专机专用走向通用智能,大模型有望实现机器人系统的重构。2010 年以前,机器人更接近于专机 型的自动化和智能化设备,以特定的机械结构解决针对性场景的作业问题,适用于相对单一、固定 的结构化场景,泛化和迁移能力有限。并且由于机器人缺乏对于任务目标的深入理解,工程师需要 进行大量的任务分解和编程工作,机器人的控制高度依赖人工编程。而且当任务对象或环境发生任 意变化时,需要工程师重新对机器人进行编程和部署。 2010-2022 年间,机器人开始拥有初步的感知和规划能力,并逐步实现智能化。这一阶段,机器人在 以下几个方面实现了单点突破:SLAM 技术与激光雷达结合产生了自主移动能力的 AGV(自动引 导车)和 AMR(自主移动机器人);2012 年全球首家轻量级协作机械臂优傲(Universal Robots) 进入中国市场,协作机械臂开始兴起;结合 AI 与 3D 视觉技术后,机器人能够自动进行物体识别 和定位,规划最优路径,实现了上下料、拆码垛、无序分拣、焊接等非标自动化场景的人工替代。 2022 年后,大模型逐步与机器人结合。不同于上个阶段的单点性驱动,大模型所展现的泛化能力有 望对机器人感知、决策、控制的整体系统能力带来全面重构,实现机器人的通用化。

大模型与机器人快速融合。2022 年 8 月,谷歌 PaLM-SayCan 首次将语言模型与物理机器人结合, 通过预训练在大型语言模型(LLM)中提取知识,让机器人依据高级文本指令完成物理任务。随后, 机器人与大模型的融合逐步加深。2023 年 7 月,谷歌 DeepMind 推出了 Robotics Transformer 2(RT-2), 是全球第一个控制机器人的视觉-语言-动作(VLA)模型。RT-2 可使机器人直接通过拍摄或感知环 境的方式获取视觉信息,并理解人类语言指令,然后通过动作执行模块进行相应的动作操作。2024 年 3 月,Figure 发布 OpenAI 大模型加持的机器人 Figure 01,Figure 01 采用端到端神经网络,由 OpenAI 大模型提供高级视觉和语言智能功能,神经网络进行底层的控制,能够与人类进行对话交互,理解 并执行人类指令。

大模型使智能体由被动编程控制走向主动决策。与智能体结合后,具身智能以任务目标为导向,不 仅仅是机械地完成程序,其可以根据环境变化,对行动细节进行实时修正,并消除在特定条件下为 特定任务反复编程的需要。依托大模型的涌现能力,具身智能能够从原始训练数据中学习并发现新 的特征和模式,在仅仅依靠网络数据知识的情况下就可以对从未见过的对象或场景执行操作任务。 以微软《ChatGPT for Robotics: Design Principles and Model Abilities》为例,操控者只需准备好机器 人底层的函数库,并将任务目标告诉 ChatGPT,ChatGPT 即可自动完成代码并指挥具身智能机器人 行动。



智能体可实现机器人底层控制

智能体对机器人进行控制主要分为两种路径,一种是分层决策模型、二是端到端的具身模型。 分层框架的核心是将复杂的长时程任务拆解成可以直接完成的小任务。与机器人结合的大模型可分 为两类: Foundation Models for Robotics 和 Robotics Foundation Models。 前者可与机器人结合但其 应用领域并不局限于机器人,其主要功能是作为“大脑”对机器人进行任务分解和规划。后者是结 合机器人数据训练生成到小脑层的基础模型,即机器人具身大模型,其作用是结合各种传感器的信 息以及宏观指令进行运动指令生成。 以擦桌子为例:机器人接到任务后,首先将其拆解成一系列的子任务,即找到抹布、拿起抹布、擦 桌子……传统的任务规划通常由工程师来进行,而大模型由于具备高层次抽象能力,可直接实现机 器人的任务定义、拆解,使其实现自主任务规划。任务分解完成后,需要对机器人进行动作轨迹规 划,例如从 A 点到 B 点进行 10 次圆周运动。传统控制通过直接驱动或电机控制来实现基础动作控 制,需要工程师进行编程,而神经网络可以直接使用机器人编程语言完成应用程序的编写、调优和 部署。

区别于分层架构,端到端大模型能够直接输出控制信号。以谷歌的 RT-2 为例,RT-2 是视觉-语言动作(VLA)模型,能够从网络和机器人数据中进行学习,并将这些知识直接转化为机器人控制的 通用指令。RT-2 以视觉-语言模型(VLMs)为基础,VLMs 在 web-scale 数据上进行预训练,能够 准确识别视觉或语言模式并跨不同语言进行操作。在此基础上,谷歌将动作表示为类似于语言标记 的标注,以实现在机器人数据上训练 VLM 模型。RT-2 能够理解复杂的指令并将其转化为机器人的 动作,其接收机器人摄像头图像作为输入,直接预测机器人要执行的动作,实现了从视觉到动作的 端到端控制。

端到端的架构具备更好的泛化性,分层架构可解释性更强。RT-2 能够处理机器人数据中从未见过的 对象或场景,例如执行“拿起即将从桌子上掉下来的袋子”或“将香蕉移动到 2 加 1 的和”等。但 端到端需要构建海量数据训练,且消耗大量计算资源。数据规模越大,调用大模型频率就越高,机 器人决策实时性效果越差。分层架构可将复杂的问题分解为更小、更易于管理的部分,相比端到端 技术难度更低,并且系统拥有更好的可扩展性和可维护性。但是其信息在不同层级之间传递时有可 能会存在损失,因此会影响系统的整体性能和响应速度。

参考自动驾驶发展路径,在早期机器人数据不足的情况下,分层架构发展更为迅速。自动驾驶属于 具身智能子集,是具身智能移动能力的体现。在自动驾驶初期发展阶段,分模块快速发展,在这种 技术范式下,感知、决策、控制由开发人员各自完成,具备更强可解释性。而端到端虽然以全局最 优为导向,相比传统分模块的方式具备更高性能上限,但实现难度较高,且需要海量数据做支撑。

仿真为智能体赋能的主流路径

仿真软件有望实现大范围应用

主流的具身智能训练方法主要包括遥操作、动捕、大模型等。其中,单一的遥操作或动捕需由人类 操作员直接控制,无法实现机器替人。大模型和智能体深度融合,具备较强泛化型。在数据选择上, 可采用仿真数据或真实数据。仿真通过构建虚拟环境生成大量数据,成本较低,适合在新的环境中 大范围学习技能;利用真实数据能够形成细分场景的数据壁垒,但成本及获取难度相对较高。

遥操作(Teleoperation)能够直接有效解决工业、极端危险等应用场景的刚需,但无法实现机器替 人。遥操作主要是通过专用设备将人类的动作直接迁移到机器人身上,再由机器人通过传感器收集 数据,以达到双向反馈的目的。在该种控制方式下,机器人由人类操作员直接控制,人类用户负责 高级规划或认知决策,而机器人负责下层的控制和执行,并通过触觉传感器来感知即将抓取的物体。 通过遥操作系统,可以实现机器人的远程控制。遥操作的优势在于能够精准、高效地模仿人类动作, 并且实时捕捉传输关节角度、速度等关键状态信息,相比其他训练路径更为直接有效,且能够解决 工业、极端危险等应用场景的刚需。但遥操作由人类操作员直接控制,数据采集成本较高;并且单 纯依靠遥操作无法实现机器替人。

动捕能够将人类动作直接迁移到机器人身上,但同样无法真正实现机器替人。动捕一般是由演示人 员穿好动作捕捉套装,衣服上的电位器通过数据线和电脑相连接,因此演示人员的的全身运动数据 会被记录下来,供机器人学习。特斯拉在 2023 年股东大会上展示 Optimus 的进展时,视频中工作 人员穿戴动捕服进行演示,人类的动作能够直接迁移到机器人身上,机器人再通过传感器收集数据, 以达到输入的目的。动捕的优势在于人类的动作能够直接迁移到机器人身上,在实际训练中,动捕 往往与遥操作结合使用,因此尤其适合人形机器人训练。但与遥操作类似,单一动捕无法真正实现 机器替人。

大模型具备较强泛化性,仿真数据有望大范围应用。谷歌 RT 采用该种技术路径。谷歌在 RT-1 和 RT-2 的框架上使用 X-Embodiment 数据集进行训练,该数据集包含在 22 个机器人上采集的能够完成 16 万个任务的上百万条数据。其中,RT-1 充当小脑层级的控制器,由大模型负责顶层理解和指令分 解,例如打开抽屉、将物体从抽屉里拿出来等。 RT-2 采取端到端路径,将语言、动作 tokens 进行 对齐,微调后得到 VLA 模型,使得模型能够通过视觉输入和语言指令生成正确的动作标记序列。大 模型使机器人从 Model-Based 向 Learning-Based 转变,在解决复杂和高维度的运动控制问题上具备 更高的上限。但是大模型的训练需要海量数据,按数据来源分类,可分为真实数据和仿真数据。真 实数据效果最好,但需要耗费大量人力和硬件成本。仿真数据成本低,可以大规模获取,但通常存 在 sim-to-real gap。



CAE 用于工业仿真模拟,国产化率正快速提升

CAE 属于研发设计类软件,用于工业仿真模拟。 CAE 软件分为前处理、求解器和后处理三大模块, 其中求解器为 CAE 软件的核心。前处理过程中,用户在 GUI 为求解器提供/生成实际的几何模型和 空间网格,选择物理模型和数值求解算法及其参数,并根据实际工况设置求解的边界条件;求解器 是针对特定场景,如结构变形、液体流动等,用数字算法模型的方式实现对物理规律、数学原理的 客观还原;求解结束后,后处理模块为客户提供可视化界面,对模拟结果进行提取、分析和多方式 展示。

跨学科能力不断增强,国内市场规模快速增长。CAE 软件集成了物理学、数学、计算机科学和工程 学等多领域的知识,随着其跨学科融合能力的不断增强,CAE 软件能够处理多物理场耦合问题,并 提高产品研发的效率,并通过模拟和分析来优化设计来减少实际制造过程中的迭代次数。从而在汽 车、航空航天、国防军工、电子装备等高端制造业中得到更为广泛的应用。根据 IDC 的中国核心工 业软件市场预测,中国 CAE 软件市场规模将从 2021 年的 32.1 亿元增长到 2026 年的 74.8 亿元,5 年复合增长率达到 18.4%。

专用领域抢占市场份额,国产化率快速提升。目前 CAE 软件国产化程度较低,根据 IDC 的《中国 设计研发类工业软件之 CAE 市场厂商份额,2022:流水争先》,2022 年市场份额排名前三分别为 Ansys、西门子和达索系统,均为国外厂商。但由于 CAE 软件涉及结构、流体、电磁、噪声等各类 不同专业领域,头部厂商很难拥有全物理场的通用仿真产品,国产厂商加大投入,从专用领域抢占 市场份额,国产化率持续提升。根据智研咨询的计算,CAE 国产化率从 2016 年的 7.0%增长至 2022 年的 16.2%,同比增加 9.2 Pcts。

柔性、流体仿真具备较高技术壁垒。流体等具有高度的非线性特性,因此其运动和变形模式较为复 杂,难以用简单的数学模型来描述;而柔性物体在受力作用下可能会发生大变形,因此需要仿真模 型能够准确捕捉到这些变形,传统的小变形理论可能不再适用。因此在进行柔性、流体仿真时,对 于算法的稳定性和收敛性大幅提升。国内厂商如索辰科技在流体领域具备深厚技术积累,其 Aries 通用流体力学仿真软件包含笛卡尔网格 CFD、非结构网格 CFD 等多种求解器,支持气动噪声、燃烧、 多相、热辐射等多物理场仿真计算,已为航空航天、船舶海洋等领域提供多个解决方案。



具身智能商业化落地:关注软件和垂直领域软硬结合路径

数据是具身智能发展的核心

小模型时代算法的数量和质量对于机器人至关重要;然而大模型的 Scaling Law 表明通过增加数据 量、扩大模型规模以及延长训练时间,可以实现模型性能的持续提升,数据重要性凸显。并且不同 于语言、图像或视频等二维模型的训练,具身智能底层模型的训练,需要在物理世界绝对坐标系下 的精确测量数据,数据获取难度、成本、标注周期都远超语言模型。从产业发展进程看,类比自动 驾驶,特斯拉大规模采集的数据推动了 FSD 性能的提升,具身智能产业发展的核心在于数据。 大模型的广泛使用再次凸显数据重要性。2022 年以前,算法的数量和质量对于机器人重要性更强。 因为在传统的小模型中,模型性能会随着训练次数的增加而趋于饱和,甚至出现过拟合的情况,导 致性能不升反降。而通过对算法进行优化,能够找到最佳的模型配置。进入大模型时代,Scaling Law 表明通过增加数据量、扩大模型规模以及延长训练时间,可以实现模型性能的持续提升。

类比自动驾驶,数据驱动产业发展。在产业发展初期,自动驾驶系统由规则驱动,即通过工程师人 工编写规则代码使汽车对不同行驶状况作出决策。随着神经网络智驾算法的崛起,自动驾驶进入数 据驱动时代。以特斯拉 FSD 为例,V12 版本 C++代码量仅为 2000 行,相比 V11 代码减少了 99%以 上,其原理是通过大量数据训练出能够高度模拟人类驾驶习惯的人工智能,在达到一定的仿真阈值 后,得出一套根据可靠性和符合人类乘车习惯的系统。特斯拉通过影子模式进行数据收集,将系统 决策与驾驶员行为不断进行比对,当两者不一致时,系统将场景判定为“极端工况”,进而触发数 据回传。因此特斯拉收集的数据越多,对于人类驾驶习惯的模拟就越精准,进而加速特斯拉车端的 部署,形成数据闭环。

商业化路径一:通用机器人技术难度高,行业巨头加速布局

具身智能获取数据的关键在于实现商业化落地。区别于大模型可以从网络中获取数据并进行训练, 具身智能如果想要具备高泛化性和可靠性,则需要在真实物理世界里获取数据来完善模型,而获取 真实物理世界的数据的关键就在于商业化落地。根据 1X AI 副总裁 Eric Jang 在个人博客网站上发 表的“All Roads Lead to Robotics”一文,具身智能的商业化路径主要包括三种:通用场景软硬结合、 软件路径、以及垂直领域软硬结合。

通用路线技术难度高,商业模式是向 B 端或 C 端销售带有智能能力的完整的机器人。通用技术路 径的核心是采用通用的硬件和软件来应对各种多变的使用场景,但是需要开发可重构的硬件,以便 快速调整以适应不同的任务需求;同时还要设计能够适应不同硬件配置和外围设备的通用软件,确 保它们能够在各种硬件上无缝运行。1X、Figure 以及特斯拉均采用该种路径。

以 Figure AI 为例,其目标是设计可以应用于人类环境的通用型机器人,让机器人可以执行各种不同 的任务。2024 年 8 月,Figure 02 发布。在大脑上,Figure 02 集成了 OpenAI 的 GPT-4o 多模态大模 型,相比较于 01 使用 GPT4 将进一步地提升机器人的常识推理能力,使其能够更好地理解和响应复 杂指令,机载计算和 AI 推理能力提升 3 倍。该集成使其在多模态推理和任务执行方面更具智能性和 适应性,提升其在视觉、听觉和语言交互方面的能力,使其能够执行复杂的端到端任务,适用于工 业制造、仓库物流等侧重于轻载搬运和分拣转移的混合任务场景。小脑层面,Figure 02 延续使用类 似 01 产品类似的 RT-X 机器人控制模型,使用模型预测控制器来确定脚步位置和保持平衡并遵循所 需的机器人轨迹所需的力,结合步态控制以完成机器人的基本运动,全身控制策略则确保了机器人 在执行动作时的安全性和平衡性,未来将持续优化提升动作执行能力。

商业化路径二:纯软件路径建议关注英伟达、华为合作厂商

软件路径能够实现机器人的快速部署和迭代,商业模式主要是向硬件厂商或综合型厂商提供 API 接口。纯软件路径的核心是开发 Cross-Embodiment Foundation Model(CEF),以实现跨硬件平台的 无缝兼容,机器人硬件厂商通过提供的 API 接口即可接入机器人的“大脑”。该路径能够克服传统 机器人开发中的局限性,即每个硬件平台需要独立的软件开发流程,开发者在一次编写后,可在多 种硬件平台上部署和运行。无论是精密的人形机器人、高效的轮式机器人,还是灵活的无人机,都 能够共享同一套软件架构。因此节省了高昂的时间和成本投入,并且随着机器人的大规模部署,其 边际成本可以无限趋近于 0。



但该种路径需要实现小脑层的软硬解耦。传统机器人模型通常分为“大脑”和“小脑”两部分,其 中“大脑”负责对任务进行理解,并根据感知的传感器信息对任务进行分解以及规划,生成执行策 略;“小脑”负责核心的运动控制,在大脑的策略下实现机器人动作的执行和反馈。不同于“大脑” 层模型的训练可以脱离特定硬件形态,“小脑”层则通常需要进行算法与硬件端的强耦合训练。要 打造 CEF,需要实现控制层的软硬解耦。除此之外,训练有效的具身智能模型,还需要获取大量高 质量的数据。

向硬件厂商或综合型厂商提供 API,或通过项目制与它们合作。除初创企业外,在 2024 年的 GTC 大会上,NVIDIA 发布人形机器人通用基础模型 Project GR00T,该平台主要包括生成式 AI 基础 模型、仿真工具以及 AI 工作流基础设施,其中 Isaac Manipulator 提供基础模型和 GPU 加速库;Isaac Lab 基于 Isaac Sim 构建,用于运行数千个用于机器人学习的并行仿真;Isaac Perceptor 用于感知, 提供多摄像头和 3D 环绕视觉功能。

九号机器人与英伟达合作开发自主机器人平台。2024 年国际消费电子展(CES 2024)上,九号机器 人推出与英伟达共同开发的自主机器人平台 Nova Cater AMR。Nova Cater AMR 是一款可定制的自 动驾驶研发平台,由英伟达提供算力与软件平台支持,九号机器人提供底层智慧移动能力支持以及 整合量产支撑。Nova Cater AMR 依托九号机器人最具优势的机器人移动平台(RMP),可实现仓库 AMR 建图、仓库运输、科研仿真等。

国内厂商中,华为鸿蒙 HarmonyOS 是面向万物互联的全场景分布式操作系统,支持手机、平板、 智能穿戴、智慧屏等多种终端设备运行,提供应用开发、设备开发的一站式服务的平台。2024 世 界人工智能大会(WAIC 2024)期间,国内首款搭载鸿蒙操作系统的全尺寸人形机器人乐聚 “Kvavo”亮相。该机器人采用华为开源鸿蒙系统,不仅能够实现全方位视觉感知,还具备跳跃 能力,能够多地形行走。

商业化路径三:垂直领域软硬结合建议关注细分龙头

垂直领域软硬结合能够积累细分数据壁垒。高工机器人产业研究所(GGII)所长卢瀚宸在 2024 中 国人形机器人技术应用峰会上表示,具备高壁垒的核心硬件长期来看将是“香饽饽”。机器人领域 硬件与数据强绑定,例如通过定制化的处理器或通信接口,公司能够收集和处理特定类型的数据, 这些数据对于机器人的性能至关重要,但难以被竞争对手复制。同时,硬件和软件紧密集成形成高 度优化的系统,这种集成化设计可以提高数据的收集效率和处理速度,从而形成数据壁垒。

软硬协同,海康机器人具备从机器人本体到业务调度系统的全面产品覆盖。公司在硬件方面具备机 器人设计、无线通讯及自动充换电技术,在软件方面具备嵌入式技术、平台软件技术以及移动机器 人定位导航、运动控制、调度规划等通用智能技术。公司机器人产品矩阵包括:移动机器人本体、 自动充换电系统、通讯系统、机器人调度系统和业务系统。其中移动机器人本体是硬件核心,具备 定位、导航和一定的自主决策能力;通讯系统主要负责机器人群体和机器人调度系统之间的无线通 讯,一般以 WIFI 或 5G 讯号进行链接;充换电系统主要负责给机器人补充电能;机器人调度系统既 是软件的核心也是整个系统的核心,主要负责将工厂的作业任务分配给合适的机器人,并负责整个 机器人群体的交通调度;业务系统负责将工厂的需求指令转换为机器人的搬运指令,并下发给机器 人调度系统。

AMR 市场高速增长,公司市占率领先。根据 GGII 的预测,2022 年我国自主移动机器人市场规模约 为 96.7 亿元。由于叉车替换需求、仓储机器人需求等较为旺盛,预计我国移动机器人市场在 2027 年将超过 460 亿元,10 年 cagr 达 35%。根据 GGII 的统计,2022 年中国移动机器人市场的市场销量 8.14 万台,其中海康机器人市场占有率超过 15%,位居第一,具备较强先发优势。



机器视觉赋能,打造长期壁垒。区别于传统的自动导航车辆(AGV)依赖于预设的路线和人工监督, AMR 需要利用机器视觉技术进行实时的导航和路径规划,以实现自主移动。因此 AMR 对于机器视 觉的要求大大提高。根据 Omdia 报告,海康机器人公司的母公司海康威视连续 8 年蝉联视频监控 行业全球第一,占全球视频监控市场份额的 24.1%。公司在机器视觉方面具备深厚技术积累,拥有 2D 视觉、智能 ID、3D 视觉三大硬件产品线。其中 2D 系列产品中的工业相机作为公司最早布局的 核心成像产品,在市场占有率及产品性能方面均居于业内领先地位。

索辰科技

国产替代需求有望超 50 亿元,公司或将充分受益

CAE 国产替代空间广阔,公司在国产厂商中具备领先优势。根据 IDC 发布的《中国设计研发类工 业软件之 CAE 市场厂商份额,2022:流水争先》和智研咨询产业研究,2022 年我国 CAE 市场规模 为 37.6 亿元,国产化率为 16.2%。公司 2022 年营业收入达 2.68 亿元,对应市场份额为 7.13%,与排 名第三的达索系统市场份额接近,公司在国产厂商中具备领先优势。 国产替代浪潮至,国产替代需求有望超 50 亿元。近日,工信部发布《工业重点行业领域设备更新和 技术改造指南》,提出重点更新计算机辅助设计(CAD)、计算机辅助工程(CAE)、计算机辅助 制造(CAM)、制造执行系统(MES)、企业资源计划(ERP)等研发设计、生产制造、经营管理、 运营维护相关软件。到 2027 年,完成约 200 万套工业软件和 80 万台套工业操作系统更新换代任务。 根据赛迪发布的《数说 IT》和 IDC 发布的《中国设计研发类工业软件之 CAE 市场厂商份额,2022: 流水争先》,2022 年研发设计类软件(包括 CAD、CAE 等)市场规模为 247.2 亿元,其中 CAE 市 场规模为 37.6 亿元人民币,根据 IDC 和智研咨询的《IDC 中国制造业 MES 市场分析及厂商份额, 2022:行业为王》和《2024-2030 年中国 ERP 软件行业市场研究分析及投资前景评估报告》,2022 年中国 MES、ERP 市场规模分别为 46.2 、408.5 亿元。假设工业软件替换比例与 CAE 市场规模占 比一致,目前市场上一套 CAE 软件价格从万元到百万元不等,按 5 万元保守测算,释放的替换需求 有望超 50 亿元。



军工客户基本盘稳健,机器人技术掀起产业潮

公司是国内首家成功上市的国产 CAE 软件企业,具备核心技术积累。公司产品涉及流体、结构、 光学、声学、电磁、测控、多学科等多个方向,并开发出多类型工程仿真软件,能实现对多物理场 工程应用场景的仿真。公司坚持核心技术的自主创新,在流体仿真领域拥有基于气体动理学模型的 三套先进算法,分别是气体动理学算法(GKS)、直接模拟蒙特卡洛(DSMC)方法、光滑粒子流 体动力学(SPH)方法,均为基于高性能计算的行业前沿算法,核心技术具有较强的先进性。

公司产品分为工程仿真软件和仿真产品开发两大类。其中,工程仿真软件属于通用型仿真工具软件, 近三年收入占比达 50%以上,毛利率高达 95%以上。工程仿真软件可进一步细分为单一学科仿真软 件、多学科仿真软件和工程仿真优化系统。单一学科软件是公司用于流体、结构、声学、电磁、光 学、测控等领域仿真软件的统称,可以单独实现不同场景、不同工程环境的仿真模拟计算,是通用 型工具软件。多学科仿真软件是将多类别的仿真软件与多类型的仿真系统集成在一个仿真环境下运 行,帮助客户提升复杂工程整体设计的效率,多学科仿真软件以单一学科软件为基础。工程仿真优 化系统是在产品系统及详细设计、试验验证、生产等阶段引入仿真分析方法,实现产品设计、生产 全周期的仿真驱动,提升解决工程实际问题的能力。仿真产品开发业务主要为军工单位及科研院所 等客户提供定制化的仿真解决方案,主要包括解决特定工程问题的纯仿真软件产品开发,仿真-试验 融合验证系统、高性能平台、仿真云平台等。

公司具备优质军工客户资源,基本盘稳固。公司客户群体涵盖中国航发、中国船舶、航空工业、航 天科技、航天科工、中国电子、中国电科、中核集团、中国兵工等九大军工集团及中科院下属的科 研院所,国防军工领域对于自主可控要求较高,国外厂商难以进入。根据公司招股说明书,公司前 五大客户主要集中于军工领域,军工单位及科研院所客户是公司收入的主要来源,公司拥有十余年 服务军工行业客户的经验积累,客户资源优势突出。

机器人已有订单落地。公司 24 年 2 月成立机器人事业部,其软件将涵盖从机器人的功能设计、构型 综合、性能分析到结构设计优化的完整研发过程。除此之外,公司还将提供专为机器人设计的仿真 解决方案。无论是基于模型(Model Based)还是人工智能(AI Learning Based)的技术路线,机器人运 动控制算法的开发都需要仿真的支持。一方面软件若想克服对硬件的依赖,实现同步开发,需要借 助仿真进行测试验证;另一方面,用于机器学习训练的丰富而多样的场景也需要通过虚拟仿真来提 供。公司将提供一个虚实融合的机器人仿真解决方案,通过环境交互机制、虚拟-现实误差迭代技术 实现更精准的仿真。根据公司在互动平台上的回复,公司机器人事业部的六维力和力矩传感器已经 实际运用在工程项目,比如数字孪生中信息采集。此外,公司还与联想研究院(上海分院)签订了 机器人订单,目前应用场景为电力巡检。

软件收入占比大幅提升,保持高研发投入

收入高速增长,软件收入占比大幅提升。公司近 4 年收入复合增速达 28.9%。2020-2022 年受益于国 防科技、航空航天等领域仿真产品开发业务需求增多,公司仿真产品收入大幅增长。2023 年,公司 加大工仿软件营销力度,公司软件业务实现收入同比上升 39.4%,占主营业务比例大幅提升。

保持高研发投入,盈利能力逐步恢复。公司 2020-2023 年归母净利复合增长率为 20.7%,2022 年公 司归母净利增速放缓主要是由于工业仿真开发需求增多导致毛利率下降以及研发投入加大,2023 年 公司软件收入占比大幅提升,带动毛利率提升 6.0Pcts。2023 年公司继续加大研发投入,研发费用同 比增长 20.1%,截至 2023 年 12 月 31 日,公司研发人员数量为 202 人,占比达 63.92%,研发投入 占营业收入的比例达到 32.9%。

每天写文不容易,《转发+点赞+评论》证明你来了


投顾服务号
热爱金融,擅长投资,愿与您分享与投资相关的一切!
 最新文章