紫金港资本 | 是时候重新认识机器人了

文摘   2024-11-27 10:05   中国  

如果说去年最火爆的话题是人工智能大模型的话,那今年最火爆的话题就是人形机器人的话题了。

 

10月11日,在特斯拉WeRobot发布会的现场,人形机器人Optimus与观众互动,现场展示了跳舞,倒酒,分发礼品和玩游戏的能力。而8月世界机器人大会。有169家企业参展,现场展出了各式各样的机器人,中国企业产品也大放异彩。


图片:世界机器人大会
一时间人形机器人,具身智能等,话题不绝于耳。人们似乎又看到了新的千亿赛道的起飞。但是怀疑的评论也不绝于耳:机器人不实用、成本高、智能化程度低、没有使用场景等问题仍然被诟病。

那到底机器人赛道是迎来了新的纪元,还是又一个类似于元宇宙的炒作?

想要回答这个问题,还要从机器人的伦理道德说起。

机器人有性格吗?

我们先回答一个问题,谁应该为自动驾驶的事故负责?这个问题的答案和自动驾驶是处于L4还是L5有关。当自动驾驶处于L5完全自动化的状态下,驾驶员可以完全不干预,车企可以为自动驾驶的责任买单。但是实际上现在很多车主把L4阶段的车当成L5在开。当出现意外时,都会下意识以为车子能够避障,不需要接管。最后是司机为这份失误买单,可能付出的是生命的代价。

但这个问题对于一个机器人来说,就复杂得多。当把自主决策的任务从仅仅是驾驶,扩展到整个人类社会的范畴,意外情况和识别算法的训练强度要高多个数量级。机器人的好坏,出产的公司对此负有极大的责任。但是使用中的问题,使用者负有更大责任。

可以对标汽车的自动驾驶级别来划分机器人的智能级别,级别4的高度自主性可以类比L4。机器人能够理解复杂的环境信息,做出决策,并执行复杂的任务,但仍可能需要人类的远程监督。像特斯拉的Optimus等机器人被认为能达到级别4。下一个阶段将往完全自主化的级别5演进,最终要达到级别6的通用人工智能,具有人类相同的智能水平。

如果擎天柱机器人在倒酒的时候把酒倒到客人身上,相信大部分人会认为是机器人出了问题。追本溯源很可能是使用不当,而不是算法不对。毕竟现在机器人还不能完全自主,使用者的事前调试和设置也很重要。

机器人有道德吗?
在军事领域,机器人上战场杀敌,如果是自主决策开枪,那他的行为的责任是制造商承担还是发动战争的军事指挥部承担呢?机器人在生产线上,操作失误,导致别的设备受损,是机器人的操作员的失误,还是算法的责任?他是能同情弱者,还是会助纣为虐?

图片:AI生成

就像不同的汽车品牌,自动驾驶性能不同,算法不同,走的传感器技术路线也不一样,最终呈现的智能驾驶状态也不一样。不同的机器人公司,在产品路线上也展现出各家的特色。因为机械结构设计的差异,训练素材的差别,所造机器人也会呈现出差别巨大适用性和专用性。或者说不同公司生产的机器人性格不同就像现在不同公司的大模型也表现出了极具差异的性格。
性格不是问题,问题是有缺陷的性格被利用了,就可能出问题。
未来,这些林林总总不同性格的机器人充斥我们的生活,我们很难一概而论地对其进行评价。也许有的具有自主意识,有的只是更高级的工具。购买者也购买前,可能也要先做一套题,搞清楚在什么情况下使用才是得当的。错误的互动和引导,可能会造成机器人的暴走。
另一个更加社会化的问题是劳动人口也许更少,失业情况也许更严重,机器人对于人类社会的影响可能十分深远。那么不是机器人为了自由先起义造反,而是人类会想要砸烂机器人,要跟机器人争当牛马。
想要对机器人的未来演化有更好地预判,就需要知道他们是怎么设计的。
文末,我们再回来讨论以上几个问题。

机器人是如何设计和制造的?

下文将进入更加硬核部分,分人形机器人、具身智能和关键零部件三个篇章展开。

人形机器人

如果说智能汽车是现在最大的科技智能载体,上一代是手机,那下一代就是人形机器人。特斯拉开发的Optimus的目标是成为一个通用型机器人,能够执行多种任务,适应不同的工作环境和家庭环境。他将走进千家万户,具备商业化和规模化的特点。
知名的人形机器人品牌还包括波士顿动力的Atlas、丰田的T-HR3,优必选Walker、小米铁大等等。早期的人形机器人公司的主要研究集中在动力学、平衡性、识别和避障方面,近年因为AI大模型的技术引入,机器人在真实世界交互和环境识别上有飞跃式提升。
国内众多公司纷纷加入机器人赛道,按基础禀赋可分成四类,包括不限于以下公司。
人工智能类
机器人制造类
科大讯飞 
商汤科技  
千寻智能 Spirit AI 
星尘智能S1 
逐际动力CL-2
优必选WalkerS1 
智元机器人 
达闼机器人 Cloud Ginger 2 
傅利叶GR-2 
宇树科技G1 
云深处DR01
家电类
汽车类
小米(铁大) 
海尔(夸父) 
美的 
格力 
追觅科技
华为
宁德时代
小鹏机器人PX5 
奇瑞汽车Mornine 
长安汽车
根据基础禀赋的不同,各家公司发力的方向也不一样。人工智能公司如科大讯飞,主要是通过机器人的载体来体现其人工智能大模型的应用广泛性,从家用教育机器人的方向延展到工业机器人。机器人制造类的公司着力于机器人的运动学,像宇树科技从四足机器人(机器狗)开始研究,掌控零部件技术和运动系统控制技术后,也推出人形的机器人,视觉感知训练结合实际场景,有较为深厚的积累。
图片来源:宇树科技官网

家电类企业因为具有成熟的供应链体系和销售渠道,通过并购和自研的方式也迅速切入机器人赛道。车企以特斯拉为代表,因为技术平台的同质性,本身车厂生产需要用到大量工业机器人,有先天的制造优势,进入机器人赛道自然是顺利成章的事。

关键零部件

机器人零部件与汽车零部件之间存在一定的技术演进关系和相似性。以下使用表格形式对比:
两个产业在技术互补与融合、成本效益优化、制造工艺提升以及智能化与自动化这四个方面有协同的意义。在于,它们共同推动了跨行业的技术进步和产业升级。通过共享和借鉴彼此的先进技术,机器人和汽车行业能够实现更高效的生产流程、更优质的产品质量以及更具创新性的产品功能。这种协同发展不仅降低了制造成本、提高了产品的性能和可靠性,而且还促进了智能制造和自动化技术的应用。这也许就是马斯卡最早布局两个产业的初衷。
以下从四个大类来进行更深入的分析。

大小脑

人形机器人的设计原型就是人的身体。其决策系统参照人的大脑控制行为的过程大脑具有混合架构,其中不同的、部分模块化的大脑子系统贡献了独特的互补功能。同时,大脑结构也是分层的,由多个可分离的控制组件组装而成。大脑,尤其是大脑皮层,主要负责高级认知功能,如思考、决策、语言、记忆、学习等,它还涉及感知、情感和社会行为的复杂处理。小脑主要负责协调运动,维持身体平衡和姿势,以及精细运动的调节。它还参与预测运动结果和调  整运动以优化性能。部分身体的反射和运动控制也可不经过大脑,直接做出指令,比如膝跳反射、自主神经系统得控制。
图片:AI生成

机器人的决策系统也可以分为大脑和小脑和端侧计算。越来越多的公司将决策系统做出区分设计。机器人的大脑负责处理高级的认知功能,如环境感知、行为控制、人机交互等,用高算力的芯片架构,像一台告诉服务器一样,帮助机器人做出推理和图像感知计算。计算系统使用的是高性能的CPU+GPU架构,甚至用到专用的AI芯片。
而小脑则专注于整合感官数据并控制运动、平衡和身体姿势。主要是对身体的精细运动进行计算和控制,如运动路径规划等,可能会使用可编程门阵列(FPGA)或特定应用集成电路(ASIC)进行高速信号处理和控制,以满足机器人对实时性、精度和效率的特殊要求。这种分工使得机器人能够在执行复杂任务时,大脑和小脑能够各司其职,同时相互配合。
例如,在执行“倒水”这样的动作时,大脑会根据环境信息和任务要求做出决策,而小脑则负责控制机器人的肢体精确地完成倒水动作。
除了控制、感知、决策三大核心模块以外,在人形机器人的语音识别与交互模块中也集成了部分芯片,这些芯片在麦克风阵列、语音芯片、音频处理单元等组件中,协同帮助该模块具备语音识别、语音合成、噪声抑制和语音增强等功能,更进一步还可以实现情感识别和生成、离线语音交互等丰富能力,同时与机器人的控制系统紧密相连,负责远程控制和数据交换,最终助力实现机器人语音通信功能。
而部分更精细的伺服电机和减速器等的控制,则由存在于各个部件中的MCU完成计算。
目前市场上主要的芯片公司包括英伟达、英特尔、高通等美国品牌,国内主要的芯片公司包括但不限于华为海思、中芯国际、中环股份、华天科技、寒武纪等。我国目前正在重点研发具有高动态运动驱动、高速通信等功能的专用芯片,来提升人形机器人的运动控制、认知决策等计算效能。国产芯片虽然在追赶,但是走在正确的道路上。

灵巧手

人类的手可能是大自然造物中最精巧的设计之一,在素描绘画中,想画好一只手也需要有十足功力。在机器人科学中,灵巧手(dexterous hand)的设计是一个高度复杂的工程挑战,它涉及到机械工程、电子工程、材料科学、计算机科学和生物力学等多个领域。
除了柔性机械臂和机械手以外,目前的机械结构设计都由关节和手指组成。每个关节的自由度(DoF)决定了手的灵活性和能够执行的动作范围。优必选的机械手有17个自由度。特斯拉的灵巧手有22个自由度,Linker Hand灵巧手产品最高拥有42 个自由度,远超全球领先产品Shadow Hand的26个自由度,成为全球自由度最高的商用灵巧手产品。每根手指最高可独立拥有9个自由度,甚至超越了人类手指的自由度。
灵巧手基本构成是电机+减速器+编码器+驱动器,优化构成是传感器(力传感+电子皮肤)。有研究指出,特斯拉Optimus灵巧手构成为空心杯电机 + 多级行星减速器 + 编码器 + 驱动器。传感器端(比如说指尖的3D Touch触觉传感器(电子皮肤),或是集成在空心杯关节端的微型单维力传感器)。
灵巧手要实现更加精准的控制和更高的抓握力,主要靠的是零部件的小体积和大功率密度。当然也是在低成本和量产的角度来讨论。
因此我们认为手部关节有模组一体化的趋势,也就是单个厂商能提供一体化的产品,类似于整手的方案。未来发展传感器的需求也会增加,触觉传感器包括:六维力传感器和机器人手指表面的阵列式的触觉传感器。
目前大多的多指灵巧手外观多为仿生设计(五指灵巧手),也有人形机器人企业根据场景不同采用二指夹爪、三指手等其他样式(如星尘智能旗下轮式机器人S1采用二指夹爪、银河通用旗下轮式机器人G1采用右夹爪和左吸盘组合、 UniX AI旗下轮式机器人Wanda 采用三指夹爪);目前不少人形机器人本体厂商选择自研灵巧手(如:特斯拉、智元机器人、Figure AI、星动纪元等),并涌现出一些以灵巧手作为卖点的人形机器人本体厂家(如:戴盟机器人、 因时机器人、帕西尼感知等);

减速器

减速器是个容易让人误解的部件,实际上减速器的目的并不是为了减速,实则是一组由大小齿轮组成的力矩放大器,用于增强电机运转的扭力。通过减速器搭配电机的使用,机械臂的抓取能力和灵巧手的握力都得到了极大的提高。山地车上的变速器就是减速器的例子,通过换挡切换齿轮盘,在上山的时候可以获得更有力的感觉,当然速度相对也会慢一些。
人形机器人中主要用到的三种精密减速器类型分别是谐波减速器、行星减速器和RV减速器。
行星减速器
图片:行星减速器示意图

行星减速的传动原理是驱动源启动太阳齿轮,太阳轮带动行星齿轮运转,动力从连接行星轮的内齿轮环和出力轴输出,实现减速。
行星减速器具有高刚性、高精度和强耐磨性,适用于人形机器人的手指等末端关节,但其减速比较低且精度稍差。
全球精密行星减速器市场主要被少数几家企业所占据。德国企业处于领先地位,如纽卡特、威腾斯坦、赛威传动等,其他竞争力较强的还有日本企业,例如新宝、住友和电产等。国内行星减速器主要布局厂商有科峰智能、中大力德、新时达、宁波东力、绿的谐波等。
谐波减速器
图片:谐波减速器示意图
谐波减速器是⼀种靠波发生器使柔轮产生可控的弹性变形波,通过其与刚轮的相互作用,实现运动和动力传递的传动装置。谐波减速器具有单级传动比小、体积小、质量小、运动精度高并能在密闭空间和介质辐射的工况下正常工作的优点。
我国谐波减速器市场2023年TOP5厂商出货量占比超过60%,国内⼚商绿的谐波和来福谐波等已实现规模化量产,其谐波减速器产品已全系列覆盖智能机器人旋转模组要求,德福机器人、大族传动、国茂股份、丰立智能等⼚商也在加速布局。
RV减速器
图片:东和电气RV减速器

RV减速机由一个行星齿轮减速机的前级和一个摆线针轮减速机的后级组成,RV减速器具有结构紧凑,传动比大,以及在一定条件下具有自锁功能的传动机械,是最常用的减速机之一而且振动小,噪音低,能耗低。
RV减速器设计相对复杂,加工工艺较难,卡脖子环节除了材料还有高端数控机床。国内 RV 减速器相对集中,两大龙头占据超过⼀半市场份额。
2023 年全球巨头纳博特斯克和我国厂商双环传动市场份额合计超过60%,整体集中度较高。海外主要⼚商还包括日本住友等,国内该领域布局厂商除双环传动外,主要参与厂商还包括珠海飞马、中大力德、秦川机床、南通振康等。

传感器

新⼀代特斯拉人形机器人配备了先进的传感器,包括2D相机、手部触觉传感器和力传感器等,能够更细致地感知物体和环境,为机器人提供丰富的数据支持。
六维力矩传感器
六维力传感器(Six-Axis Force Sensor)是一种能够同时测量三个正交方向上的力(Fx, Fy, Fz)和三个正交方向上的力矩(Mx, My, Mz)的传感器。
图片:六维力示意图
因为六维力传感器可以应用在航空航天领域,用于测量气动力和力矩,因此国内有不少航天科研院校在推进传感器的研发。大疆、安培龙、中航智绘、新松机器人、博众精工、固高科技等也在进行相关研发。
柔性传感器
技术全球领先的三大厂商包括Novasentis、Tekscan、JDI等。国内柔性传感器主要应用于消费电子领域,人形机器⼈领域的引用目前尚处于验证和测试阶段,尚未实现大规模应用。国内柔性触觉传感器相关企业包括汉威科技、帕⻄尼感知、苏试试验、中科纳芯、墨现科技、申昊科技等。
AI机器视觉传感器
人形机器人的视觉传感器包括ToF深度相机、激光雷达、多目视觉等。其传感器方案和需求场景与自动驾驶存在类似之处,因此价值量较高的自动驾驶类传感器存在新的机遇。此外,自动驾驶传感器⼚商、机器视觉⼚商都是人形机器人传感器的潜在参与者。机器视觉系统相关代表⼚商包括奥普特、纬朗光电、福光股份、海康机器人、天准科技、矩子科技、凌云光等。
其他关键零部件还包括丝杆、电机和轴承、电池、控制器、驱动器等等,在此不一一展开。

具身智能

今年提的最多的概念其实还不是人形机器人,而是具身智能。具身智能是依靠机器人等物理实体与环境交互来实现智能增长、行动自适应的智能系统。
具身智能(EmbodiedAI),是一个涉及人工智能、机器人学、认知科学等多个领域的综合性概念。不同于人形机器人强调的“长得像人的机器人”,具身机器人的外形更具有多样性。
图片:电影《星球大战》

星球大战这个剧照很好说明了两者概念的区别。C-3PO就是人形机器人,2R-D2则是具身智能。具身智能同类的电影形象还有《星际穿越》中的TARS。
图片:电影《星际穿越》

《机器人总动员》中的WALL-E
图片:电影《机器人总动员》
相较于人形机器人,如《终结者》中的T-800,《我,机器人》中的NS-5,还有《底特律变人》中的康纳,人形机器人替代人的工作,具身机器人更像是专用机器人。
但实际上两个概念的着重点不在于外形。具身智能不等于“大模型+机器人”,准确来说是人工智能+机器人。从载体看,具身智能可以搭载任意形态的机器人,人工智能通过智能实体与物理世界发生交互。这就是为什么,在大模型提出之后,具身智能的概念又再被广泛提起。
人工智能

在本文最后的部分,我们再聚焦到人工智能的部分。

机器人涉及的人工智能算法和模型非常多样,它们各自在机器人的不同功能和应用中发挥作用。下面用表格的形式总结了机器人涉及的主要人工智能算法和模型及其用途。
进行AI的训练需要大量的高质量数据。数据是泛化的关键,但涉及机器人的数据稀缺且昂贵。
为了适应复杂环境和任务的泛化性,智能体规模变的越来越大,而大规模的模型对于海量数据更为渴求。现在的LLM通常需要web-scale级别的数据来驱动基础的预训练过程,而针对具身智能的场景则更为复杂多样,这造成了多变的环境和任务,以及围绕着复杂任务链的规划决策控制数据。尤其是针对行业场景的高质量数据,将是未来具身智能成功应用落地的关键支撑。
耦合的本体,需要实际部署到真实环境中,才能够采集数据,这也是和非具身智能的明显不同。数据也并不是越多越好,高质量意味着无论是图形还是图像、数据还是标识,都需要能帮助智能体识别出新的范式,覆盖更多的Corner Case,从而让智能体看上去更加聪明。

回答开篇的问题

在未来机器人的发展过程中,需要注意的道德和伦理问题涉及多个层面,包括机器人的伦理设计、使用过程中的伦理责任、未来技术可能带来的社会影响以及相关法规和公众参与。在伦理设计方面,确保机器人的决策过程透明和可解释,同时严格保护用户隐私,是基本要求。在使用过程中,明确责任归属,特别是在机器人或AI系统出现错误或损害时,以及考虑自动化对就业市场的影响和如何减少算法偏见,都是重要的伦理考量。未来技术发展,如自主武器系统、情感机器人以及可能的机器人权利问题,将引发更多伦理讨论。
此外,制定和遵守伦理准则与法规,确保技术安全和符合道德标准,也是不可或缺的。通过公众参与和道德教育,提升社会对机器人技术的理解和接受度,确保技术发展方向符合社会价值观,是未来机器人技术健康发展的重要保障。
每次看到机器人发布会的视频,那些看着“笨重”的智能体艰难地重复着傻傻的动作,缓慢地完成一些在人类看来十分简单的工作的时候,我都会想起自家学龄前的孩子,在联系搭积木的时候,是多么的可爱。虽然不完美,但是每天都在朝着更加美好迈步。
机器人技术的突飞猛进是让人惊讶的,虽然不一定在五年内,人形机器人能走进千家万户,但是我相信在有生之年,会看到一个丰富且多样的机器人世界与人类世界交织在一起。我们总是低估未来的潜力,却高估当前的成就。
一个大风口已经形成,也可以预见在海量资本和企业冲入赛道之后,厮杀变得白热。真正能活下去,走到头的公司绝不是靠视频融资的企业,而是真正沉心研究的硬科技公司。形成独特硬核的产品,解决市场的需求才是王道。
图片:AI生成

我们也许不太需要考虑机器人的品牌和算法给它性格带来的差异问题。就像自动驾驶的车辆少了加塞和鸣笛,开车规规矩矩,就不太需要担心安全和交通的问题。机器人总是单纯的,但是别有用心的人会利用机器人做什么邪恶的事情,却难以防范。对于人与机器共存的社会,我抱持欢迎态度,到时自有迎刃而解的答案。
机器人由人制造,也应拥有人类的基本道德底线,或是继承人类的性格缺陷。就算可能沦为战争机器或是犯罪工具,幕后指使也是人类。
与其担心机器人抢走体力劳动者饭碗,不如担心人工智能是不是已经抢走自己的饭碗。机器是否会替代人类,这个答案几乎是肯定的。但是随着社会发展,人们总会再创造出一些新的机会,是仅留给冒险者的机会。





推荐阅读

紫金港资本十周年庆典
凝心聚力 共创未来 | 紫金港资本2024新春年会


紫金港资本全体员工2024年度大会

CEO对话 | 智美科技毛月辉
挠性覆铜板(FCCL)行业报告


END
关于紫金港资本
紫金港资本成立于2014年,其主要发起人皆有平均20年左右的投资和企业管理经验,并有深厚工程技术背景,为投资赋能型管理人组合。紫金港资本目前已完成近100家硬科技项目的投资。紫金港团队倡导国际化视野,目前通过香港基金专注国际硬科技投资。
公司管理基金规模逾50亿元,已成功完成对杰普特(SH688025)、艾特网能(SH600510)、欣锐科技(SZ300745)、和铂医药(02142.HK)、微泰医疗(02235.HK)、波长光电(SZ301421)、连连数字(02598.HK)、善康医药、恒瑞源正、诺尔康、步锐科技、馨海生物、瑞华制药、源兴基因、柔灵科技、泰研半导体、启尔机电、大象声科、木王科技、邻汇吧、贝特利、华思旭、博华新能源、永联科技、赛思电子、昂科技术、新菲光通信、时森海医药、晶蛋生物、玉汝成等众多优质企业的投资,投资领域涵盖集成电路、智能制造、医疗健康、新材料、TMT、人工智能等



紫金港资本
成长中国,价值发现
 最新文章