未来就绪,准备“进厂打工”的人形机器人丨《科技瞭望塔》第二季

科技   2024-09-05 18:36   北京  

从小时候看的动画片《变形金刚》到长大后的动作电影《终结者》,人们对于人形机器人并不陌生。所谓人形机器人,简单理解就是具有人的形态,包括头部、躯干、手臂和腿部,可以完成人类肢体能完成的运动、任务,并具有类似人的感知、学习和认知能力的机器人。在机器人的发展历程中,由于“人形”能够完成的动作更多、更灵活,并且在外形上与人相似,更具亲和性,也被业界普遍认为有望成为机器人的终极理想形态。

近年来,伴随着机器人控制系统、智能传感、人工智能等技术的成熟应用,特别是大模型与生成式AI技术的突破式发展,人形机器人已成为多方竞逐未来产业的新赛道。根据国际机器人协会预测,2021年至2030年,全球人形机器人市场规模年复合增长率将高达71%。中国电子学会的调研数据显示,到2030年,我国人形机器人市场规模有望达约8,700亿元。

然而纵观人形机器人的应用开发现状,在产业井喷的背后,其发展过程中的痛点也不容忽视。在针对人形机器人感知能力、智能化、平衡性等核心技术层的创新迭代过程中,业内对于人形机器人的角逐开始向垂直应用场景赋能。在现阶段,如何降低人形机器人成本、深耕应用场景、实现商业价值落地,将成为人形机器人发展的关键。

本期联想创投《科技瞭望塔》栏目,邀请了国内领先的具身智能与人形机器人解决方案供应商北京星动纪元科技有限公司(下文简称“星动纪元”)创始人陈建宇教授,就国内外人形机器人市场的发展现状、核心技术和重点方向等问题进行了深入探讨。

北京星动纪元科技有限公司创始人陈建宇教授

在陈建宇看来,未来5~10年将是人形机器人的“黄金发展期”。如果以自动驾驶级别L1-L5类比,目前人形机器人市场总体处在L1→L2的层级,接下来2~3年在细分垂直领域的场景落地将是人形机器人发展的关键。例如在制造业,人形机器人的主要应用场景包括物品搬运、拾取和放置、质量检测、装配,以及完成一些高危作业等。

陈建宇强调在这个过程中,一方面需要持续在“大脑、小脑、肢体”方面进行技术创新,提升人形机器人的关节自由度、肢体平衡性、感知与控制并行处理能力,特别是在融合应用AI大模型技术之后,人形机器人能够适应于更加广泛且复杂的场景和任务;另一方面,需要借助工艺优化、材料创新、供应链优化等方式降低成本,无论是从复杂性还是零件数的角度,未来人形机器人的成本将远低于一台汽车,大约在2035年,人形机器人将能够满足人们的个性化需求,走进千家万户。

以下为访谈实录:

联想创投:人形机器人一直被认为是“男人的浪漫”,您当初为什么选择人形机器人这个赛道?您创立星动纪元背后有着怎样的故事?

陈建宇:与很多人一样,我从小也被各种影音动画中的机器人所吸引,对打造属于自己的人形机器人抱有一个梦想。2011年进入清华大学的本科期间,我一直进行有关机器人硬件与算法的学习和研究,并且将本科的毕业论文设计方向定为双足机器人步态规划。随后在前往美国加州大学伯克利分校读博期间,我更聚焦在无人车、机械臂的算法领域,诸如模型预测控制(MPC)以及强化学习等。
2021年底,对于人形机器人的热爱使我转而开始思考,如何能够实现人形机器人的落地应用?落地需要解决哪些技术难点等?我们熟知虽然人形机器人研发的帷幕在半个世纪前就已经拉开,但更多局限在实验室环境内,主要以一些Demo演示为主。从2022年开始,我在清华大学以课题的形式展开对人形机器人的研发创新,以实际场景为标准,结合通用智能去研究人形机器人的应用与价值落地。
2023年,通过进一步对我们的研究项目进行孵化,形成了现在的星动纪元。星动纪元的成立使我们能够加速自主创新步伐,加快对于人形机器人难点技术攻关;另一方面,我们也推出了自身人形机器人解决方案与相关产品,并保持高速迭代优化。

北京星动纪元科技有限公司机器人(图片来源于官网)


联想创投:如果以自动驾驶L1-L5层级为例,目前国内人形机器人发展处于什么阶段?主要有哪些典型的应用场景?

陈建宇:以自动驾驶级别L1-L5类比,我认为目前人形机器人市场总体处在L1-L2的层级,这其中L1-L5层级大致分为:


L1:能够遵循固定的轨迹和预设的动作完成任务,例如用于焊接、喷涂的工业机器人。


L2:通过感知控制的一体化,能够以闭环控制的方式完成动态目标任务,并具有一定的泛化性。例如同样是喷涂工作,L2级别能够根据目标的不规则外表自动调整作业角度,完成更加复杂的任务。


L3:将大模型融入人形机器人“大脑”中,可以做到多任务的泛化,完成复杂决策和人机交互。


L4:迎来人形机器人的ChatGPT时刻,具备通用的常识,可以感知物理世界,快速的在陌生环境中实现自我学习。


L5:如同人类个体般,具有非常强的自主决策、柔性操作和交互能力,甚至可能出现仿人的情绪和意识。


当然,L5级别仅存于理想中,目前来看经过2~3年的发展后,2027年人形机器人有望普遍进入L2阶段,在这个阶段也最容易爆发垂直领域针对细分场景的应用。此时人形机器人的优势在于不需要根据预先规划的目标来完成特定任务,而是通过感知周边环境进行理解、学习并做出决策。例如在制造业,人形机器人的主要应用场景包括物品搬运、拾取和放置、质量检测、装配,以及代替人工巡检,完成一些高危作业等。

联想创投:如果把目光放向您提到的制造业,您认为人形机器人应该如何更好地适应人类各种工作环境和任务,与人类协作共融?

陈建宇:人形机器人在工业制造领域具有巨大的应用潜力和空间,例如在物品搬运时,人形机器人通过灵活多变的机械手臂和精细的手指运动,可以实现重型零件的快速搬运、拾取和放置。


在这个过程中,我们假设人形机器人和人类协作去搬运一个箱子,首先从物理层面我们需要考虑如何让人形机器人学会去配合人类施加合适的力;再进一步,人形机器人需要智能决策判定箱子搬往何处,为什么要搬运这个箱子等。


值得一提的是,安全性也是人机协作中的重要一环。从物理层面,设置功率和力限制可以从更底层限制对人带来的伤害;从智能化的角度,人形机器人应拥有安全算法核心框架,尽一切可能保护人类不受到伤害,实现人机共融。

联想创投:要想更好的发挥人形机器人的价值,您认为在“大脑、小脑、肢体”方面,人形机器人有哪些技术瓶颈需要解决?

陈建宇“大脑、小脑、肢体”是人形机器人的基本组成部分。在去年10月工业和信息化部印发《人形机器人创新发展指导意见》中就明确提出了,人形机器人的关键技术突破,是以大模型等人工智能技术突破为引领,重点在人形机器人“大脑”和“小脑”“肢体”关键技术、技术创新体系等领域取得突破。


“肢体”是人形机器人灵活运动的关键,强化机械臂、灵巧手以及腿足的力量十分重要。在这方面,星动纪元采用的是本体感知驱动器(准直驱)的技术路线,并自主研发了高爆发模块化关节,借以高强度合金、碳纤维和工程塑料等材料,峰值转矩高达400Nm,转速高达25rad/s,使双足和双臂具有更强的爆发力。在“肢体”灵活性方面,星动纪元采用了高精度力位混控模式,集无框力矩电机、精密行星减速器、高精度编码器、驱动器为一体,更加适合动态变负载的机器人应用。在“灵巧手”方面,相较于普通工业机器人的两指,星动纪元设计了12全主动自由度五指灵巧手,最大抓握力可达80N,能够精准、快速地做出如夹、捏、握、拧等动作,更好的应对复杂零部件的抓取。


“小脑”主要用于控制人形机器人运动。星动纪元主要采用端到端的强化学习方式,借助感知控制一体化的方式,使整个平衡性得以大幅度提升。例如当感知前方路面平整宽阔无障碍时,人形机器人可以调整步伐“健步如飞”;当感知到前面道路复杂容易摔倒时,会放慢步伐,保持自身平衡。


“大脑”则体现了人形机器人的环境感知、行为控制、人机交互能力。在这方面,星动纪元一方面融入大模型,使其能够指导人形机器人更好的完成任务规划;另一方面,用强化学习来反馈底层控制器数据。这种“大小脑”深度融合交互机制,也促使面对复杂问题时,人形机器人能够在上层迅速的进行拆解,配合下层肢体完成多样化的任务。

联想创投:面对生成式AI的蓬勃发展,站在人形机器人的角度,应该如何与AI大模型、脑机接口等前沿技术相结合,提升智能化水平?

陈建宇:以OpenAI推出的ChatGPT为标志,生成式AI技术在全球不断掀起热潮。实际上,人形机器人本身就是“具身智能(Embodied AI)”的重要载体。“具身智能”是指是在机器智能领域中,通过将智能算法与物理实体的感知、行动和环境交互相结合,使机器能够以更自然、更智能的方式与环境进行交互和解决问题的能力。


通过结合AI大模型,能够使人形机器人对物理世界有更准确的视觉、触觉、听觉等实际感知,这些数据借助大模型可以训练生成泛化性很强的动作库、技能库,加以通用的规划决策能力,使人形机器人更加智能。此外,生成式AI的发展也促使我们能够通过自然语言与人形机器人进行交互。例如,用户可以通过语音命令来控制机器人完成复杂工作,比如“帮我拣选1号螺丝钉”“将1号螺丝拧紧”等。


通过文本交互指令“小星”完成任务(节选自官方公众号)


联想创投:去年星动纪元推出了首款人形机器人“小星”并持续进行迭代创新,“小星”系列的特点和优势有哪些?大概保持怎样的创新周期?

陈建宇:“小星”目前已更迭到第六代。初代是在2022年底清华校园中完成的,二代是2023年7月份进行公开亮相,8月份紧接着推出了三代产品,2023年底完成了针对第四代的研发优化,春节推出了第五代产品,完成了所有核心零部件全自研,今年8月,星动纪元推出了第六代产品级的机器人,所有设计全面优化,成本也进一步下降。


相较于初代,目前第六代“小星”已经“长高”到1米7,可连续双脚腾空奔跑、上下楼梯、上下坡、自然步态行走,并在草地、崎岖等路面行走。通过在“大脑、小脑、肢体”方面的自主创新,“小星”具有双足爆发力强、双手灵巧度高、感知控制一体化、端到端的强化学习特点、深度融入AI大模型等特点,具有较高的泛化性,满足用户的多样性需求。

 
星动纪元人形机器人“小星”在草地上行走(图片来源于官网)

联想创投:尽管人形机器人的帷幕早已拉开,但从性价比的角度仍没有达到市场期望。您认为人形机器人何时能够大规模普及应用走进千家万户?

陈建宇:我认为人形机器人的大范围普及,真正能够满足人们的个性化需求,走近千家万户,大约需要5-10年。而现阶段,需要深耕场景,才能释放人形机器人的价值。因此在未来2~3年,星动纪元会先瞄准一些工业细分领域,打造适配场景应用的人形机器人。


从经济性角度看,我们会发现一台人形机器人在重量、工艺复杂性等方面都远低于一辆汽车。在降低成本方面,星动纪元主要是在制造工艺和材质方面进行创新,例如去除一些不必要的传感器,实现轻量化设计。此外,在人形机器人生产过程中,星动纪元会对供应链进行优化,通过与联想等进行生态合作,节省开支。最后,面对一些细分场景,用户可能不需要人形机器人的完整型态,星动纪元会在满足用户需求的基础上,减配一部分零部件,进一步降低成本。

 

星动纪元持续对“小星”系列进行创新优化(图片来源于官网)


后记


伴随着人形机器人相关技术的加速演进,已成为科技竞争的新高地、未来产业的新赛道。在今年初工信部等七部门发布的《关于推动未来产业创新发展的实施意见》中,将人形机器人列为创新标志性产品首位。星动纪元在陈建宇教授的带领下,以深耕场景、释放价值为核心,不断加速人形机器人的市场化进程。相信在未来感知智能时代的道路上,星动纪元将以技术创新和生态聚力为人形机器人发展注入强劲动能,带来更多人形机器人应用空间与可能性。




推荐阅读





联想创投
联想集团旗下的全球科技产业基金,专注于面向未来的科技产业投资,已投出上百家优秀企业,包括美团点评、宁德时代、蔚来汽车、旷视科技等;同时还孵化出拥有全球18亿用户的茄子快传,以及联想大数据、平安联想智慧医疗等10家优质子公司和创新业务。
 最新文章