真正的陪伴式机器人:会打麻将,能取外卖

文摘   科技   2024-08-18 20:02   上海  


机器人的饼你吃够了吗?


随着大模型的强势崛起,机器人再次以高调的姿态闯入了人们的视野。各大科技公司的机器人案例也为我们带来了十足的想象空间。


谷歌的机器人能够像专业运动员一样灵活地打乒乓球,号称最强人形机器人的Figure 02,已经在汽车工厂打螺丝。


而马斯克这边,放出豪言要带来猫女机器人,不仅能够烹饪、打扫家务、陪伴聊天,还能够提供真实的触觉体验,甚至能够“生孩子”。


这一切看似无比美好,但当我们回归现实,却会发现真正在实际应用中广泛落地的机器人,仍然是以工业机器人为主。


机械臂在工厂的生产线上完成焊接装配,机器车在物流仓储搬运货物。


别说“生孩子”了,和我们生活有关的场景少之又少。


而就在今天,天才少年稚晖君,在智元机器人发布会上,给我们带来能搓麻将、当保姆的机器人。


发布会在一个日常的生活场景中开始。



稚晖君让机器人做一杯“迷之饮料”萄气可乐,机器人提出疑问这是什么饮料。稚晖君告诉机器人萄气可乐就是在可乐中加葡萄汁,葡萄和可乐在桌子上。


短短两句提示,机器人就明白萄气可乐的制作方法,并且操作搅拌机,制作了一杯。


生活机器人和工业机器人最大的差别在于任务环境的复杂性上,工业机器人大部分情况面临的是重复性工作,而生活机器人面对的是千人千面的需求。


这就需要生活机器人很强的泛化理解能力,能明白主人的指令,不需要人类去一一指导。


而完成饮料制作的机器人就是本次发布会的主角之一—远征A2-W。



新发布远征系列机器人,采用家族化设计语言,结合轮式与足式两种形态,覆盖多种应用场景。


机器人远征A2-W,专为柔性智能制造场景打造,双臂协作与全域可达,其主动自由度22个,续航超过5小时,每秒可行走1.5米以上。


机器人的自由度是指机器人机构能够独立运动的关节数目,它决定了机器人动作的灵活性。远征A2-W的22个自由度相较于4-6个自由度的机械臂来说,性能强了不少。



重载特种机器人远征A2-Max,拥有腿部直线驱动关节与高扭矩关节模组,以其力大无穷的特点,能轻松应对各种任务。


在场景剧中,轻松举起40公斤的重物。值得注意的是,稚晖君并没有一板一眼的对机器人下达搬走眼前重物的指令,而是随口一句“抱走抱走”。



远征A2机器人直接登台当主持人,介绍了远征A2系列机器人家族,展现了流畅自如的讲解能力和稳定自然的运动功能。


远征A2全身采用外骨骼设计,身高体重都与成年人类相仿,可续航超2小时,行走速度每秒1米。



远征系列机器人,内嵌大语言模型,可实现超拟人音色语音对话,各种技能都可以持续学习。


在核心零部件上,智元机器人类比新能源汽车三电系统,将机器人系统分为动力域、感知域、通信域、控制域四大领域。


动力域层面,智元机器人去年发布的PowerFlow关节模组今年已实现量产化迭代,新款PowerFlow不仅在参数上有了显著提升,更在可靠性和稳定性上进行了大量优化与测试,确保了商用量产的品质。



灵巧手也迎来了重大升级,自由度数从11个跃升至19个,主动自由度翻倍至12个,基于MEMS原理的触觉感知和视触觉感知技术,升级后的灵巧手在物体操作和感知上都展现出前所未有的灵活与精准。



因此,远征机器人的灵巧手可以完成各种精细操作,像穿针引线,用刀片拆快递等。



借助传感器,还能识别麻将的点数,以后再也不用担心三缺一了,不知道4个智元机器人打麻将谁会赢。



感知域,机器人整合了 RGBD 相机、激光雷达、全景相机等多种传感器,同时引入自动驾驶领域的 Occupancy 等先进感知方案,并借助 SLAM 算法增强对环境的理解能力,以此保障机器人在复杂环境中能够安全且高效地导航。



通信域层面,智元机器人自研了具身原生、轻量化、高性能的智能机器人通信框架AimRT。而且,AimRT将在9月底开源,完善这一原生面向具身智能机器人的通信框架,推动机器人通信技术的进一步发展。



在控制域,智元机器人基于 Model-based 的算法已实现场景的成熟落地,同时正在大力推进 Learning-based 路线。


两种算法的有机结合,让机器人在复杂环境中,也能走得稳。



发布会上,稚晖君还公布了智元机器人的具身智能技术演进路线图,将机器人的发展水平划分为5个等级,从G1基础自动化需要人工编程机器人,到G5搭载AGI的机器人,每个等级代表不同的智能水平和能力。



稚晖君表示,智元机器人已经在G2路线取得了突破,位姿估计模型UniPose、抓取模型UniGrasp,力控插拔模型UniPlug等通用技能都已经部分实现。



稚晖君还展示了智元机器人在G2原子能力的落地应用——销冠级别的汽车销售。


顾客进门时,识别出顾客的个人信息购车意向,用流利的语言介绍车辆信息,并且可以自动规划任务的优先级,可以随时打断任务。



比如在顾客看车的空余时间,机器人用外语给老外指了下路。还能基于算法,为顾客带来指定的饮料。



稚晖君在讲解机器人路线时着重强调,对于机器人能力提升而言,“有多少人工就具有多少智能”依然成立。大模型数据容易获取,但机器人的数据并不丰富。


为此,智元机器人面向数据开展了大量基建工作,针对数采本体、遥操设备、数据平台等三个机器人数据痛点,形成了一套完整的全流程具身数据方案AIDEA(Agibot Integrated Data-system for Embodied AI)。


AIDEA打通了“数据采集-数据标注-数据管理-模型训练-模型评测-模型部署-数据回传”全链路,并且有望在今年第四季度,开源首个百万条真机、千万条仿真数据的具身数据集。



在发布会最后,稚晖君还带来了one more thing——灵犀机器人。该由智元X-Lab,也被称为“稚晖君实验室”,不到10个人花费两个多月研发而成。


灵犀X1身高133厘米,体重不到66斤,十分小巧。让手机本身的麦克风、扬声器、屏幕等硬件,以及网络、AI算力等软件能力,为机器人带来新的突破。



灵犀机器人最大的特点在于关节模块化,全身30多个自由度的性能,全靠两款全新研发的关节。因此,灵犀X1做到了极致的标准化。而且灵犀X1的设计图纸、软件框架、中间件源码,以及基础运控算法都将全面开源。


灵犀X1还创新推出“机机模式”,用户可以直接拿手机当成大脑,带来了更多的可玩性。


开启了“人形机器人人人造”的时代。



雷·库兹韦尔雷·库兹韦尔曾预言:“人机交互的未来,将是机器人以更加人性化的方式融入我们的日常生活,成为我们不可或缺的伙伴。”


但这个伙伴能不能价格再低点。



全文完。




作者:董道力

编辑:张泽一

视觉设计:疏睿

责任编辑:张泽一


关于「新硅NewGeek」:我们以AI为圆心,追踪科技领域的方方面面,努力用最简单的方式阐述技术是如何改变世界。敬请关注。

新硅NewGeek
追踪每一个硅基生命的动向
 最新文章