作为科技老师,不得不谈下机器人,因为之前的机器人没有真正的爆发,所以市场一直没有太多的关注,今年的机器人被天才稚晖君打开了新的道路,有兴趣的可以深读下去哟。
智元机器人的稚晖君是去年8月离开华为的,然后他出来成立智元,主要是打造具备百亿参数大模型支持、而且成本控制在20万元以内的商业化智能机器人。智元的团队从100人扩展至350人,在期间有推出远征系列商用人形机器人。这些机器人可以搬运重物、制作饮品,甚至担任主持人。而且今年在10月,将量产200台双足人形机器人和100台轮式机器人。最近智元还公布了一系列开源计划,并发布了0元的模块化机器人产品灵犀X1,给市场降低开发门槛。
“任正非亲自面试”
1、稚晖君本名彭志辉,在B站上拥有超过250万的粉丝。他的游戏充电宝、自动驾驶自行车、模块化机械键盘、钢铁侠机械臂等,这些发明不仅在B站上获得了极高的点击量,还让他被网友亲切地称为“野生钢铁侠”。
稚晖君但是是通过七轮面试,加入华为“天才少年”计划,而且是任正非亲自决策,加入华为后加入昇腾,主要从事AI芯片及算法研究。他不仅部门绩效多次拿到全A,还获得了总裁奖、明日之星、金牌团队等奖项。
2、离开华为后,稚晖君创立了智元机器人公司,包括高瓴资本、经纬创投等在内的多家投资机构都对他的项目表达了兴趣并进行了投资。与他的团队在2022年8月创立,打造对标马斯克特斯拉“擎天柱”的通用智能机器人。刚成立团队规模约100人,但是经过一年的发展,团队已扩展到350人了,智元最厉害的是,从最开始的原型机到现在量产的远征系列商用人形机器人,一步步走来来之不易。
天才稚晖君便设定了明确的目标:开发一款成本控制在20万元以内的商业智能机器人,并支持百亿参数大模型。这一愿景在远征A1的发布会上初步展现,并得到了市场的广泛关注。仅仅一年,智元机器人不仅扩大了团队规模,还通过软硬件的深度整合和供应链优化,成功推动了远征系列机器人从原型到量产的转变。
远征系列机器人包括远征A2、远征A2-W和远征A2-Max三款产品,分别定位于交互服务、柔性智造和重载特种领域。这些机器人不仅在功能上实现了显著升级,还在实际应用场景中展现了出色的表现,如自主制作“萄汽可乐”、搬运重物以及担任发布会主持人等。
“40个主动自由度的关节”
1、远征系列商用机器人作为智元机器人的核心产品,例如远征A2的交互服务机器人,具备全身超过40个主动自由度的关节和仿生的灵巧双手,能够模拟出丰富且复杂的人类动作。他的多模态感知输入系统,是能够感知互动者的情绪,并通过高度仿真的音色进行自然对话。主持人机器人,展现了其流畅的讲解能力和灵活的移动能力。
2、远征A2-W则是一款柔性智造机器人,采用轮式平台,并配备了高精度传感器。它是能够在各种环境中快速且平稳地移动,而且是可以高效处理各种任务。A2-W还可以实操了“萄汽可乐”的制作过程极其强大的作业能力和灵活性。
3、远征A2-Max作为重载特种机器人,力大无穷、灵巧作业。能够轻松搬动40公斤的箱子,并在产品研发阶段不断优化性能。
“AIMA软件平台”
一年中时间,智元围绕动力域、感知域、通信域和控制域四大核心域进行了全面升级。
1、在动力域方面,智元机器人实现了PowerFlow关节模组的量产化迭代升级,并引入了基于MEMS原理的触觉感知和视触觉感知技术。
2、在感知域方面,公司集成了RGBD相机、激光雷达、全景相机等传感器,并引入了自动驾驶Occupancy前沿感知方案。提升了机器人的环境理解能力和作业精度。
3、在通信域方面,智元机器人自研了具身原生、轻量化、高性能的智能机器人通信框架AimRT。该框架不仅提升了性能、稳定性和系统部署效率,还完全兼容ROS/ROS2已有生态。
4、在控制域方面,公司结合了Model-based与Learning-based两种算法,进一步提升了机器人的运动控制与适应能力。公司预研了基于自然语言指令集驱动的AgentOS,以实现机器人技能的精准编排与高效执行。
5、智元机器人还构建了AIMA软件平台,以支持机器人系统的二次开发和生态系统构建。
“G1到G5的演进”
智元机器人在具身智能技术方面非常具有前言技术,提出了从G1到G5的演进路线。这一路线类似于自动驾驶领域的L1到L5等级划分,旨在逐步实现机器人从简单自动化到全面具身智能的跨越。
在G1阶段,机器人主要依赖手工设计的特征和简单的机器视觉进行任务执行。这一阶段的技术具有程序化、编程轨迹化的特点,但缺乏泛化能力。
在G2阶段,智元机器人提炼并抽象出了一系列可复用的原子能力,并通过大语言模型进行任务编排。这些原子能力使机器人在一定程度上具备了跨场景任务迁移的能力。
在G3阶段,公司转向了端到端的技术路线。通过大量数据采集和数据驱动的方式进行训练。
在G4阶段,智元机器人将重点放在了具身智能的深度融合上。在这一阶段,机器人不仅具备高度自主学习和决策能力,还能够通过传感器和执行器与环境进行实时交互,实现精准的动作控制和环境感知。通过多模态融合技术,机器人能够综合视觉、听觉、触觉等多种信息,形成对环境的全面理解,并据此做出更加合理的决策和行动。
在G5阶段,智元机器人追求的是全面具身智能的实现。在这一阶段,机器人将具备与人类相似的智能水平,能够完全自主地理解复杂任务、进行高效推理、并作出灵活应对。它们将能够在各种复杂多变的环境中稳定工作,与人类无缝协作。
转载请联系本公众号获得授权