具身 AI：智能机器已来

财富 2024-10-24 12:37 中国香港

感知、思考、行动。机器人技术使计算动起来。想象一下，未来 AI 不局限于数字领域，而是在我们的物理世界中移动和学习。AI 的下一个巨大飞跃不仅仅是数字化;它是具身的。

2005 年，Linda Smith 提出了具身假说，认为真正的人类水平的智能需要物理存在，就像婴儿通过探索环境来学习一样。虽然 AI 研究人员在论文上仍然存在分歧，但我们知道，随着我们与 AI 系统的互动越来越多（即从人类反馈中强化学习，或 RLHF），智能会发展和学习复合。

到目前为止，测试 Smith 的论文成本高得令人望而却步。AI 需要一种能够提供增量改进的商业模式，而由于相关的硬件和数据成本，机器人技术一直不太宽容。几年前，机器人研究非常注重强化学习和过于专业的学习方法，并且使用了大量数据。

我们现在看到了一条新兴的机器人绿地道路：将 LLM 嵌入到规划中，将 VLM 嵌入到感知中，将代码生成嵌入到驱动中。虽然现在还为时过早，但机器人技术将受益于整个 AI 社区的进步 - 利用对语言、多模态模型、视频和合成数据生成的任何改进。

这些具体系统将具有各种形状、大小、自主级别和功能。我们相信人工智能将用机器人填充我们的真实环境，而不是插入虚拟世界，这些机器人可以与我们的物理环境交互并从中学习。

考虑到这些潜在的进步，我们探索不断变化的市场格局、与机器人实施例相关的机会，以及机器人创始人的 GTM 策略。

‍一、为什么是现在？

大多数机器人行业的人都知道“机器人很难”这句话。这是支配这个领域的无名自然法则之一。从学术上来说，机器人技术体现了

Moravec悖论：

对机器人来说容易的事情对人类来说却很难，反之亦然。但更便宜的硬件、供应链的外包以及

ROS

等标准协议的采用使我们能够比以往更快地从原型到生产。

我们相信人工智能创新将促进跨行业的机器人应用进步，以下是我们认为突然出现新竞争的更多原因：

机器人技术是多因素的：机器人技术是一个系统问题——机械、电气、传感/感知、材料、固件——每个领域都有自己的发展时间表、方法和可预见的问题。随着软件和硬件之间的区别继续模糊，我们预计可以通过较小的团队来扩展开发（例如“来自物理和模拟”）。
更多地依赖虚拟模拟器：现实世界是无情的。模型根据它们所代表的现实世界环境中的示例进行训练。如果条件发生变化（情况确实会发生）并且模型无法反映这种变化，那么模型就会衰退并最终失败。但是，借助新的虚拟模拟和模仿学习等部署技术（在改进之前从视频或人类中学习以获得基线模型），团队现在可以在寒冷的真实世界中进行试验之前进一步进行研发。
VLM 增强机器人的上下文理解：VLM（视觉语言模型）能够对视觉观察（例如材料、脆弱性、尺寸）进行推理，从而允许新的机器人应用。考虑一下制造业，这需要机器人操作来从语义上而不只是从几何上理解和推理场景。例如，在装配线上构建精密芯片时，如果软机器人夹具需要处理易碎或不规则的零件
机器人是伟大的专家，但不是多面手：通常，您必须为每个任务、机器人和环境训练一个模型。今天，我们可以通过以下方式概括新功能：(1) 正确解释命令（预先训练的语言模型将其分解为任务），(2) 直观地识别环境中的所有相关对象（VLM 和实时边缘基础设施），最后(3) 将指令和感知转化为机器人动作（机器人基础模型）
这一切都归结于数据：数据难以访问、昂贵且质量参差不齐。在实验室范围内有效的东西可能不会转化为隔壁的实验室，也绝对不会转化为现实世界。我们有早期迹象表明，跨不同实施例收集机器人数据比在单个实施例上训练的机器人数据产生更好的性能。假设这种规模扩大，这可能会改变游戏规则——亚马逊可能从其仓库中坐拥价值 100B 美元的数据许可机会。

‍二、图谱

我们相信机器人将很快普及到物流、国防、医疗、制药、农业、建筑、采矿等行业。每当军备竞赛开始时，成为军火商都是件好事。但新的机器人军火商卖什么？从历史上看，我们只有几个大型机器人支持公司的例子——Applied Intuition（自主软件，估值 6B 美元）、Scale AI（数据标签，估值 13B 美元）和 Seyond（激光雷达，估值 1.2B 美元）。

当这些技术转向占领机器人市场时，其中一些技术可能会被集成到其他基础设施平台中；其他的将由内部团队建立，而其他的则可能成为独立的业务：

‍

‍三、机器人技术如何呈现新形式

我们看到了机器人外形尺寸的一些趋势和机遇：

"Fenced Offs": “围栏”： 大型工业机器人，例如 Kuka 手臂，需要安全的安装和物理屏障以确保人类安全。尽管这些系统功能强大并且配备了复杂的控制系统，但它们主要在拣选和包装等大批量应用中有价值。随着安全、传感和控制方面的进步，我们正在逐渐转向更灵活、无围栏和协作的配置。
Humanoids: 类人机器人： 从Figure 和Boston Dynamics 到Agility 和Apptronik 等公司都在利用类似人类的机器人来挑战极限。尽管人形机器人在 Twitter 上提供了令人印象深刻的演示，但创建强大的控制器和平衡系统极具挑战性，而且大多数生产环境并不需要人形设计。
Cobots: 协作机器人：协作机器人旨在与人类并肩工作，我们预计这将成为未来几年的主导趋势。挑战在于在人与机器之间精心设计互动和行为以培养信任。虽然社交机器人已经存在了几十年，但从历史上看，功能优先于有效的人机交互。迪士尼的机器人技术展示了机器人在不损害其功能角色的情况下通过角色进行交流的潜力。
Tiny AI: 微型人工智能：我们正在转向专用的小型设备，每种设备都是为特定任务而设计的。这些设备提供有针对性的功能、经济性和增强的隐私性，因为它们不依赖于云基础设施。这种设计消除了订阅和个人数据收集的需要，并允许独立操作和轻松升级。很快，我们的空间将与这些智能模块化对象无缝集成，这些对象可以在不侵入的情况下帮助我们，独立运行，并且需要最少的配置。

‍四、为明天而建设：机器人团队的组成部分

我们尊重 Cobots、Hadrian、Sheep Robotics、Machina 和 Cobots 的方法和公司建设战略sd5>纪念实验室。作为第一波垂直机器人技术的投资者 - 农业机器人的 Farmwise、无人机送货的 Zipline 以及清洁的 Avidbots - 我们已经花费了花很多时间思考未来机器人团队将如何区分。我们给这个框架起了首字母缩略词“STACKED”，因为优秀的团队知道如何按照自己的意愿堆叠框架，考虑到机器人技术这个复杂的行业，这是必要的。

Specify the Problem: 明确问题：不要成为笼统诅咒的受害者。一个旨在完成所有事情的系统不太可能在所有事情上都做得同样好，这必然会造成失望。请记住，许多公司使用机器人技术来提高运营利润。
Tackle software first, not hardware: 首先处理软件，而不是硬件：专注于了解机器人当今的能力，快速部署并利用机器学习和人工智能的进步来进一步改进和简化操作。
Approach software for your growth model: 针对您的增长模型采用软件：传统机器人技术都是机器人即服务 (RAAS)，但对于人工智能来说，这种方法无法捕捉市场潜力。集成人工智能、软件、服务和机器人可以在垂直、水平或对角商业模式中发挥令人难以置信的强大作用。假设您在自己的企业中部署机器人：您的利润将随着模型的开发而提高（例如，提高收集、处理和数据质量），并且可以为您提供更多带宽来吸收错误和多年所需改进的成本。
Choose your data profitability breakthrough: 选择您的数据盈利能力突破：构建一个在规模上保持成本效益的数据引擎（即您的数据盈利能力突破）是困难且昂贵的。机器人技术受到边缘限制，因此成功通常取决于数据飞轮循环以及对这些新数据的持续摄取，以跟上性能标准；这是关于在以下方面找到平衡：A）充分限制问题以达到正确的自动化/可扩展性水平； B) 雇用“人在环”来解决模型表现不佳的边缘情况； C）仍在寻找足够好的价值主张和足够大的市场。
Know your weaknesses: 了解自己的弱点：不要构建一切。随着硬件和协议的标准化以及现成基础设施的不断发展，机器人团队应该能够更快地交付。相反，应专注于为模型创建数据飞轮，使其成熟并逐步提供业务价值，而无需大幅增加资本支出 (CapEx)。
Embodiment design must reflect function: 具体设计必须反映功能：机器人的物理形态决定了从处理能力和电池寿命到通信能力和感官知觉的一切。它还设定了对其性能的期望。必须兑现或超额兑现其承诺，否则就不会被接受。选择能够增强而不是削弱用户交互的设计，尤其是在与人类共享的环境中。
Deploy, deploy, deploy: 部署、部署、部署：快速启动简单、实用的解决方案并通过实际经验对其进行改进至关重要。这种方法使公司能够学习、适应和改进，而无需等待完美的解决方案。早期部署可以提供宝贵的见解，指导更重大的投资和技术进步。

五、体现智能，推动人工智能向前发展

尽管人工智能对我们生活的影响令人兴奋，但迄今为止，讨论主要集中在软件上。这忽视了将人工智能集成到机器人技术中的巨大机会，以及这些智能机器在改善我们的生活和人工智能领域中可以发挥的作用。

凭借利用 LLM、VLM 和代码生成方面的进步的令人兴奋的方法，机器人制造商有巨大的机会大规模开发更具创新性的机器。与此同时，随着市场的转变消除了机器人研发的限制，这将为创始人提供更多的财务余地，以有效地在机器人中利用人工智能。

很明显，具身化将成为未来几年重塑我们物质世界的重要工具。

共识流通处

与真知灼见共鸣，于流通之处达共识

最新文章

创立公司的第一步是做好PSF，而不是PMF

重新构想教育：AI在塑造个性化学习未来中的作用

从模拟到创造：利用AI新兴能力的场景应用

MENLO资本：2024年企业生成式AI使用现状

a16z：AI伴侣的崛起

服了！美国小伙儿总结的中国菜系：66种！

研究报告：2025年创作者经济8大趋势

初创公司何时应优先考虑PMF分数而不是NPS

马斯克：产品设计的“第一原则”(第一性原理）

马斯克的“三步”第一性原理思维：如何像天才一样思考和解决难题

初创公司的估值已经到达历史最高值

红杉资本的框架：如何减少烧钱并延长跑道？

股价大跌99%,在线教育巨头Chegg已被ChatGPT击垮

加州Rombauer葡萄园：数据智能驱动高效种植

搞定投资人：电梯游说的5 个问题框架

Battery Ventures：AI催化新的技术超级周期，建议投资7大方向

“坎爷”马斯克：一生坎坷不断，总能绝处逢"赢"

马斯克10大工作哲学

如何从头开始构建 GTM（Go To Market）

如何向 8 岁小娃解释ChatGPT 运行原理？

效率之王：马斯克五大高效之道

一年抵八年，马斯克如何做好时间管理？

纪念《沃伦·巴菲特之道》一书出版30周年

麦肯锡：18个能够重塑全球经济的未来领域

经济护城河解析(上）：重要性和来源

微软Word诞生41周年：回顾关键更新和写作的未来

小型模块化反应堆:核能的人工智能机遇

a16z：2024加密货币取得全面重大进展

大萧条下逆势增长：萨莉亚的生存秘诀

AI Agent已经让我们进入"代理经济时代"

具身 AI：智能机器已来

零售传奇：“唐吉珂德”如何成为日本最成功的企业？

从“软件吞噬世界”到“品味吞噬软件”

为什么伟大是不能被计划的

到2030年，AI会发展到什么程度？

走进超级智能：Sam《智能时代》最强音

InfoQ: AI、ML和数据工程趋势报告(2024年9月)

联合国也卷！教科文组织发布《教师和学生人工智能能力框架》

顶尖风投ARK如何看待“人形机器人”领域

《智能简史》：人类智能进化的五大突破

2万字长文，如何成为一个“懂”AI 的产品经理？

警惕：AI正在污染互联网

11 个预测：AI 接下来要做什么

AI市场现状：基础设施投资巨大，AI应用价值创造未知

深入了解AI生态系统的安全性

OpenAI新一轮融资加速 AI 军备竞赛

25年来最大反垄断审判：世界进入后谷歌时代

为什么人工智能不会创造艺术？

AI 如何颠覆科技投资

10人初创3个月融资10亿刀！凭的就是Founder太牛！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉