为人工智能赋予机器人躯体的“登月计划”项目,倒在具身智能热潮之前

科技   2024-09-23 17:30   山西  

大数据文摘受权转载自AI科技评论
作者丨刘洁
编辑丨岑峰

仿生人会梦见电子羊吗?或许答案就在现代机器人的世界里。

Google X 前任副总裁、Everyday Robots 前任 CEO Hans Peter Brondmo 说,在 Everyday Robots,机器人整晚都在做梦,它们在模拟世界里学习,一觉“醒来”就能掌握新技能。

Everyday Robots 有一个充满未来感的实验室,机器人专家Peter Pastor在这里配置了七个工业 Kuka 机器人手臂,被形象地称为“Arm-Farm(手臂农场)”。

这些机械臂昼夜不停地工作,像抓娃娃机一样移动到垃圾箱上方的随机位置,再伸手抓取垃圾箱里的海绵、乐高积木、小黄鸭或塑料香蕉等物品。垃圾箱上方的摄像头能够捕捉到物品和机械臂的每一个动作,帮助系统判断抓取是否成功。

通过反复训练,机器人的成功率从最初的 7% 成功增长到 70% 以上。

这个结果令人振奋,但它仍然不够。几个月才能学会抓起一只小黄鸭的速度再过几百年也无法让机器人学会在现实世界里执行任务。

因此,Everyday Robots 开发了一个云端模拟器,创建了超过 2.4 亿个机器人实例,内置的真实世界物理模型能够模拟物体的重量和摩擦力。

成千上万的虚拟机器人通过模拟摄像头和模拟机械臂同时执行任务,经历数百万次失败,最后才会把表现优异的算法应用到真实的物理机器人上,在现实世界中进行训练。

Everyday Robots 在机器人学习领域的成就令人瞩目。“端到端学习”和“混合方法”的争论从未停止,而 Everyday Robots 在两个方面都取得了显著进展。

2023年,OpenAI 推出了 ChatGPT,这也让 Everyday Robots 意识到了数据的重要性,制定了下一个目标:让数百万机器人在现实世界中执行任务,收集足够的数据训练最终模型,使机器人能够超出狭窄训练定义任务范围的复杂任务。

让机器人从捡东西到能够游走在谷歌大楼里做擦桌子、垃圾分类等杂务,Everyday Robots 花了七年的时间,并确信自己正在引领一个属于机器人的未来纪元。

Hans Peter Brondmo 每周都会和母亲通电话,他的母亲每次都会问同一个问题,“机器人什么时候来?”而他总是回答,“妈妈,还要过一段时间。”

遗憾的是,Hans Peter Brondmo 的母亲在 2021 年过世,没能等到机器人的到来,这也仿佛预示了 Everyday Robots 的结局。

就在 ChatGPT 推出短短两个月后,谷歌就突然宣布关闭 Everyday Robots,只有少数机器人项目和成员被转移到 DeepMind 继续研究。

Hans Peter Brondmo 也从 Everyday Robots 离职,转向摄影领域,似乎有些心灰意冷。

十年前,谷歌掀起了机器人收购狂潮,波士顿动力等公司曾被一一收购。

然而十年后的今天,波士顿动力多次易主,谷歌机器人的辉煌也随着 Everyday Robots 的关停、诸多研究人员的流失陷入了低谷。

01 科研的伊甸园

在谷歌筹备上市的招股书中,有一封两位创始人坚持附上的公开信,信的开头是这样的:

谷歌不是一家传统的公司。我们也不打算变成一家这样的公司。

两位创始人担心上市会损害谷歌的独立性和客观性,或许会因为市场的短期需求放弃长期利益。为了保证管理层决策的独立性,谷歌创造了一种"双重投票权"的结构:管理层 B 类股的投票权是公众拥有的 A 类股的 10 倍。

在公开信的最后,他们强调:

不要作恶。我们坚信,作为一个为世界做好事的公司,从长远来看,我们会得到更好的回馈——即使我们放弃一些短期收益。

这封公开信后来被人们称为“不作恶宣言”。

Google X 正是基于这一价值观创立,旨在开发和推出能改善数百万甚至数十亿人生活的技术。这家实验室创立的所有项目都被统称为“登月计划(Moonshot)”,象征着和登月计划一样,瞄准一个看起来不可能的目标而努力。

和主流的职场规则不一样的是,Google X 不需要员工在做决策或提案前做好详细的计划,首席执行官 Astro Teller 非常欢迎员工们提出各种具有创新性的、甚至疯狂的想法。

Astro Teller 就曾经提出要在植物车(一种可以在农田中滚动采集植物数据的技术)上安装喇叭,向植物播放激励演讲的想法。他并不在意其他人异样的眼光,在他看来想法的价值不在于成果有多好,而在于是否具备创新性,能否打破常规思维。

他说,“如果团队花时间探索和测试像这样的愚蠢想法,可以帮助‘打破’他们的思维束缚,并取得原本可能不会取得的成果。”

当然,即使是 Google X 也必须考虑到现实因素。这里几乎每周都会有一次评审会,聚在一起讨论并否决掉成员们提出的过于疯狂的想法。大约九成的项目会因为太难或太贵而止步于提议。

一旦通过,Google X 给予的支持也是令人难以想象的。

Astro Teller 曾要求谷歌给他的项目提供 3000 万美元,而对方直接给了他 1 亿 5000 万。时任谷歌 CEO 的 Eric Schmidt 说,“如果我给你 3000 万美元,下个月你还会来要 3000 万。”

在 Google X,项目失败的频率比其他实验室要高出不少。但Google X 并不像传统公司那样将失败项目视为耻辱,一旦失败就关闭整个项目并裁掉相关团队。

Astro Teller 设立了项目失败奖金,鼓励大家放开手脚去做一些冒险的尝试,安慰那些尽力了但没能成功的员工。

Google X 还在员工的建议下举办了分享会,员工可以分享失败项目的经验和生活里的变故。

追求创新,鼓励冒险,拥抱失败。在这种氛围下,Google X 打造了一个纯粹的科研伊甸园。

谷歌一直在探索 AI 与机器人技术的结合,目标是创造能执行复杂任务的机器人。Google X 的通用学习机器人项目 Everyday Robots ,正是这一愿景的产物。

Everyday Robots 的研究进展非常顺利,团队开发出了能够在模拟环境中进行训练的AI模型,将表现优异的结果转移到实际的机器人硬件上进行进一步测试和优化。

虽然现实世界的复杂性和不可预测性导致机器人在模拟与现实之间的表现存在显著差距,但这并未阻碍 Everyday Robots 的研究步伐。

这些机器人逐渐具备了在实际环境中完成整理办公桌这类简单任务的能力,也代表着机器人能够在 AI 帮助下有效识别人类及其周围的物体。很快,这些机器人就被赋予了更多职责,忙碌于谷歌大楼中,处理各种日常杂务,成为了真正的“特殊员工”。

不止是杂务,Everyday Robots 把机器人的应用拓展到了艺术方面。

曾是专业舞蹈演员的斯坦福博士 Catie Cuan 与工程师们合作,开发了一种能够根据编舞者偏好训练机器人的算法。她在闲暇时间与这些机器人共舞,探索舞蹈与技术的全新融合。

来自荷兰的 Tom Engbersen 对此很感兴趣,他和 Catie Cuan 一起为机器人的每个关节设计了不同的音效。打开音乐模式后,机器人的每次移动都会创作出独特的管弦乐曲。

Hans Peter Brondmo 和他的母亲一直相信,这些机器人很快就会进入普通人的日常生活。但他的母亲没能等到这一天,而现实的残酷也不止于此。

02 理想和现实的冲突

商业黑洞?


根据咨询公司 Evercore 的估算,谷歌在 Google X 上投入了 6.5 亿美元的研发预算,却造成了 9 亿美元的亏损。

硅谷的创业者和学术界也经常批评 “烧钱”的 Google X,怎么吃掉了这么多的资源,却迟迟没有交出一款真正的“现象级”产品?

说到底,Google X 更像是一个理想主义者的创新乐园,而不是一个合格的商业实验室。

像知名的 Google Glass 明明实现了技术上里程碑式的突破,最终却因为高昂的成本和市场冷淡的回应市无法商业化而宣告失败。

Google Glass 于 2013 年 4 月正式发布,最初版本 Explorer Edition 售价高达 1500 美元,将近一万人民币。Google Glass 的科技含金量自然不用多说,但很可惜主流市场对此并不买账。

一方面,Google Glass 便捷的拍摄功能涉及隐私问题,引起了很大的隐私争议。

另一方面,社会对这项新奇的高科技眼镜接受程度出乎意料的低。根据移动应用公司 Bite Interactive 的调查, 38% 的受访者表示不会佩戴谷歌眼镜,即使价格在他们预算范围内。另有 45% 的人担心佩戴谷歌眼镜会导致社交尴尬或令人不快。

沃顿商学院法律研究和商业伦理学教授 Kevin Werbach 也指出,“Google Glass 可能要花好几年才能降价到让普通人接受的水平,社会接受这类产品则可能需要更长的时间。”

Google Glass 只是 Google X 失利项目的冰山一角。还有互联网气球 Loon、模块化手机 Project Ara 和能源风筝 Makani等项目,都因为技术过于复杂或成本高昂等因素无法走向市场。

创新有时候像一场赌局,谷歌的赌注很大,但并非每次都能押对。

2015年,谷歌成立了 Alphabet 作为谷歌的母公司。同时把原本自主运营的 Google X、DeepMind、Waymo 等部门都脱离出来,放在了 Alphabet 名下作为子公司运营。

Alphabet 的目的是帮助谷歌专注于利润丰厚的核心业务,而不被“烧钱”的创新项目拖后腿。

2023 年 1 月 20 日,Alphabet 没能顶住经济寒冬,宣布将裁员约 12,000 人,占其员工总数的 6%。Everyday Robots 正是因预算削减而解散的少数项目之一,成为了这场创新与利益博弈中的牺牲品。

大公司的通病


根据 Alphabet 2023 年的财报,广告业务占谷歌总收入的 80% 左右,云计算服务贡献了总收入的 10% ,剩下 10% 来自于硬件和其他业务。

谷歌在广告业的霸主地位保证了源源不断的巨大收入,也反映了其对广告业务的严重依赖。即使是新的盈利增长点云计算服务,也是一直保持亏损状态,直到 2023 年才终于实现首次盈利。

而市场上盈利项目单一,高度依赖某一特定业务收入的失败案例真的有很多。

最出名的案例就是诺基亚,曾经全球最大的手机制造商,在功能手机市场上没有对手,但因没有及时转型智能手机,市场份额快速流失,最终在2013年被微软收购,退出了主流手机市场。

另一个经典案例是雅虎,曾经也是依靠门户网站和搜索引擎成为互联网巨头,广告业务也是其主要收入来源,在谷歌的攻势下节节败退,已经在 2017 年被 Verizon 收购并重组为 Oath。

过去雅虎怎么没落的还历历在目,现在还有可能要走上雅虎的老路,谷歌也很着急,不然也不会在自家机器人势头正好的时候叫停研究,转头跟着 OpenAI 开始做大语言模型。

谷歌出现了一个奇特的现象。一方面各类创新项目层出不穷,只有业界想不到没有谷歌做不到;一方面谷歌在广告以外的领域都没有能站住山头的王牌项目,总是屈居人后。

盈利开源的难题紧紧卡住了谷歌的脖子,然而祸不单行,谷歌开始留不住人了。

谷歌广告与商业化的副总裁 Sheryl Sandberg 离职去了 Meta,云业务的副总裁 Thomas Kurian 离开去了 Oracle,YouTube 首席执行官 Susan Wojcicki 也结束了在谷歌 25 年的工作生涯。

曾经参与谷歌机器人登月项目的员工们,不少去了其他公司:严梦媛去了OpenAI,Eric Jang选择了创业公司1X,Deepmind RT-1、RT-2、RT-X等项目发起人之一Yao Lu,现在是Nvidia的主任研究员......

谷歌的一位高级运维工程师在博客上写了一封辞职报告,回顾了自己在谷歌九年的心路历程:

最开始,谷歌吸引她的是技术,而不断升职的后她却因为公司内部臃肿的机构、繁琐无意义的会议和重复性工作、边缘化、创新受挫等问题感觉压力越来越大,最终选择离开谷歌。

这也揭示了一个更大的问题:公司的扩展必然会带来复杂的层级结构和低下的决策效率,想依靠双重投票权摆脱这一问题的谷歌,最终还是患上了大公司臃肿僵硬的通病。

Everyday Robots 的一名前员工在采访中表示,公司很难确定公司的使命。团队无法决定他们的目标是高级研究项目还是商业上可行的产品。

曾经发展目标明确的谷歌,如今带着模糊的使命在创新的路口迷失了方向。

03 谷歌的创新迷途

问题在哪?


回首2010 年,谷歌创始人 Larry Page 和 Sergey Brin 决定成立一个新的部门来研究“登月计划”:

听起来遥远、听起来科幻的技术,有朝一日可能会让世界变得更美好。

Google X 就是这个大胆的实验,也确实孵化出了很多听着就很科幻的“黑科技”。

比如大名鼎鼎的 Google Glass,戴上后能直接在眼前放出一块虚拟屏幕,可以通过手势、语音等方式对这块虚拟屏幕进行操纵,还配备了骨传导等功能。

再比如针对碳排放问题的 280 Earth 项目,大气中的二氧化碳含量过高那就直接把二氧化碳吸走,吸走的二氧化碳还能用来生产淡水,中间的废热还能用来给下一阶段供电。

谷歌成立 Google X 就是想把所有风险最高、短期回报最低的创新项目都塞到一个地方去解决,以“外脑”的形式运营。

早在上市之初,谷歌的两位创始人就担心未来股东们要求的短期利益会和科研需要的长期投资产生剧烈冲突,导致谷歌丧失初心放弃长期项目,不再创新只赚快钱。

为了避免这种情况,才有了特殊的 Google X,既是“外脑”也是初心。

谷歌曾经有过一个“20% 创新时间”政策,指的是员工可以每周拿出一天的工作时间去做本职工作以外的项目。这个创新的管理规定催生了Gmail、AdSense、谷歌新闻和 GTalk 等优秀产品。

但这项政策已经被废止,并且早在 2013 年就被内部员工视为“名存实亡”。

当时的员工如果想要享受这一福利就必须提出申请,而通过审批的难度越来越高,内部还有员工效率测试系统用来判断员工是否百分百投入本职工作。

其实,“20% 创新时间”的取消也是谷歌规模扩大后追求高效、规范的必然结果,不过谷歌并没有放弃对创新的追求。某种意义上来说,Google X 正是这个政策的替身,承担了创新的使命。

但从近几年的表现来看,谷歌不仅没能保住之前的创新氛围,还走向了新的创新陷阱。

谷歌前 CEO Eric Schmidt不久前在斯坦福演讲的时候放飞自我,表示“谷歌会在 AI 竞赛中输给OpenAI 等初创企业,是因为谷歌的远程办公政策导致员工不够努力。”

这正是谷歌陷入创新陷阱的一个缩影。高层不愿意再放宽工作时间,想通过缩紧管理政策来倒逼员工全身心放在工作上,并期待这样就能提升工作效率,让员工生产出源源不断的创新产品。

Google X 的设计厨房

但历史告诉我们,一个企业最有创新活力的时候就是初创期,只有这个时候企业才是真正以创新为导向的;一旦企业规模扩大,就不得不面对创新和赚钱的核心业务之间的取舍难题。

历史也告诉我们,历史总是惊人的相似,人类总要重复同样的错误。

诺基亚、雅虎、黑莓都因过于保守不够创新错失了转型的机会,被残酷的市场抛弃。但谷歌仍然怀有“变革没有那么快到来”的侥幸心理,再加上短期的财务压力,逐渐在创新中落于人后。

具身智能热潮已来,谷歌还有机会吗?


CB Insights 的数据显示,2022 年全球机器人行业的投资总额达到 89 亿美元,比 2021 年增长了 44%。其中,像 Agility Robotics、Boston Dynamics 这样的具身智能创业公司均获得了大规模融资,预计到 2025 年全球机器人市场规模将突破 400 亿美元。

这两年,具身智能发展可以说突飞猛进,各大公司和科研团队都取得了不小的突破。

英伟达就是领军者之一。比如今年在 GTC 开发者大会上推出的 GR00T 项目,之前被评为“2023年英伟达十大项目”之一的 Eureka。除了机器人全栈平台,英伟达还宣布了一项针对人形机器人开发者的加速计划,意在进一步推动具身智能的快速发展。

不仅是英伟达,OpenAI 投资的 1X 公司也不甘落后,推出了全新的人形机器人 NEO,并发布了他们自己的世界模型。

斯坦福大学的李飞飞团队也针对家务机器人做了重大更新,提出了全新的 ReKep 技术。与此同时,李飞飞创办的 World Labs 公司宣布,计划构建一个让 AI 能够在 3D 世界中感知、生成和互动的“大世界模型”。

斯坦福大学具身智能领域的另一个顶梁柱 Chelsea Finn 团队和 DeepMind 合作了 ALOHA 项目,在今年年初推出了 Mobile ALOHA 炒菜机器人。最近,他们又推出了升级版 ALOHA 2 机器人,能够执行更多精细动作。此外,Chelsea Finn 团队还提出了双向解码 BID 新型算法。

然而,并非所有公司都能在具身智能的浪潮中幸存。

Everyday Robots 的一位员工曾在采访中说,“公司对实用且价格合适的机器人做了过早的承诺却无法兑现,我希望 Everyday Robots 不会犯同样的错误。”

曾经坚守“登月计划”准则的 Everyday Robots 还是倒在了具身智能的热潮前,但在谷歌,它的使命并未就此终结。

曾经在 Arm-Farm “抓娃娃”的机械臂,如今在 DeepMind 的新项目中大展身手。机械臂和人类选手打得有来有回,成为首个在乒乓球比赛中达到人类业余选手水平的学习型机器人智能体。

谷歌在这场具身智能浪潮中依然有胜算,但前提是需要做出足够惊艳、与其他对手拉开差距的产品。

当你胜利的时候,无论你说什么,都是对的。

入关学有一句名言,“入关之后,自有大儒为我辩经。”只要实力够强,自然有人替你辩解为你站队。其实谷歌并没有输在管理政策上,只是败在了创新的勇气上。

创新需要的是野蛮生长而不是限定好的框架,戴着镣铐跳舞必然无法实现质的突破。

最开始在车库里鼓捣搜索引擎的年轻人,能够仅凭一腔热血向互联网巨头发起冲击。如果谷歌不想错过这一波具身智能浪潮,那就应该反思一下畏手畏脚的现状,重拾颠覆自我的勇气,迎接来自后起之秀的挑战。

参考资料:
https://www.wired.com/story/inside-google-mission-to-give-ai-robot-body/
https://www.therobotreport.com/alphabet-closes-everyday-robots-among-layoffs/
https://spectrum.ieee.org/alphabet-robots
https://www.theverge.com/2023/2/24/23613214/everyday-robots-google-alphabet-shut-down
https://www.wired.com/story/alphabet-layoffs-hit-trash-sorting-robots/
https://x.company/
https://sites.google.com/view/competitive-robot-table-tennis


租售GPU算力
租:4090/A800/H800/H100
售:现货H100/H800

特别适合企业级应用
扫码了解详情☝


点「在看」的人都变好看了哦!
大数据文摘
普及数据思维,传播数据文化
 最新文章