学术匠
感谢您抽出 · 来阅读此文
为了表彰他在财经媒体领域内的卓越成就,西班牙IE商学院2021年颁发给他亚洲财经新闻年度大奖。
2024年,有这样一件事值得你关注:9月25日,Meta在Connect年度开发者大会上正式发布了号称“迄今为止最先进的AR眼镜”——Orion。
关于什么是AR眼镜,将其与你更熟悉的VR对比,可能更容易理解。VR是现实版的“爱丽丝梦游仙境”,只要戴上头显设备就能进入一个虚拟世界,而AR则是在戴上智能眼镜后观察现实世界,你将看到一些虚拟的影像和文字叠加在真实景物上。
Meta这款AR眼镜采用碳化硅镜片和Micro LED显示器。测评数据显示,其视场角'达到了70度,能够提供更广阔的视觉范围和更强的沉浸感。镜框内置7个摄像头,并搭载SLAM¹,也就是“即时定位与地图构建”技术,使其能够实时感知环境并精准定位,从而在复杂场景中实现无缝的AR交互,真正做到全场景AR应用。
尽管目前Orion的单个成本高达1万美元,尚未实现量产,但扎克伯格仍然信心满满地认为这款眼镜将在两年后进入大众市场。
其实,无论是AR、VR还是XR²,都早已不是什么新鲜概念。2023年,苹果推出的XR设备Vision Pro虽然一度引发轰动,但其市场表现却有些“雷声大、雨点小”。那么,为什么Meta这款仍处在内测阶段的AR眼镜会如此值得关注呢?
用我与凯文·凯利(Kevin Kelly)合作完成的新书中的观点,可以很好地解释这个问题。凯利认为,镜像世界(Mirror World)将是下一代互联网,而功能强大的AR眼镜很可能会成为镜像世界的“杀手级应用”。
让我们先简单回顾一下这一领域的发展历程。
2012年4月,谷歌推出的Google Glass(谷歌眼镜)应该算是第一代AR眼镜。它具备类似于智能手机的功能,比如拍照、视频通话、导航、上网,以及处理文字信息和电子邮件。用户可以通过语音命令、头部动作或触控板与设备进行交互。右眼小镜片上的微型投影仪用于显示数据,摄像头用于拍摄视频与图像,存储模块则负责保存与传输数据。
2014年,Facebook(脸书)以20亿美元收购了VR头戴设备制造商Oculus,随后推出了Meta Quest系列独立VR头显设备。2021年年底,扎克伯格甚至将公司名从Facebook改为Meta,以此宣示全面投入元宇宙(Metaverse)的决心。
2023年,苹果加入XR赛道,推出了一款具有创新性和变革意义的XR头显设备——VisionPro。
回顾过去十几年的发展,我们不难发现:谷歌眼镜其实早已预示了一种未来,只是因为太过超前,且没有得到AI的加持而早夭。
VR头戴设备则由于笨重的设计、不便的佩戴体验表现得不温不火,更不用说在虚拟世界其实并没有多少沉浸式的内容可供用户消费。
凯利认为,智能眼镜是我们进入镜像世界的关键,而实现这一点的核心在于一块卓越的屏幕。这块屏幕需要同时具备两项能力:既能保持透明,确保用户可以清晰地看到现实世界,又能随时切换为显示屏,投射虚拟图像,从而让用户有沉浸式的体验。换句话说,它需要同时满足AR和VR的需求,在现实与虚拟之间真正实现无缝切换。凯利将这种技术与触摸屏相比较——触摸屏的普及推动了智能手机的兴起,因为它既能显示内容,又让用户可以通过触控与内容进行互动。同样,集AR和VR功能于一体的屏幕,将让智能眼镜成为触摸屏之后的下一代伟大的创新(Next Big Thing)。
Orion的吸引力在于,它展现了一种更接近凯利所描述的未来的可能性:它的镜片既可以在用户视野中叠加虚拟图像和文字,还可以切换为虚拟影像显示屏。此外,它内置了多种先进的传感器,并配备了AI语音助理,进一步增强了设备的交互体验并拓宽了设备的应用场景。
让我们回到镜像世界本身,来对它做进一步的说明。镜像世界是凯利对未来的核心定义,简言之,它是一个由AI驱动的虚拟现实世界,是一个一切皆可数字化的世界。在镜像世界,每个人都可以通过智能眼镜与周围环境交互。这副眼镜不仅能捕捉使用者所处的环境,记录他们的语言和表情,还能提供AR和VR融合的沉浸式体验。
为了处理如此庞大的信息流,每一副智能眼镜都需要强大的算力和AI引擎支持。这些Al引擎不仅是技术核心,还将化身为无处不在的AI助理,在使用者的耳边细语建议,在他们的视线中给出提示,帮助他们打理工作和生活中的各类事务。这种强大的Al赋能,使镜像世界区别于此前的元宇宙设想——它能够将人类的想法迅速转化为真实、逼真的互动体验,极大地拓展了虚拟与现实融合的可能性。
以下三个维度可以帮你更好地理解镜像世界。第一,智能眼镜带来的全新人机交互方式,让镜像世界成为一个充满探索可能的新世界。
自2007年苹果发布第一代iPhone以来,智能手机彻底改变了人机交互方式。然而,未来的主角很可能是轻便易用的智能眼镜——它们将逐步取代手机,成为最主要的人机交互工具。
如前文所说,智能眼镜的核心在于其集成的AR和VR功能:使用者可以透过镜片直接看到现实世界,同时在其视野中叠加显示3D增强现实内容;镜片还能切换为虚拟现实屏幕,带来完全沉浸式的虚拟体验,重现几年前人们所憧憬的元宇宙场景。
此外,眼镜中内置的AI助理将随时响应使用者的语音指令,通过眼神、手势等判断使用者的需求,极大地改善用户体验。正因为这些特性,镜像世界呈现出一个令人兴奋的新可能:数字信息不再局限于手机或计算机屏幕,而是直接叠加在现实场景之上。这种技术不仅解放了使用者的双手,还规避了智能手机时代的“低头族”现象,人们在现实世界行走的同时,还能获得各种无缝衔接的智能服务。
使用者还可以随时调暗镜片屏幕进入虚拟世界。在这个虚拟世界,丰富的沉浸式体验让每个人都能以第一人称视角,自然地探索和发现世界的无限可能。
第二,镜像世界将是一个无比透明的世界。在镜像世界,智能眼镜不仅可以捕捉用户所处环境的数据,还会记录大量个人化的信息,如用户注视的方向、时长,以及对外界刺激的细微反应。比如你眉毛微微上翘,眼镜会识别出你感到惊讶;你的眼睛多看了某个东西一眼,或者目光在哪里停留的时间稍长了一点,它也会注意到你可能对它更感兴趣一些。日积月累,智能眼镜将越来越了解你的喜好,甚至能够洞察你的下意识反应和潜意识偏好。这种对细微表情和行为的精准捕捉,还可以让用户的虚拟化身(avatar)有更加细腻逼真的表现,进一步提升虚拟世界的沉浸感与真实性。
第三,镜像世界是一个AI赋能的世界,需要强大计算能力的支撑。
要构建一个功能完整的镜像世界,也就是所有用户的虚拟世界能够互联共享,对计算资源的需求极其庞大。这不仅要求所有智能设备具备强大的AI处理能力,还需要完善的基础设施支持。
三四年前,元宇宙发展的主要瓶颈是缺乏高质量的3D内容。当时,虚拟空间的创造主要依赖游戏引擎,费时费力,内容丰富度也相对有限。然而,随着镜像世界数据的不断积累及AI技术的快速提升,无论是重建物理世界,还是将抽象的想象转化为虚拟体验,都将变得更加高效与便捷。
虽然早在2012年,谷歌眼镜就已初步展现了智能眼镜的雏形,但要使它真正实现广泛应用,并成为改变世界的“下一次重大创新”,还需要克服三个关键难题。
首先是硬件方面的突破,设备需要在整合VR/AR功能、搭载AI助理的同时,保持轻薄。只有满足这些条件,智能眼镜才能像智能手机一样,成为日常生活中我们须臾无法离开的工具,甚至被视为我们身体的一部分。其次是算力方面的支持,为支撑庞大的虚拟世界的运转,镜像世界需要海量计算资源。最后是内容生态方面的建设,需要海量优质3D内容的支撑,让用户在虚拟世界中拥有丰富的体验。
总的来说,镜像世界将是下一代互联网,一个由Al赋能、为所有人带来沉浸式体验的互联网。在镜像世界,人机交互的方式将从传统的键盘、鼠标和触摸屏“回归自然”——通过语言、动作,甚至眼神与机器交流。难怪苹果将这一未来称为“空间计算”(Spatial Computing),因为镜像世界把现实世界作为人机交互的主要舞台,让使用者彻底摆脱对手机和计算机屏幕的依赖。同时,虚拟世界为人类提供了无限的想象空间,沉浸式体验或将成为快消品。
在镜像世界会涌现出哪些有趣的新业态?凯利认为,第一人称视角的沉浸式冒险直播将成为一个极具潜力的赛道。在镜像世界,每个人都可以记录、分享自己独特的体验。观众通过智能眼镜即可实时参与这些直播,获得身临其境般的真实感。比如,人们可以“跟随”马斯克的星舰登月、探索海底、深入亚马孙雨林,甚至攀登珠穆朗玛峰。
今天以第三人称视角观看平面媒体内容(如文字、图片和视频)的形式,在未来可能会转变为基于第一人称视角的沉浸式体验。在“下一代互联网”中,绝大多数UGC(用户生成内容)都会是3D沉浸式的。
你可能会问,这种虚拟体验会不会削弱人们对真实世界的向往,甚至取代现实中的旅游?凯利认为恰恰相反。他指出,沉浸式体验越接近真实,越能激发人们探索真实世界的欲望。未来,当虚拟的体验变得越来越唾手可得时,真实的体验反而会因其稀缺性变得更加珍贵。换句话说,镜像世界的价值在于让普罗大众足不出户就能体验到现实世界的奇妙,而对真实世界的探险仍然是有钱人才能享受到的特殊服务。
沉浸式体验是人类最自然的学习与探索方式,这一点在教育领域尤为明显。所以在教育领域,我们会看到沉浸式技术作为一种新业态,大幅降低了理解抽象概念的门槛。学生可以在“细胞世界”中遨游,观察微观生命的奥秘;也可以回到史前地球,探索远古环境;甚至穿越历史,在现实世界中叠加虚拟的历史场景,以更加直观的方式理解历史事件和发展脉络。
空间思考是人类非常自然的思维方式。比如,记忆大师经常推荐的空间记忆法,就是通过将需要记忆的信息与熟悉的空间位置联系起来,达到强化记忆效果的目的。使用空间记忆法时,我们可以在脑海中想象一个熟悉的场景,比如自己的房间,并沿着一条明确的路线依次经过不同的家具。这些家具则成为存储抽象概念的“位置”,帮助我们将信息视觉化。未来,随时随地可以创建3D虚拟场景的镜像世界,将进一步强化我们的空间思考能力。这也可能成为镜像世界里一种跟记忆和学习相关的新业态。
比如,以空间思考的方式去“阅读”一本小说,也就是让AI助理帮你再现小说所描绘的场景。你甚至可以化身小说中喜欢的角色,在以小说为蓝本构建的虚拟世界中体验小说的情节。当然,顺着这个脑洞进一步向前走,小说作为一个固定的形式和内容的载体很可能被颠覆,小说、剧集、电影、游戏的边界也会被打破。
在商业领域,镜像世界或将进一步推动“眼球经济”的发展。在移动互联网时代,平台通过免费服务吸引用户的注意力,再将其卖给广告商。过去二十多年间,从搜索到推荐的转变改变了我们的互联网体验,而推荐的核心是平台对我们偏好的深度理解。在未来的镜像世界,智能眼镜会变得比平台更懂我们,并被用于提供更加吸引人的定制化服务。这里可以开两个脑洞。第一个是虚拟产品植入。在镜像世界,商家会如何“润物细无声”地影响客户呢?最巧妙的方式是在虚拟世界创造偶遇。虚拟世界里的道具和陈设都是可以千人千面的。同样的场景,背景中可能会出现某个品牌的服装、家电、家具等,就好像偶像剧里常见的产品植入。不同的是,这种偶遇其实是AI基于对用户的理解而刻意推荐的,为的就是影响用户的选择。第二个是虚拟产品植入的升级版,姑且称之为数字人营销。就好像游戏中有NPC(非玩家角色),虚拟世界也会有更加逼真的数字人。因为沉浸式的体验,虚拟世界与真实世界越来越相似。比如在你所处的虚拟世界中,不远处有一对数字人在谈话,而他们谈话的内容恰巧能被你听见,引起你的兴趣。数字人的对话其实是刻意为之的,目的是潜移默化地影响你的决策。
然而,如果缺乏监管,这种“眼球营销”可能会变得毫无节制,这也将成为镜像世界面临的一系列难题之一。其他的难题包括:怎么保护隐私?怎么避免被单方面监控?镜像世界是否会是一个被大平台所统治的世界?在中美科技竞争的背景下,镜像世界会是一个全球统一的互联世界,还是各自发展的平行体系?……正如尤瓦尔·赫拉利(Yuval Harari)在《智人之上》中所说的,“硅幕”可能会成为一大隐患。
有锋芒的思想,无广告的阵地
这里
2025-01-02
2025-01-02
2025-01-02
2025-01-04
2024-12-11