顶配的人工智能:谷歌和三星的下一代安卓XR耳机和眼镜

科技   2024-12-18 11:56   北京  
将「芯果」设为星标”,第一时间收获最新推送

(本文由CENT记者Scott Stein撰写,他提前亲眼看到了三星的混合现实耳机和谷歌的眼镜,由一个全能的助手提供支持。)【通讯转载自网络|本文末尾注明出处】

闪闪发光的混合现实耳机和带有闪亮背景的Android XR标签
谷歌/盖蒂图片社/CNET
我用过很多VR和AR耳机,也有很多经验。但直到本周,我在纽约市的谷歌总部第一次体验到,一个全能的人工智能伴侣。
Android XR现在以早期形式提供给开发人员,将于2025年全面推出,承诺为所有类型的耳机和眼镜提供完整的操作系统,是通往安卓手机的桥梁。但其杀手级应用程序,谷歌显然依赖的应用程序是其人工智能Gemini。从我所看到的情况来看,这是一个迹象,表明未来几年耳机和眼镜将发生多大变化......但我仍然有很多关于它如何融入日常生活的问题。
事后我记得最清楚的是,我的头嗡嗡作响,戴着耳机和眼镜有一个小时的演示记忆,是带着人工智能同伴的坚持在世界里徘徊。例如,我站在我自己社区的3D地图上,我的房子在我下面。我捏着,放大,在屋顶上盘旋,直到我可以看到地平线和几条街外的一些建筑。我指着他们。
“那边那栋建筑是什么?”我问了。
“那是高中,”Gemini说,并指出了我镇上的学校名称。
我走近了,也问了隔壁的市政大楼。我们一起探索了我的小镇,Gemini和我戴着一款新的三星混合现实耳机,感觉很像苹果的Vision Pro耳机。但是,当我要求Gemini带我去其他地方时——除了地图到Chrome或YouTube,它帮助我识别视频中的事物,或即时叙述场景——甚至在谷歌纽约总部建造的客厅空间中指出和搜索现实世界中的东西——我开始忘记我在哪个应用程序。不过,Gemini一直和我在一起。在几次演示后,Gemini甚至告诉我我做了什么,并刷新了我的记忆,以防我忘记。
很多都开始感觉像科幻助理的梦想,这不是偶然的。谷歌安卓生态系统总裁Sameer Samat将多式联运人工智能等同于“托尼·斯塔克”的时刻:“这些[人工智能]模型可以使用手机上的摄像头作为与世界互动的一种方式,这确实让我们大吃一惊。这不就是一副眼镜吗?
在与Samat的长时间独家对话中,很明显,人工智能激励了谷歌重写其未来的AR/VR计划,并重新进入在结束对谷歌白日梦的支持后,它几年前离开的空间。
是的,谷歌和三星在2025年有很多AR/VR计划:Android XR将推出,三星的耳机也将推出。但Android XR也将与Android手机和其他耳机和眼镜配合使用,从VR到AR再到Meta Ray-Ban般的智能眼镜。眼镜在谷歌的路线图上非常重要。我还从其他人那里得到了多个支持显示器、配备双子座的智能眼镜的演示,每个眼镜都有浮动的顶屏。这些眼镜是谷歌代号为Astra项目的人工智能计划的一部分,是接下来的一部分。
要接受的太多了。但这一切都可能很快就会在XR上向人工智能生活的巨大转变。这是令人着迷的东西,也有很多需要消化的东西。
通往手机的桥梁 








































 各种硬件的生态系统
我已经说过很多年了:虚拟现实和增强现实中缺少的最大部分就是我们的手机。到目前為止,iOS和Android还没有与VR和AR耳机和眼镜建立密切联系。但周四向开发人员宣布的Android XR是一个将于2025年推出的新平台,它将全部开放。从三星的Vision Pro类混合现实耳机开始,谷歌旨在创建一个由眼镜、护目镜和耳机组成的宇宙,与Google Play互连,同时运行多个2D应用程序并使用Gemini AI。
谷歌将人工智能作为Android XR及其最大功能的主要原因。从这个意义上说,它已经与Meta和Apple不同了,到目前为止,Meta和Apple在VR和AR中已经缓慢播放了人工智能。苹果智能尚未出现在Vision Pro上,但可能会在明年出现。虽然Meta已经在Ray-Ban智能眼镜上运行了生成性人工智能,但Meta Quest VR耳机还没有很多人工智能工具。
Android XR仅处于早期阶段,是早期合作伙伴开始习惯的预览表单。谷歌首先与三星合作,作为其首发硬件合作伙伴,混合现实耳机,我必须短暂尝试成为明年的第一个产品。三星也在制造眼镜,我们对此了解不多......与此同时,谷歌也有自己的内部智能眼镜,名为Project Astra(我也得试试)。
将有其他合作伙伴和其他产品:Xreal已经拥有各种显示屏眼镜和一套新的人工智能就绪Xreal One眼镜,就是其中之一。但未来一年,它主要与谷歌和三星有关,硬件使用高通制造的芯片组。
尽管Android XR的起点是高端VR耳机,但终点是一系列产品。三星沉浸式技术和硬件执行副总裁Kihwan Kim说,这不仅仅是一个产品。Kim将其视为包括眼镜在内的一系列设备的基础。Kim说,这更像是建立这个市场的途径。
我在秋天早些时候看到的Meta的猎户座眼镜距离成为现实还有几年时间,但展示了AR眼镜可能是什么。不过,还没有人在那里,谷歌和其他人一样,正在分摊分歧以达到那里。
谷歌副总裁兼XR总经理Shahram Izadi在谈到耳机/眼镜战略时说:“我们有这种平行的方法。”“一个从很多功能开始,一个从有限的功能开始,但你锁定了外形因素。大多数人正在攻击这两种载体,以获得全天可穿戴的AR眼镜。”

三星的VR耳机,带有黑色玻璃正面、遮阳板和带子
Project Moohan是一款外观熟悉的混合现实虚拟现实虚拟现实耳机。这将是明年首款支持Android XR的产品。



















三星的Moohan项目是第一步 

















新能源汽车的发展现已成为实现“双碳”目标的关键途径之一。而新能源汽车的“续航焦虑”亟需高能量密度的电池技术加以解决。
我是为数不多的早期亲身使用三星Android XR耳机的人之一,只戴了半小时左右。它叫Moohan项目,谷歌不允许我拍摄任何演示或混合现实耳机的照片或视频。硬件的感觉非常熟悉:它具有Meta Quest Pro的贴合度和感觉,但具有Apple Vision Pro的视频质量。耳机的透明镜片和遮阳板状设计栖息在我的额头上,无需按压面部片。头带设计在背面收紧,重量轻,但还有一个系带电池组,很像Vision Pro,我把它塞进口袋里。
谷歌为我的演示配备了处方镜片,这帮了大忙,因为耳机似乎不适合戴眼镜。该硬件具有眼睛跟踪和手部跟踪功能,就像Vision Pro一样,并使用现实世界的彩色相机通道,叠加在耳机上的VR中显示的内容,创建了与Meta的Quest 3或Vision Pro一样的混合现实。
根据Samat的说法,在生成性人工智能兴趣和能力迅速上升之前,Moohan项目是谷歌和三星不久前开始的,这导致团队转向基于代理的Gemini系统,该系统既适用于耳机和眼镜。但Moohan是谷歌认为可以涵盖足够的交互基础、Google Play应用程序兼容性、人工智能和界面的起点,它可以在其他更小的眼镜中激发想法,这些眼镜最终可能不具有所有这些功能。

显示Android XR中的浮动窗口如何像计算机一样工作的屏幕

Android XR的窗口感觉看起来很像Vision OS,但Gemini AI也可以看到你所看到的。



















 熟悉,但有一些人工智能魔法 

















新能源汽车的发展现已成为实现“双碳”目标的关键途径之一。而新能源汽车的“续航焦虑”亟需高能量密度的电池技术加以解决。
点击头带的侧面会打开一个Google Play应用程序网格,就像Vision Pro(或我的Meta Orion演示)的工作方式一样。我可以通过在空间中投掷指针来用手捏开应用程序,应用程序窗口可以通过边缘拖动并扩大大小。耳机上的顶部按钮可以把我带回主屏幕,其中包括一个身临其境的3D景观,同样是非常Vision Pro。
谷歌的演示都是谷歌应用程序,其中几个还没有在其他耳机上,即地图和YouTube。谷歌地图以2D启动,但可以启动完整的3D视图,感觉就像我几年前在虚拟现实中尝试的谷歌地球体验。风景神奇地四处蔓延,可搜索的地点遍布整个。谷歌还使用一种叫做高斯飞溅的技术,随着时间的推移增加了完整的3D扫描位置,该技术将2D照片编织成逼真的(但有点模糊的)可步行房间。我突然走进了纽约一家餐厅Scarpetta的扫描,然后走进了餐厅。我在Meta以及通过Varjo和Niantic等公司见过这种类型的扫描,但看到它们被编织成地图很有趣。
YouTube感觉就像一个标准查看器,具有弹出式评论和元数据的窗格,但它也可以播放在YouTube上存在多年的沉浸式3D、180和360度视频。还有另一个技巧:谷歌正在使用人工智能将2D YouTube视频转换为3D。它看起来还不错,更令人印象深刻的是,它还适用于“照片”应用程序中的家庭视频,以及2D到3D照片转换。苹果已经在Vision Pro中将2D照片转换为3D,但视频技巧是沉浸式记忆的下一个水平举措。 

谷歌的Android XR在界面中显示照片

Android XR可以显示照片和视频,并将其全部转换为3D。

我还把我的Chrome浏览器拖到一张桌子上,演示从手部跟踪切换到鼠标和键盘是如何工作的,过渡非常无缝;鼠标光标在整个房间内移动,而不仅仅是在浏览器窗口中。当我把手从鼠标上移开时,手部追踪立即恢复了作用。我的演示没有启用眼光跟踪(可能是因为我的处方插入物),但耳机和Android XR可以适应任何可用的输入:手、眼睛、声音或键盘、鼠标或连接手机等。(顺便说一句,耳机确实有自动眼睛距离调节功能。)

三星的耳机没有价格或发布日期,甚至没有官方名称——Moohan在韩语中指的是“无限”——现在仅供开发人员使用。但它感觉是一个非常真实的产品,它以高通1月份宣布的XR2 Plus Gen 2芯片为运行。但同样,现在感觉是双子座人工智能的特殊成分。我的演示被漂亮地包含在预设空间中,带有预配置的应用程序,但Gemini似乎是一个相当引人注目的魔术。魔法在另一个房间的眼镜上继续。
一名男子戴着谷歌的深色框架智能眼镜,正在阅读 
谷歌的原型智能眼镜显示Astra项目看起来很正常,但一个镜头内有一个显示屏。














眼镜:带有顶屏的全明人工智能 














新能源汽车的发展现已成为实现“双碳”目标的关键途径之一。而新能源汽车的“续航焦虑”亟需高能量密度的电池技术加以解决。
三星的下一个产品将是智能眼镜,2025年将推出更多细节。但这些眼镜还不存在。相反,谷歌目前正在试验自己的内部眼镜,这是名为Project Astra的人工智能计划的一部分,目前正在进行现场测试,以获得有关它们在公共场合如何工作和感觉的反馈。我进入的第二个房间有几副这样的眼镜,其中一副为我配备了一副临时处方插入物。眼镜看起来很普通,重量轻,无线(如Meta的Ray-Bans),机上有一个相机,手臂上有扬声器和麦克风,以及几个输入按钮。
这些眼镜在右侧透镜中有一个显示,通过手臂上的Micro LED芯片投射到镜片玻璃上一个小方形补丁上的蚀刻波导上。它们感觉像是谷歌眼镜上的现代riff,但技术要好得多。显示屏主要显示文本:Gemini可能通过扬声器对我说的话的方向信息或标题。

展示了戴着智能眼镜搭建架子时抬头指导窗口的样子

谷歌展示了他们智能眼镜中的抬头显示器的样子。我的经验非常接近这个,但我没有设置架子。

我在房间里徘徊,看着书架上的书,并询问它们(例如,Jeff Vandermeer的赦免书,我问过,以及我是否需要先阅读其他书)。我打开了一本Yuval Noah Harari的书,让Gemini总结一下我面前的东西。我还让他们翻译了墙上的一张海报。Meta的Ray-Bans也可以这样做,但Gemini一旦被调用,就会保持活跃,不需要额外的提示。我没有总是重新激活它,而是一直开着它......当我想让助理休息时,通过敲击眼镜的侧面来暂停它。
我还演示了一个现场翻译,房间里的其他人走近我,用英语和西班牙语说话。她对我说的所有话都在头顶显示器上自动显示,即使她改变了语言,这些都一直用英语传达。

城市街道视图中出现的弹出式3D地图圆圈的表示
这种地图在眼镜上的样子的表示就像我在双显示器原型上体验到的一样,但在一个封闭的演示空间中。

另一个简短的演示展示了该技术的下一步目标:一副带双显示器的眼镜给了我模拟地图信息,当我向下看时,我看到一张3D地图,以指导我的方向,并向我展示我面对的街道。向上看,转来转去,我看到一张地图在我运动时出现了,然后在我静止时消失了。我还看到了一个简短的视频剪辑,以显示显示器的潜在分辨率;微LED颜色和像素密度看起来真的很好,但方形视野非常小。谷歌认为它随着时间的推移而不断扩大,但它明显比Meta Orion原型、Xreal的眼镜甚至Snap的开发人员Spectacles小。再说一遍,现在,谷歌及其硬件合作伙伴(如三星)可能会采取小措施,在这些眼镜上提供多少视觉细节,而不会在走动时感到被打断或不安全。
Meta将耳机和眼镜视为PC和手机等两类平行产品,谷歌也有同样的感觉。“你可能会使用更沉浸式的产品,类似于笔记本电脑。在眼镜方面,这些更像未来的智能手机或未来的可穿戴设备,如手表或耳机。所以你必须支持两者,”Izadi说。

通过弹出式显示器将餐厅菜单实时翻译成英语的表示

即时翻译的表示。在户外的日常世界中,这会是什么感觉?


Gemini作为一个随时待命的代理人:




















 我准备好了吗?
 



















通过所有这些演示,Gemini的一次点击就绪是不变的。这显然是谷歌在设计上推动的。但这也是我所经历的一切中最令人大开眼界、最令人惊讶的部分。人工智能,无论你对它有什么担忧,在耳机或眼镜中都非常有用,在键盘或触摸屏等输入更难访问的地方。我在Vision Pro或AirPods中更多地使用Siri。Meta的Ray-Bans也使用语音作为控制事物的更深层次的方式。然而,目前的VR/AR设备对人工智能的感知程度有限制。双子座,因为它可以实时看到你看到的一切,感觉它就像一个伙伴......也许不是你一直想要的人。
起初,我发现Gemini活泼友好(它说“嗨!”我尴尬地回了声“嗨”),但随后进入了倾听模式,我所说的任何话都可以被解释为指令——没有“嘿,双子座”提示。这使得事情变得有帮助,但也具有侵入性。停止它的方法是暂停它或再次关闭它,这感觉与人工智能助手现在的工作方式相反:不是点击调用,而是点击停止它。毫无疑问,仅从电池的角度来看,Gemini在小玻璃杯上可以连续运行多少是有限制的。据谷歌称,在像Moohan这样的混合现实虚拟现实中,Gemini作为一个层,使用铸造来解释它看到的一切。它甚至可以在玩游戏时使用,尽管性能可能会有点影响。
优点可能是它如何持续打破混合现实的第四面墙,从某种意义上说:我可以在Chrome中“圈搜索”东西,并弹出响应,或根据命令将3D对象拉入我的世界,或在我请求位置或视频时从一个应用程序跳到应用程序,或要求播放我面前看到的专辑中的音乐(这发生在我的演示期间)。三星的Kim建议我可以在玩游戏时获得教程,例如,如果Gemini看到我戴着耳机甚至戴着眼镜在做什么。当然,它也可以记住我在做什么,以及什么时候。尽管,当我要求Gemini认出我的同事Lisa Eadicicco和我在房间里时,它说它不能用来识别人(还)。
谷歌已经为刚刚宣布的Gemini 2制定了广泛的计划,这是一个跨设备运行的类似代理的系统。将相机馈送添加到人工智能输入组合中也意味着更多数据需要收集和训练。它不仅仅在耳机和眼镜上,谷歌并不是唯一追求这一愿景的公司。影响是巨大的。
Izadi说,助理会和你一起来,无论是你的眼镜、耳机、手机还是手表。
我想让Gemini看到我所做的一切吗?不,当然不是。微软在Windows中尝试了始终开的召回人工智能模式,然后在反弹后延迟它。尽管谷歌承诺,用于人工智能识别的视频提要是私密和本地的,但目前还不清楚谷歌将如何处理这种总是有帮助和侵犯隐私之间的舞蹈。

耳机里戴着一副发光的绿色眼镜,在安卓吉祥物标志之间

未来Android XR产品的形状仍然未知,但预计会有很多眼镜。盖蒂图片社/CNET


Android XR将打开手机、耳机




















 和其他一切之间的大门
不过,有一件大事似乎很清楚:有了Android XR,各种耳机和眼镜将能够比以前更容易地连接到手机中。这可能会让一大堆原本孤立的产品以苹果和Meta尚未做过的方式更加编织在一起(尽管谷歌也不清楚如何实现这一情况的确切步骤)。谷歌的Samat指出,三星是第一个共同探索该软件的合作伙伴,但高通现有的Snapdragon Spaces软件已经将手机连接到眼镜,也将兼容Android XR,是Android XR的一部分。谷歌还允许WebXR和Unity工具与Android XR配合使用,现有的2D Google Play应用程序都将在Android XR中运行,只要开发人员同意选择在那里列出它们。
个人硬件制造商应该能够定制自己的软件和工具,并且仍然连接到Google Play,但将谷歌已经广泛使用的服务也放在其他设备上怎么样?目前,谷歌没有提供任何详细信息,但在Quest和Vision Pro耳机和其他地方上拥有XR Maps和YouTube以及Gemini会很有帮助。
它还可能改变开发人员对未来VR和AR应用程序的设想方式。为许多现有VR/AR硬件制作游戏的开发商Resolution Games的负责人Tommy Palm告诉CNET,“虽然我们希望将Demeo等现有游戏引入Android XR,但该平台也为我们开发全新的想法打开了大门。” “Android XR的开放性质、对开发人员友好的方法和独特的创新不仅使其可行,还允许我们考虑使用混合现实进行讲故事的新方法。例如,ChatBots的自然语言界面可能是XR和游戏的一个非常强大的扩展。”
这些举动还为时早,但它们也是接下来会发生什么的指针。毫无疑问,未来几年,苹果和Meta将在AR和VR方面提供更多的人工智能服务,苹果可能会找到让Vision与iPhone配合使用的方法。或者他们需要。谷歌的计划很有道理,他们可能会让耳机和眼镜作为手机的真正外围设备,最终也作为手表。有了三个合作伙伴——谷歌、三星和高通——以及其他制造商——这可能会变得混乱。但这也是已经支离破碎的未来景观需要的统一进步。我们将更多地了解2025年真正发生的事情,这根本不远。
原文链接:https://www.cnet.com/tech/computing/i-tried-google-and-samsungs-next-gen-android-xr-headsets-and-glasses-and-the-killer-app-is-ai/


--- 关于我们 ---

芯果成立于2023年12月,是科技成果转化、科技领域投资投行服务的专业媒体平台。芯果团队是一群朝气蓬勃的超级小伙伴,依托教育背景,包括清华大学、北京大学、中国传媒大学、北京交通大学、河北大学等深厚的科研学术、科技产业积淀,以及管理团队过往在产业、资本领域积累的丰富资本市场案例经验,聚焦科技投资投行领域,重点关注人工智能、半导体及集成电路、新能源、智能汽车等各类创新。

往期精彩回顾




欢迎关注






转载、合作、加入粉丝群请联系小助理

(微信号:globalfinance007)

随手点赞👍,戳个在看

芯果
匠芯注入!链接科技成果与产业发展的有趣灵魂。
 最新文章