地表最强AR眼镜!Meta AI加持的十年保密项目到底有多强?

科技   2024-09-27 18:41   北京  

整理自 | 极果网、36氪Pro、 头部科技

阅 | 010-86092062



北京时间9月26日1:00,一年一度的Meta 2024年度开发者大会(Meta Connect 2024)正式拉开帷幕。公司CEO马克·扎克伯格(Mark Zuckerberg)以意料之中的新品Quest 3S作为开场,宣布Meta的元宇宙之梦开始向入门级消费市场普及



本次大会亮点无疑在是开源模型界的“扛把子”Llama系列。此次发布的最新Llama 3.2 版本新增了视觉多模态能力,能够同时理解图像和文本


此外,Meta还发布了AR眼镜Orion,它也给未来的元宇宙世界提供了更多入口。虽然仍不完美,但也是一个承载着AI空间计算设备最终形态野心的产品。




“地表最强”AR眼镜的秘密




AR眼镜产品Orion并非一款量产产品,而是原型机,总共花了Meta十年、几十亿美金打造。


发布会上,这款眼镜被装在铁皮箱里被传递到扎克伯格手中。作为扎克伯格口中“世界上最好的AR眼镜”,在一条官方宣传片子中,Meta甚至还邀请了黄仁勋率先体验。


佩戴Meta Orion的黄仁勋


在外观上,眼镜采用分体式设计,采用波导方案设计,镜框由镁合金制成,比铝合金更轻,更易散热,重量为98g。



产品最大的亮点在于创新采用了碳化硅材料制作镜片。作为第三代半导体材料,以及冶金材料,碳化硅价格高昂,但效果显著。有行业人士表示,碳化硅镜片的折射率遥遥领先——玻璃是1.6,树脂更低,而碳化硅折射率远大于2。这使得,碳化硅工艺制作的AR镜片,不需要过去工艺复杂、成本高昂的双层波导方案,用单层的方案,即可实现全彩显示。这大大降低了镜片本身的重量、厚度。这也是为什么,Meta Orion的整体重量能控制在80-100克。


Meta Orion镜片


更大折射率产生的另一项惊喜是,收获更大的场视角(FOV)。Meta这款新品的FOV达到70度——当前传统AR眼镜仅仅为30度,传统VR也只有90度。更大的FOV,意味着沉浸感直接拉满,有了更多与现实场景结合的可能性。


除了基础材料的颠覆式创新之外,Meta Orion上还尝试创新了交互方式,增加了手势识别、眼动的功能


从官方释放的宣传片来看,用户可以通过伸手触摸,握拳时大拇指的上下滑动来操控。这也是AR产品鲜少尝试的交互模式——过去基本上是常见的语音/触控交互。而经过了苹果Vision Pro几个月的用户教育,手势交互这一全新的范式,已不会令人陌生。



由于AR眼镜天生有着重量、体积限制,Meta的解决方案也十分巧妙,Orion分为三个部分——眼镜本身、分立式的计算设备、一条和运动手环一样大小的腕带


Meta Orion


具体而言,眼镜上的7个摄像头负责手势等图像的采集工作;腕带则将通过根据肌肉电信号的变化来判断手势变化,减少对摄像头的依赖;而分立式的计算设备则负责算力供给、网络,减轻眼镜的计算负载。


在使用场景方面,Meta Orion展示了导航、互动玩轻游戏、信息提示、打视频电话、浏览网页等等功能


扎克伯格使用Meta Orion玩游戏


从演示视频上来看,用户戴上Orion可以刷网页、看短剧,甚至玩一些简单的3D游戏,而且游戏几乎没有延迟。



当然,你也可以在Orion上听音乐、接视频电话。


甚至还有体验者可以通过Orion中的Meta AI识别摆放在桌子上的配料,制作出了一份完整的冰沙,就这智能效果,谁看了都不得感叹一句“太全面了”!不过,关于场景的探索,是技术和产品成熟之后的议题了。




Meta Quest重燃战火




扎克伯格登场不到十秒,就公布了 Quest 3S 的价格,这在一众电子产品的发布会中实属罕见,Meta Quest 3S以更亲民的价格299.99美元起售,具备与更昂贵版本的Quest 3相同的功能。


Meta Quest 3S


Quest 3S搭载了与Quest 3相同的Qualcomm Snapdragon XR2 Gen 2芯片。Meta对系统进行了优化,维持性能同时又降低了成本。包括对Meta Horizon OS进行的空间计算更新,改善了对基本2D应用的支持、空间音频和色彩对比度,使体验更加真实。


但Meta Quest 3S使用了成本更低的菲涅尔镜片,而非高品质的“煎饼镜片”(Pancake Lens),这种设计相对更加成熟且成本低,但整体的体积和重量会比Quest 3更大。



但两款产品真正的区别是显示效果上的差异:Quest 3S采用1832 x 1920(20 PPD每度像素)快速切换 LCD,刷新率为 90/120 Hz。它的水平和垂直视场角只有96和90度,相比之下,Quest 3拥有2064 x 2208(25 PPD每度像素)以及水平110度、垂直96度的视场角。


但又不止有价格这一卖点。产品上看,Quest 3S的定位有了较大的变化,大有向苹果靠拢的趋势。过去,Quest系列更像是大型游戏的补充型设备,而如今,扎克伯格希望它们走出游戏厅,成为和手机一样的核心计算平台。


在大会上,扎克伯格就展示了游戏之外的应用场景——比如,你可以在Quest 3S上同时打开四种应用界面,用YouTube看视频、使用浏览器搜索、听音乐,或者逛Meta的应用商店等等。或者,你也可以让这个设备搭配着你的PC一起办公,当做出捏和手势的动作,就可以操控电脑页面的拉大放小,甚至,将其扔到另一个新开的界面里。


Meta Quest 3S


过去,Meta的虚拟现实产品是封闭的小世界,如今,扎克伯格重新颠覆产品定义,新增了VST功能。具体而言,头显上的摄像头能帮助捕捉周围实时环境,并传递到设备中,让用户也可以看到现实世界的情况——不过,用户看到的并非真实世界,而是真实世界的投影。要回到现实环境还是封闭,用户只需要按一个小小的按钮就可以改变。

为了重新夺回战略高地,Meta这次发布的新品,几乎是从价格、产品定义、场景上全面紧跟。


AI,只是点缀




这次发布会上,扎克伯格全面进攻,除了硬件本身的更新,还介绍了其多模态AI模型LLAMA 3.2的进展



Llama 3.2 是 Meta 的首个开源 AI 模型,包括两个视觉模型(11B 和 90B)和两个轻量级的纯文本模型(1B 和 3B),这意味着它具备了多模态的能力,也就是可以同时处理文本和图像,其中轻量级的纯文本模型可以直接在本地理解用户输入的内容。


基于Llama 3.2全新的能力,Meta AI 在发布上展示了一系列搭载大模型的设备的更新功能。


Meta AI正式上线AI Voice,用户可以通过 Messenger、Facebook、WhatsApp 和 Instagram 向Meta AI提出问题或以其他方式聊天,并获得模拟语音回复。



现场演示总体来说对话响应速度还挺快,回答的内容也比较准确,语音语调听起来又离真人问答更近了一步,而且还能随时打断对话插入新的话题或问题。


这些模型发布最大的意义在于,Meta补齐了所有的主流多模态,Meta AI的多模态能力让眼镜拥有眼睛,这为其融合AI和XR硬件打下了坚实的基础


语音聊天功能


另外,Meta此次还宣布了他们今年最热门的AI眼镜,Meta ray-ban上的几款更新。这款AI眼镜,目前被称为人工智能领域最畅销的硬件产品之一,预计今年的出货量将超过200万台,订单还在持续增加中。


有了视觉能力的 Meta Ray-Ban 现在能更深入地协助人们的工作生活,日常起居,不仅能为用户推荐个性穿搭建议,还能帮记车位。


Ray-ban


根据扎克伯格的介绍,这款眼镜更新了“提醒”功能——在你收到传单但又不方便掏手机的时候,就可以吩咐眼镜,帮你拍下来,直接通过眼镜扫描传单上的二维码或者拨打上面的电话。


AI翻译功能也有更新。当佩戴全新Ray-ban和外国人对话的时候,眼镜里面的扬声器会帮你实时翻译对方的语言,使得交流变得不延迟,不尴尬。还有更实用的AI实时翻译功能,搭载了 Meta AI 的终端,支持实时语音翻译功能,发布会上的两位发言人,通过佩戴 Meta Ray-Ban 完成了一次即时的跨语种(英语-西班牙语)对话。



作为“AI硬件的全新品类”,扎克伯格对其寄予厚望。在接受The Verge采访时,他表示,Meta AI 正在成为眼镜越来越突出的功能,“我们虽然不会扔掉手机,但未来我们会慢慢地用眼镜做更多的事情,更多地把手机放在口袋里。”为了抢夺人类未来移动计算中心的高地,也为了狙击苹果进攻,扎克伯格这次推上了所有的砝码。


推荐阅读


年度最佳纪录电影《里斯本丸沉没》:如何还原沉没82年的历史真相?

巴黎奥运会乒乓球赛事转播含“AI”量极高!转速、落点、轨迹均实现可视化

【刊庆有奖互动】小书童or大学士? 快来查看您的论文创作成绩单!

字节音乐大模型炸场!Seed-Music发布,支持一键生成高质量歌曲、片段编辑等

9期热点&导读| 巴黎奥运会赛事转播的技术革新与创意表现、AI助力微短剧高质量发展




我知道你在看

影视制作
《影视制作》创刊于1994年,由国家广播电视总局主管,是国家级影视制作专业期刊。专注于影视节目摄制、编辑、后期制作等技术的推广,致力推动我国影视制作业整体水平的提高。2014年荣获中国出版政府奖(出版行业最高奖)期刊类提名奖。
 最新文章