Meta一直致力于利用头显、眼镜和AI系统将“未来带给每个人。”
北京时间9月26日1:00,一年一度的Meta 2024年度开发者大会(Meta Connect 2024)正式拉开帷幕!为期两天。
公司CEO马克·扎克伯格(Mark Zuckerberg)以意料之中的新品Quest 3S作为开场,宣布Meta的元宇宙之梦开始向入门级消费市场普及。
本次大会亮点无疑在是开源模型界的“扛把子”Llama系列。此次发布的最新Llama 3.2 版本新增了视觉多模态能力,能够同时理解图像和文本。
此外,Meta还发布了AR眼镜Orion,小扎称之为地表最强AR眼镜,它也给未来的元宇宙世界提供了更多入口。虽然仍不完美,但也是一个承载着AI空间计算设备最终形态野心的产品。
新款Quest 3S,打价格战
Meta发布了最新的虚拟现实头显——Quest 3S,虽然没新意但更便宜。
扎克伯格登场不到十秒,就公布了 Quest 3S 的价格,这在一众电子产品的发布会中实属罕见,Meta Quest 3S以更亲民的价格299.99美元起售,具备与更昂贵版本的Quest 3相同的功能。
Quest 3S搭载了与Quest 3相同的Qualcomm Snapdragon XR2 Gen 2芯片。Meta对系统进行了优化,维持性能同时又降低了成本。包括对Meta Horizon OS进行的空间计算更新,改善了对基本2D应用的支持、空间音频和色彩对比度,使体验更加真实。
但Meta Quest 3S使用了成本更低的菲涅尔镜片,而非高品质的“煎饼镜片”(Pancake Lens),这种设计相对更加成熟且成本低,但整体的体积和重量会比Quest 3更大。
但两款产品真正的区别是显示效果上的差异:Quest 3S采用1832 x 1920(20 PPD每度像素)快速切换 LCD,刷新率为 90/120 Hz。它的水平和垂直视场角只有96和90度,相比之下,Quest 3拥有2064 x 2208(25 PPD每度像素)以及水平110度、垂直96度的视场角。
在发布会上,扎克伯格表示Quest 3S将支持杜比视界技术,同时增加屏幕识别功能,来拓展Quest 3S这类虚拟现实头显产品更广泛的使用场景。用户能够与显示器上的内容直接互动,比如用户可以将笔记本电脑中的界面直接拖拽到Quest设备上。
为了打造更加逼真的元宇宙体验,Meta推出了Hyperscape技术,用户可以简单地使用手机扫描自己所在的房间,随后通过头显设备随时“复制”这个空间的环境。
此外,为了“让混合现实变得更好”,Quest 3S还兼容Meta的数千款应用和完整游戏库,并会推出的Quest 3和3S独家游戏,像《蝙蝠侠:阿卡姆暗影》等。
目前,为了让用户购买新的Quest 3S,Meta已主动停产了Quest 2和Quest Pro。
“最强端侧模型”Llama 3.2
近期,谷歌对其旗下的Gemini 1.5 AI模型进行了重大升级,而OpenAI也在月初推出了声称能像人类一样“深思熟虑”的o1模型,近日推出毫秒级 GPT-4o 版“Her” 高级语音模式。
Meta作为开源大模型扛把子,自然也不甘落后,大会现场发布Llama 3.2。
Llama 3.2 是 Meta 的首个开源 AI 模型,包括两个视觉模型(11B 和 90B)和两个轻量级的纯文本模型(1B 和 3B),这意味着它具备了多模态的能力,也就是可以同时处理文本和图像,其中轻量级的纯文本模型可以直接在本地理解用户输入的内容。
基于Llama 3.2全新的能力,Meta AI 在发布上展示了一系列搭载大模型的设备的更新功能。
Meta AI 正式上线AI Voice,用户可以通过 Messenger、Facebook、WhatsApp 和 Instagram 向 Meta AI 提出问题或以其他方式聊天,并获得模拟语音回复。
现场演示总体来说对话响应速度还挺快,回答的内容也比较准确,语音语调听起来又离真人问答更近了一步,而且还能随时打断对话插入新的话题或问题。
有了视觉能力的 Meta Ray-Ban 现在能更深入地协助人们的工作生活,日常起居,不仅能为用户推荐个性穿搭建议,还能帮记车位。
还有更实用的AI实时翻译功能,搭载了 Meta AI 的终端,支持实时语音翻译功能,发布会上的两位发言人,通过佩戴 Meta Ray-Ban 完成了一次即时的跨语种(英语-西班牙语)对话。
堪比“Her 2.0”的实时AI数字人也在业界解决方案上更进了一步,有成为杀手应用的潜力,超过100万广告主正在使用Llama 3.2生成式人工智能广告工具。
这些模型发布最大的意义在于,Meta补齐了所有的主流多模态,Meta AI的多模态能力让眼镜拥有眼睛,这为其融合AI和XR硬件打下了坚实的基础。
AR眼镜Orion“遥遥领先”
未来的眼镜会长成什么样子?Meta给出了自己的答案。
大会现场,Meta Orion 智能眼镜惊艳登场。虽然扎克伯格表示,Meta Orion 是一款面向消费者打造的产品,但目前的 Orion 设备还是原型机,只面向部分开发者和体验人员提供。
为了宣传AR眼镜,Meta搬出了英伟达首席执行官黄仁勋 (Jensen Huang) 作为第一波体验Orion的用户,黄仁勋称其100克的重量“意义重大”,并连连称赞Orion的视觉效果和视野。扎克伯格表示:“老黄试过都说好。”
在此之前,已经走入大众市场并且取得了不错战绩的联名眼镜 Ray-Ban Meta,成功验证了市场对智能眼镜的接受程度。
Ray-Ban Meta 主要提供音频、摄影和部分 AI 功能,简单来说还是一个戴在眼睛上的传统设备。
而Meta 秘密研发了十年,投入了几十个亿美元打造的首款 AR 智能眼镜 Orion,则被扎克伯格称为“无可挑剔”的完全体。
Orion 机身采用了更轻的镁材料,所以Orion 眼镜本体实现了惊人的 98 克重量。作为对比,Snap 上周发布的全新 AR 眼镜 Spectacles 重达 226 克。
但称Orian是一副AR眼镜,似乎并不严谨。它想要正常工作的话,需要通过一个手势追踪腕带和一个遥控器大小的计算主体协同,三者无线连接。
计算主体提供了更多的处理算力,眼镜无法远离它单独工作,想要正常使用Orian,就得无时无刻地将计算主体佩戴在身边。
腕带由高性能纺织材料制成,并使用肌电图 (EMG) 来读取与理解与手势相关的神经信号。用户可以把目光当作 Orion 界面的指针,捏合当作点击,整体体验非常自然。在几毫秒内,这些信号会被转换成输入信号,传达给计算主体,“有点像在读心。”
值得一提的是,腕带还提供了触觉反馈,让用户知道手势有没有被成功识别,解决了目前 MR 交互的一个痛点。
显示部分,Orion拥有70度的视场角,框架内配有Micro LED投影仪,可以把影像投射到镜片的硅基片上,这一点和目前所有的AR眼镜工作原理类似。
眼镜最核心的 AR 投射能力,Orion 在不少方面做到了“遥遥领先”。Orion 的镜片并非是玻璃显示屏,而是轻质的碳化硅透镜,这种材料不会产生光学伪影或杂散光,并具有高折射率,是实现大视场的关键。Orion的投影仪采用了新型的uLED显示技术,这种技术体积极小,非常节能。
镜框上微型的投影仪会将光发射在波导中,而波导投射在透镜上,从而显示出具有不同纵深和大小的 AR 虚拟内容。
现场,Meta演示了全息影像和现实世界结合的场景,Meta为这款眼镜开发了AR版本的Messenger的应用,它可以实现实时的全息投影视频通话,就好像对方站在你身边一样,不过目前还比较粗糙。
根据现有的演示视频,用户可以戴着眼镜打开多个 Meta Horizon App 窗户进行多任务,或者用 Meta AI 对现实世界的事物进行识别、标注。
即使用户的视角从这些窗户上面移开,这些虚拟的投射会一直存在,静候用户的目光再次回归。至于投射的画质和清晰度,用来看图文不是问题,但用这个眼镜看电影效果还需要提升。
美中不足的是,Orion的续航只有2小时。
此外,据外媒报道,这款产品的硬件成本就已超1W美金(这意味着这款产品的价格要远超苹果的Vision Pro),这价格看起来就不是很能打,但扎克伯格也明确表示,Orion将被用作“开发套件”,但也因此不要指望很快就能买到它。
和先前的产品相比,Meta Orion 不厚重的外观和集成的 AR 功能,终归是让大家再次看到了 AR 眼镜落地的希望。
Mate依旧坚持在元宇宙和AI两条路上持续前进,并通过产品的融合,努力将虚拟现实和人工智能结合在一起。
“这是令人兴奋的一年,也是非常忙碌的一年。”扎克伯格在会上感慨。确实,在互联网巨头的世界里,想要改变自己的命运,最终还是得靠自己。就像他在接受《福布斯》杂志采访时所言:“决定命运的不是你的对手,而是你自己的行为。”
功夫不负有心人,自1月初以来,Meta股价飙升了63%,达到每股560美元以上的前所未有高点,虽然昨日该股稍有回调,收盘价为561美元。但扎克伯格的财富水涨船高,史无前例地增加了720亿美元,本周更是突破2000亿美元,跻身全球第三大富豪。仅位特斯拉CEO埃隆·马斯克、亚马逊创始人杰夫·贝索斯之后,他们是地球上唯三净资产达到2000亿美元的人。
业界认为,Meta今天“大秀肌肉”展示了其在人工智能领域的潜力,能够创造出超越智能手机和电脑的下一代计算平台。
不知Meta这一次新披露能否带动其股价再创新高呢?