首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

重磅！谷歌开源XR-Objects：用AI让物理世界秒变数字世界

旅行 2024-10-04 09:14 北京

谷歌这次他们要把我们身边的普通物品变成智能交互界面！

谷歌AI最近发布了一个名为XR-Objects的开源增强现实（AR）原型，这个系统能够实时将物理对象转变为交互式数字门户。

听起来很科幻？让我们来深入了解这个令人兴奋的新技术。

XR-Objects：现实世界的"右键菜单"

XR-Objects的核心理念是增强对象智能（Augmented Object Intelligence，AOI）。简单来说，就是让现实世界的物体也能像电脑文件一样，轻轻一点就能弹出功能菜单。

想象一下，你正在厨房里准备晚餐：

看到一锅意大利面，轻轻一点，就能显示烹饪时间和温度建议。
拿起一瓶调味料，轻轻一点，就能查看营养成分和过敏原信息。
对着冰箱里的食材，轻轻一点，就能获得食谱推荐。

这就是XR-Objects想要实现的未来！

技术原理：AI+AR的完美结合

XR-Objects的实现依赖于多项尖端技术的融合。让我们来看看它的核心组成部分：

实时物体检测：

使用MediaPipe进行物体分割和分类
基于COCO数据集，可识别80种常见物体类型
为保护隐私，系统会自动排除检测到的人物

3D空间定位：

利用ARCore进行同步定位与地图构建（SLAM）
通过射线投射（raycasting）将2D边界框转换为精确的3D坐标

多模态大语言模型（MLLM）：

每个检测到的物体都会与一个MLLM（如PaLI）配对
MLLM分析裁剪后的物体图像，提供详细信息（如产品规格、评价等）

用户交互：

支持触摸和语音两种交互方式
语音命令通过语音识别引擎处理，结果显示在物体上方的面板中

UI设计：

采用世界空间UI，数字元素直接锚定在物理对象上
使用半透明"气泡"标记可交互对象，减少视觉干扰
固定类别和动作的径向菜单，提高决策效率

对象比较：

支持多个对象的拼接查询
MLLM处理组合查询，生成综合比较结果

应用场景：厨房、商场、博物馆……

XR-Objects的应用前景非常广阔。除了前面提到的厨房场景，它还可以：

在超市购物时，轻轻一点就能比较不同产品的价格和评价。
在博物馆参观时，对着展品一点就能获取详细介绍。
在家里整理物品时，对着不认识的东西一点就能知道它的用途。

这种技术将彻底改变我们与周围环境的交互方式，让现实世界变得更加智能和信息丰富。

用户体验：效率提升31%

谷歌进行了一项用户研究，比较了XR-Objects与传统AI助手（如Gemini app）在完成物体相关任务时的表现。结果令人振奋：

使用XR-Objects完成任务的平均时间为217.5秒，比传统方法（286.3秒）快31%。
在HALIE框架评估中，XR-Objects在易用性方面表现更加一致（偏度γ₁ = 0.03，而基准系统为γ₁ = 2.25）。
大多数参与者表示，如果能在头戴式显示器（HMD）上使用XR-Objects会更加理想（F(191, 179) = 1.917，p < 7.05e−08）。

这些数据充分证明了XR-Objects的实用性和潜力。

代码已开源

最为重要的，谷歌已经将XR-Objects的代码开源了！

这意味着任何对AR和AI感兴趣的开发者都可以基于这个框架进行创新和扩展。

谷歌表示，他们希望通过开源XR-Objects，能够推动XR领域的创新浪潮，让数字世界和物理世界的界限变得更加模糊。

AR+AI的无限可能

XR-Objects的出现，让我们看到了AR技术与AI结合的巨大潜力。随着技术的进一步发展，我们可以期待：

更加智能和精准的物体识别
更加自然和沉浸式的交互方式
更加个性化和上下文相关的信息推送

该技术将重塑我们与周围世界的互动方式，让"万物互联"不再是遥不可及的梦想。

那么，你最期待在哪些场景下使用XR-Objects呢？

是在厨房烹饪时获取实时指导，还是在逛街时快速比价？

论文地址：https://arxiv.org/pdf/2404.13274

项目地址：https://github.com/google/xr-objects

👇

👇

👇

👇

本文同步自于知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本；
每天挖掘出10+ 热门的/新的 github 开源 AI 项目；
每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

http://mp.weixin.qq.com/s?__biz=MzA4NzgzMjA4MQ==&mid=2453451465&idx=1&sn=4fb777db8615da6f10578aa1a9fd41e9

关注AGI 的沿途风景！

最新文章

MLX-VLM：让你的Mac秒变AI视觉大师！

生物界的GPT来了？Basecamp Research获6000万美元融资打造「生物版ChatGPT」

MAID：多文件一键生成ChatGPT提示词的神器！

惊人突破：ChatGPT诊断癌症达96%准确率

Perplexity计划筹资5亿美元，估值将达80亿美元

我如何在两周内全面学习LLMs？【实习求职必读】

重磅！OpenAI前CTO Mira Murati筹资一亿美元创办新公司

Sage：开源版GitHub Copilot，代码库也能聊天了！

特斯拉无线充电机器人，惊艳亮相！

重磅！微软开源1比特推理框架，CPU跑千亿模型，速度起飞

Yann LeCun：驴爬楼梯说明了什么？

SQL+LLM：让数据分析变得更加智能

Anthropic的财务分析师：用AI洞悉数据，一键生成可视化报告

Anthropic新研究揭示模型潜在的「破坏」能力

Omni ocr：「糟糕」PDF一键转结构化数据

重磅！OpenAI 或用「AGI已实现」漏洞与微软决裂

Greg Brockman将于下个月回归OpenAI，但，公司已物是人非！

英特尔联手AMD，x86联盟反击ARM霸权！

OpenAI大门敞开：不懂AI也能加入，只要你敢想敢干！

NotebookLM最新大升级：定制音频概览、后台播放，并推出企业版

Anthropic 的 CEO 认为 AI 将带来乌托邦 —— 但他首先需要数十亿美元

"X is All You Need"的论文标题是怎么爆发的？

为什么Yann LeCun与Sam Altman对AGI 的预测如此不同？

Meta推出CoTracker3：重新定义视频点追踪

Suno 推出新功能：让照片和视频秒变专属歌曲

英伟达深夜偷袭，微调llama3.1直接击败GPT-4o和Claude3.5

刚刚，Mistral发布端侧模型，占据边缘计算之王！

OpenAI Swarm多代理框架 vs CrewAI 和 AutoGen

Andrej Karpathy：1B参数模型足矣！

AI能理解颜色吗？——将色彩进行嵌入的研究

OpenAI「重磅」新研究：你的名字可能影响ChatGPT的回答！

马斯克机器人梦碎？LeCun：Optimus不过是一具华而不实的躯壳

Gladia获1600万美元融资，推实时语音AI引擎

惊人发现！去学习法未能让AI真正「忘记」，它只是学会了「隐藏」

重磅！Anthropic发布超级智能时代的AI安全政策

Google计划用核能前往AGI

AI不如猫？斯坦福AI主任驳LeCun：你太悲观了！

OpenAI O1：正用AI加速AI的研发

普林斯顿大学：限制AI访问将带来负面影响。LeCun：开源终将胜利！

OpenAI的新威胁：前CTO Mira Murati 正挖角内部员工以创办新公司

AlphaCodium突破o1瓶颈：让AI代码生成更接近人类思维

LLM不会推理——1万美金悬赏下，o1在内所有模型均无法反转二叉树？！

谢赛宁：重要的话说三次，表征对齐很重要！！！

Sam Altman的完美花园：OpenAI的未来蓝图？

Cursor 最强对手？AI编程独角兽Poolside获eBay、英伟达融资5亿美元！

OpenAI将推出新模型对抗Anthropic！不是GPT-5

Glean：从OpenAI禁投黑名单到46亿美元估值

PyTorch版AlphaFold 3来了！

AGI倒计时！Anthropic CEO预言2026年到来

OpenAI遭惊天剽窃指控！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉