首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

无需相机数据！刚刚苹果用AI颠覆3D视觉，0.3秒生成3D深度图，新框架还开源！

教育 2024-10-05 13:27 美国

熊可爱

苹果开源Depth Pro：细节捕捉能力惊人，毛发级3D深度图生成只需0.3秒。空间计算、AR行业或迎来新突破。

苹果最近发布了一个名为Depth Pro的AI模型，它能够在不到一秒的时间内从单张2D图像生成详细的3D深度图，这可能会彻底改变机器如何感知深度，对空间计算、XR等行业产生深远影响。

Depth Pro能够生成高分辨率的深度图，速度极快，且不需要传统上需要的相机数据来做出这样的预测。这项技术在单目深度估计领域是一个重大进步，该过程仅使用一张图像来推断深度。

Depth Pro的另一个独特之处在于其能够估计相对和绝对深度的能力，称为“度量深度”。这意味着该模型可以提供现实世界的测量值，这对于需要在物理空间中精确放置虚拟对象的AR应用至关重要。

苹果发布Depth Pro：重塑3D视觉规则的AI模型

这项技术在实时空间感知至关重要的多个行业都有广泛的应用。该模型的创造者，由Aleksei Bochkovskii和Vladlen Koltun领导，称Depth Pro是同类中速度最快、精度最高的系统之一。

单目深度估计长期以来一直是一项挑战，通常需要多张图像或焦距等元数据来准确测量深度。

但Depth Pro绕过了这些要求，在标准GPU上仅用0.3秒就能生成高分辨率的深度图。该模型可以创建225万像素的地图，具有卓越的清晰度，捕捉到其他方法常常忽视的微小细节，如头发和植物。

“这些特性得益于多项技术贡献，包括高效的多尺度视觉变换器，用于密集预测，”研究人员在论文中解释道。这种架构使模型能够同时处理图像的整体上下文和细微细节——这是对之前较慢、不够精确模型的巨大飞跃。

Depth Pro真正与众不同之处在于其能够估计相对和绝对深度的能力，这种能力被称为“度量深度”。

这意味着该模型可以提供现实世界的测量，这对于AR等应用至关重要，因为虚拟物体需要在物理空间中精确放置。

而且，Depth Pro无需在特定领域的数据集上进行大量训练即可做出准确预测，这被称为“零-shot学习”。这使得该模型具有高度的灵活性，可以应用于各种图像，而无需深度估计模型通常需要的相机特定数据。

“Depth Pro在‘野外’的任意图像上生成带有绝对尺度的度量深度图，无需相机内参等元数据，”作者解释道。这种灵活性打开了新的可能性，从增强AR体验到改善自动驾驶汽车的障碍物检测和导航能力。

对于想要亲身体验Depth Pro的人，Hugging Face平台上提供了实时演示。

熊嘻嘻

地址：：

https://huggingface.co/spaces/akhaliq/depth-pro

AIGC + 3D/空间计算相关内容拓展：

苹果Vision Pro空间视频手册 - 涵盖技术方案/产品化模版/创业机会/产品案例参考

AIGC+3D:近期常看3个方案 - AI生成VR 360全景图、数字人化身、3D模型纹理贴图

AI生成沉浸式3D世界（空间照片/视频）；套壳ChatGPT，ARR突破400万美元......

基于AI生成3D模型动作、AI动作捕捉;AI+3D重建，电商人一键生成产品的3D宣传片

【工具库+方案】照片生成3D场景/3D点云，非常适合做三维重建、AR大空间

AI创业者

实际应用：从电子商务到自动驾驶

这种灵活性对多个行业具有重要意义。例如，在电子商务中，Depth Pro可以让消费者通过简单地将手机相机指向房间，查看家具在家中的摆放效果。在汽车行业，从单一相机生成实时、高分辨率深度图的能力，可以改善自动驾驶汽车对其环境的感知，提升导航和安全性。

“该方法应在这种零-shot模式下理想地生成度量深度图，以准确重现物体形状、场景布局和绝对比例，”研究人员写道，强调该模型在减少与传统AI模型训练相关的时间和成本方面的潜力。

应对深度估计的挑战

深度估计面临的最大挑战之一是处理所谓的“漂浮像素”——由于深度映射中的错误而在空中悬浮的像素。Depth Pro直面这一问题，使其在3D重建和虚拟环境等需要准确性的应用中尤其有效。

此外，Depth Pro在边界追踪方面表现优异，超越了以前的模型，能够清晰划分物体及其边缘。研究人员声称其在边界精度上“超越其他系统一个倍数”，这对于需要精确物体分割的应用（如图像抠图和医学成像）至关重要。

为了加速其采用，苹果将Depth Pro开源。代码和预训练模型权重可在GitHub上获取，允许开发者和研究人员实验并进一步完善这项技术。该库包括从模型架构到预训练检查点的所有内容，使其他人能够轻松基于苹果的工作进行开发。

AI深度感知的未来

随着人工智能不断突破可能性的边界，Depth Pro在单目深度估计的速度和精度方面树立了新的标准。其能够从单张图像生成高质量、实时的深度图的能力，可能对依赖空间感知的行业产生广泛影响。

在一个AI日益成为决策和产品开发中心的世界里，Depth Pro展示了尖端研究如何转化为实际的、现实世界的解决方案。无论是改善机器对周围环境的感知，还是提升消费者体验，Depth Pro的潜在用途都是广泛而多样的。

正如研究人员总结的那样，“Depth Pro在物体边界的清晰划分上大大超越了所有先前的工作，包括头发、毛发和植物等精细结构。”随着开源发布，Depth Pro可能很快成为从自动驾驶到AR等行业的核心，改变机器与人类在3D环境中的互动方式。

AI创业者

代码地址：

https://github.com/apple/ml-depth-pro

#社区日报 1、【经验与SOP】AI时代SaaS产品定价的演变 - 如何调整以及模版参考2、基于Web的实时动作捕捉工具，视频可生成3D人物动作

3、【图谱+数据】AI大模型顶级公司OpenAI和Anthropic到底赚钱不？赚了多少钱？4、做AI数字宠物的创业者关注：专注于单张图片生成动物的3D模型，附带代码......5、今天看小扎最新采访说到“2030年智能眼镜取代手机”，翻到了Meta在AR+AI的10年产品路线图（2016年制定）

【社区成员扫码查看】

社区会员

—— End ——

【驶向互联网下一站社区】AI/一人商业/XR/前沿科技...你的最佳Copilot。昨日社区内容如下：

1、【SOP - 业务经验】如何利用生成式AI来培训员工：

https://t.zsxq.com/EQmUb

2、面向技术人员的AI大模型日报 - 每天筛选全球hackernews上面的AI热点：

https://t.zsxq.com/s9KNZ

3、【盘点】YC Demo Day 1 中值得关注的10多家AI公司，看看全球都在做什么生意？https://t.zsxq.com/n6W6F

4、【AI风向标】打造电脑工作者的“AI助手”，以“万物快捷方式”简化日常工作流程，融资3000万美元：

https://t.zsxq.com/ir5Oh

5、【文字稿】Snap AR眼镜大揭秘 - 通往智能眼镜的道路（发展历程、光学技术等）

https://t.zsxq.com/QuSge

6、做VR射击游戏，7个月内突破2000万美元，83.5万玩家入坑，Quest平台发布后收入翻倍：

https://t.zsxq.com/mGEtv

7、【随想】空间计算/XR的现状——Meta Orion（优势亮点、不太理想的部分）

https://t.zsxq.com/tQBhY

8、AI代理最新趋势：AI Agent如何推动下一波企业自动化浪潮：

https://t.zsxq.com/4egYZ

9、2024年空间计算/XR的现状：

https://t.zsxq.com/mkG1I

10、【方案库】基于Quest或者Vision Pro做类似“空间回忆”产品的，关注一个AI NeRF方案：

https://t.zsxq.com/jE7Fi

如何查看：扫描下图二维码进入社区查阅：

http://mp.weixin.qq.com/s?__biz=Mzg2ODUzMzEzMg==&mid=2247517525&idx=1&sn=aa1db62722ddcbbe7815f5885446f1b7

加微：XDZ8833，进万人AI和XR创业者裙。三次方-聚焦下一代互联网的科技产业服务平台！包含媒体服务、智库、社区等业务！面向下一代互联网的创业者社区，关注AI、XR、一人商业等

最新文章

迪士尼裁撤元宇宙部门后反转！成立AI+MR部门，Vision Pro负责人掌舵，100+人团队打造下一代娱乐体验

3D场景一键生成！被Autodesk收购后，AI动画顶流公司推出视频转3D场景，实时动画技术颠覆视觉效果行业

【灵感库】来抄项目，30天30个Vision Pro实战产品原型设计，近期最佳

三星财报透露：联手谷歌的AI+XR设备将于2025年问世；奥特曼透露ChatGPT等产品计划

Meta的AR/VR部门收入连续第三个季度高于去年；谷歌AI眼镜背后的AI多模态Astra最早2025年发布

【方案】全新3D重建点云格式，【AI+3D】3D领域的“JPG时刻嘛”？

三个00后、20岁少年辍学创业，打造AI同事，来取代财务，梦想是让AI经营一家公司

传Meta正在开发AI搜索引擎；多模态AI游戏助手，比人类更会玩《我的世界》？

14人团队打造元宇宙新未来,AI一键生成3D虚拟世界,8年创业路,累计收入超2000万美元

做垂直的AI首饰珠宝平台，面向艺术家和电商用户，获1700万美元融资

突发，爆OpenAI计划下个月发布新旗舰模型，献给ChatGPT的两周年礼物

【基于Web端的3D虚拟空间】项目方案，工程师可参考的技术代码

突发！苹果可能会在2024年底前停止生产Vision Pro

从竞争对手到联手创业，两位创始人打造AI销售助手，融资1400万美元，全自动化销售团队梦想成真？

【产品拆解】如何在Vision Pro上做一款成功的沉浸式叙述应用？类似刷屏的苹果官方恐龙体验

库克首次回应Vision Pro销量低迷：目前它不是大众市场产品，对未来充满信心

苹果内部认为其在AI方面至少落后两年

【创业指南】今年拿到钱的AI编程类产品都有哪些：汇总以及经验参考

Quest 3S全球首次“拆机”，发现它其实是Quest 2的升级版！

做AR游戏,8年赚了近600亿.CEO最初不想做游戏。起源谷歌,这家巨头想在AR领域通吃？

Unity 6正式发布：10年磨一剑，AI引擎Sentis登场，网友：游戏下一个十年属于AI！

业务经验：企业采购生成式AI的成本是多少？部署大模型业务最小化流程和必备清单

他副业打造主流Web 3D框架，成为WebXR标准，还开源，创始人分享成功法则

用AI代理颠覆客服行业，27岁华人CEO打造6.5亿美元估值AI Agent！让企业月省数十万美元

一个人开发VR游戏到营收突破1亿美元，CEO解释如何成功、产品理念以及Meta的XR生态

一句话生成3D游戏世界！《头号玩家》作者联合200人团队，AI加持下的大规模虚拟体验,网友：小说照进现实？

彭博社：便宜版Vision Pro明年上市，售价约2000美元，苹果加速全民空间计算

Meta内部打造VR头显、AR眼镜、AI智能硬件的流程曝光

Meta为了推动AR眼镜Orion内容生态,示好开发者,2年内希望上市；爆Llama 4深度赋能AR应用

彭博社：苹果Vision Pro负责人退休

50人团队做WebAR工具，刚刚被4500万美元收购；谷歌AI眼镜“复活”，代号曝光

Vision Pro开发历程（开发硬件准备、开销、成本、花费了多少、审核上线、盈利了多少？）

苹果首部沉浸式VR电影将上映，专为Vision Pro拍摄，《西线无战事》导演指导

苹果放弃智能戒指项目；消息称真AR眼镜将于2026年量产,采用Micro LED技术

基于AI大模型的一站式求职工具，这个最近在外媒爆火，非常适合产品化，有现成方案，找到PMF

虚幻引擎制造商Epic十年计划启动，未来十年将专注元宇宙构建，联手迪士尼

无需相机数据！刚刚苹果用AI颠覆3D视觉，0.3秒生成3D深度图，新框架还开源！

微软XR业务大撤退：HoloLens 2彻底停产，软件终止；Windows 11不支持VR眼镜

谷歌AI生成播客产品硅谷爆火：负责人访谈笔记、类似方案复刻

重磅！三星的AI眼镜要来了，联手谷歌，集成Gemini AI，对标Meta雷朋眼镜

做VR大空间，年营收破5亿元。CEO复盘成功秘诀,10年内每个社区都配有VR大空间场所

【经验复盘】开发者如何看待这款最赚钱的VR游戏，狂揽1000万玩家，1亿美元收入，TikTok百亿流量，成功经验复盘

全球最大3D重建数据集！Meta为智能眼镜打造，实现亚毫米级的几何精度和照片级真实感

扎克伯格首次公开谈智能眼镜取代手机的时间点：2030年！！！

《消失的法老》背后制造商CEO：谈产品流程、如何盈利、如何分成.....

彭博社：苹果正尝试几种AR眼镜路线

苹果便宜版Vision眼镜配低分辨率显示屏；爆Vision Pro 2明年量产，配M5芯片

Meta CTO回应：AR眼镜Orion将在 2030 年前推出，价格介于手机和笔记本电脑之间

Snap AR眼镜大揭秘 - 通往智能眼镜的道路（发展历程、光学技术等）

万字访谈：为什么扎克伯格认为AR眼镜将取代你的手机，幕后揭秘Orion十年研发之路

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉