Stability AI发布Stable Fast 3D！可在0.5s内生成3D建模资产

文摘科技 2024-08-04 06:52 上海

引言

Stability AI 刚刚发布了一款新产品 Stable Fast 3D (SF3D)，它可以在一秒钟内从图像生成纹理3D建模资产。这个速度快得令人难以置信，因为我上一次尝试的人工智能3D生成器，如 Meta AI 的 3D Gen（文本到三维）或清华大学的 Unique3D（图像到三维），渲染三维资产需要 50-60 秒。

在本文中，我们将介绍这种新的快速稳定3D生成器是什么、工作原理以及如何使用。

什么是Stable Fast 3D？

稳定快速三维重建（SF3D）是一种新方法，可在 0.5 秒内从单张图像快速、高质量地重建物体纹理的网络。

与大多数现有方法不同的是，SF3D 在生成网格时进行了明确的训练，并采用了快速 UV 解包技术，从而能够快速生成纹理，避免了对顶点颜色的依赖。该方法还能预测材料参数和法线贴图，以提高重建三维网格的视觉质量。

此外，SF3D 还集成了一个消除低频光照效应的步骤，确保重建的网格能在各种光照条件下轻松使用。

如果您想了解 Stable Fast 3D 的更多详情，请点击此处查看原始论文。

论文链接：https://stable-fast-3d.github.io/static/paper.pdf

工作原理

首先，大家只需上传一张物体的图像。然后，Stable Fast 3D 会快速生成完整的 3D 资产，包括：

UV 展开网格
材料参数
减少照明反照率色彩
可选的四边形或三角形重网格

要使用 SF3D 生成 3D 物体，首先要通过 DINO v2 编码器处理输入图像，生成代表图像特征的图像标记。

这些图像标记Token与摄像机标记Token一起被输入到一个大型Transformer模型中，以预测一个三平面体积表示法，对场景的三维结构和外观进行编码。

SF3D 不依赖可微分体积渲染，而是采用可微分网格渲染器和网格表示法。网格从预测的密度场中提取，并添加顶点偏移，以生成更平滑、更精确的几何图形。

接下来，该方法会提取反照率颜色（即物体表面在无光照情况下的固有颜色）和切空间法线（提供表面细节和纹理）。这确保了表面在视觉上看起来平滑细致。另一个网络处理输入图像，预测粗糙度和金属特性等材料参数，这对于逼真渲染和为物体提供适当的反射特性至关重要。

在训练过程中，该模型还将场景光照预测为一组球形高斯，这些球形高斯是从包含必要 3D 信息的三维平面中提取的。

最终的图像会进行差异化渲染，将网格、反照率颜色、切空间法线和材料参数结合起来，确保所有组件协同工作，生成高保真的三维资产。

可能应用

Stable Fast 3D技术在游戏和电影制作中都有多种应用。

在生产前阶段，广泛的实验至关重要，此时可充分利用其快速推理能力
为游戏创建静态资产，如背景对象、杂物和家具。
为电子商务平台生成 3D 模型。
为 AR/VR 体验快速制作模型。

在线试用

目前，大家可以通过三种方式使用 Stable Fast 3D。

通过在 Github 上下载 Stable Fast 3D 模型代码并下载模型权重，在本地计算机上使用。

模型权重：https://huggingface.co/stabilityai/stable-fast-3d

该模型还可通过应用程序接口和 Stable Assistant进行访问。

Stable Assistant: https://stability.ai/stable-assistant

使用 HuggingFace 演示版在线尝试。

Hugging Face：https://huggingface.co/spaces/stabilityai/stable-fast-3d

让我向大家展示 HuggingFace 上的 Gradio 演示。只需将样本图片上传到下拉区域，然后调整前景即可控制前景对象的大小。

上传测试输入图像后，背景将自动移除。如果图像已经有 Alpha 通道，则可以跳过移除背景的步骤。点击 "运行 "按钮。

正如它所承诺的那样，处理速度快得令人难以置信。只需几毫秒，结果就会显示在仪表板的右侧部分。

太棒了！大家可以以 GLB 文件的形式下载高质量的 3D 资产。下面是更多示例：

此外，我还注意到人工智能在渲染具有较小细节的物体时非常吃力。请看下面的例子：

在这种情况下，大家可能需要降低前景比例值来改善该问题。

总结

总的来说，Stable Fast 3D 是一种新颖的 3D 资产生成方法。尤其是处理速度，给我留下了深刻印象。就质量而言，虽然它在处理基本形状的物体时已经足够出色，但在处理具有复杂细节的复杂物体时，它仍然显得力不从心。尽管如此，这仍然是 3D 生成技术领域的一大进步。

点击上方小卡片关注我

添加个人微信，进专属粉丝群！

http://mp.weixin.qq.com/s?__biz=MzkzODI1NzQyNA==&mid=2247490605&idx=1&sn=ee66c618421860482e1b3a3dc77b25da

AI算法之道

一个专注于深度学习、计算机视觉和自动驾驶感知算法的公众号，涵盖视觉CV、神经网络、模式识别等方面，包括相应的硬件和软件配置，以及开源项目等。

最新文章

掌握Transformer之深入多头注意力机制

掌握Transformer之学习各组件

掌握Transformer之概述

十分钟深入理解BatchNorm层

NLP领域中Beam Search直观解释

【Python】一文弄懂Python中的@wraps

BatchNorm层直观性解释

手把手教你打造虚拟AI Talker

【Python】关于F-Strings的六种高级用法

ReLU如何让神经网络逼近连续非线性函数?

Luma推出 Dream Machine 1.5 - 新的人工智能视频生成器

RAG检索增强生成最佳实践

万字长文讲解文本嵌入及其高阶应用

我后悔没有早点知道 Python中迭代的八个技巧

【Python】五种方法实现两个变量数值交换

一文弄懂RAG检索增强生成技术

强烈推荐10个人工智能小项目

一文弄懂Python在Windows/Mac/Linux上路径兼容问题

推荐免费访问最强AI绘画FLUX.1的五种方式

推荐提升时序数据可视化展示的三个技巧

如何优雅地在Python中管理环境变量？

超越Midjourney最强AI绘画FLUX.1发布

什么是Python中的requirements.txt文件？

通用NLP入门技术介绍

检索增强生成RAG技术入门介绍

推荐！彻底改变Python编码方式的十个技巧

万字长文讲解机器学习领域中11种降维技术

Stability AI发布Stable Fast 3D！可在0.5s内生成3D建模资产

推荐五种简单有效的数据可视化方式

挑战Google，OpenAI发布Search GPT

【Python】还只会一种函数调用方式，你Out了！！！

超强总结，八种解决过拟合的技巧！！

一文弄懂生成式对抗网络

推荐免费AI工具创建手绘卡通风格图像

强烈推荐Claude Artifacts五项强大功能

重塑计算机视觉任务的基础模型介绍

【Pathlib】一文弄懂Python中的路径问题

数据可视化之绘制雷达图

【Python】推荐调试pip的六个技巧

图解SimCLR对比学习框架

【Python】在同一图形中的绘制多个子图

强化学习Q-learning实践

强化学习Q-learning入门

自动驾驶业内动态简讯

Python数据可视化小结

一文弄懂Transformer中的自注意力机制

【Python】使用Print函数制作旋转的动画

一道Python初学者易犯的错误解析

Python中子类__init__函数注意项小结

一文弄懂Python中的内存管理

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉