Unique3D：一键操作，轻松将图片转为逼真高质量3D网格！

文摘 2024-09-16 00:00 江苏

Unique3D是一种新颖的图像到3D框架，可以从单视图图像高效生成高质量的3D网格，其特点是生成保真度高且具有很强的通用性。Unique3D 可以在 30 秒内从任何对象的单个正交 RGB 图像生成高保真纹理网格。生成的网格与原始输入图像非常相似，具有高质量的纹理和几何细节。Unique3D仅需 8 块 RTX4090 GPU即可在 5 天内完成训练。

论文阅读

Unique3D:从单个图像生成高质量和高效的3D网格

摘要

在本文中，我们介绍了Unique3D，这是一种新颖的图像到 3D 框架，可从单视图图像高效生成高质量 3D 网格，具有最先进的生成保真度和强大的泛化能力。以前基于分数蒸馏采样 (SDS) 的方法可以通过从大型 2D 扩散模型中提取 3D 知识来产生多样化的 3D 结果，但它们通常存在每个案例优化时间长且不一致的问题。最近的研究解决了这个问题，并通过微调多视图扩散模型或训练快速前馈模型来生成更好的 3D 结果。然而，由于不一致性和有限的生成分辨率，它们仍然缺乏复杂的纹理和复杂的几何形状。

为了在单幅图像到 3D 中同时实现高保真度、一致性和效率，我们提出了一个新颖的框架 Unique3D，其中包括一个多视图扩散模型和相应的法线扩散模型，用于生成带有法线图的多视图图像，一个多级升级过程，用于逐步提高生成的正交多视图的分辨率，以及一种称为ISOMER的即时一致的网格重建算法，该算法将颜色和几何先验完全集成到网格结果中。大量实验表明，我们的 Unique3D 在几何和纹理细节方面明显优于其他图像到 3D 基线。

方法

Unique3D的pipeline。给定单个野生图像作为输入，我们首先从多视图扩散模型生成四个正交多视图图像。然后，我们通过多级升级过程逐步提高生成的多视图的分辨率。给定生成的彩色图像，我们训练法线扩散模型以生成对应于多视图图像的法线图，并利用类似策略将其提升到高分辨率空间。最后，我们使用即时一致的网格重建算法 ISOMER 从高分辨率彩色图像和法线图中重建高质量的 3D 网格，这是一种直接变形网格的强大多视图重建方法，可以有效地重建具有数百万个面的网格模型。

效果

我们将我们的模型与 InstantMesh、CRM 和 OpenLRM 进行比较。我们的模型生成精确的几何图形和详细的纹理。

定性比较。我们的方法提供了优越的几何和纹理。

异构体的消融研究。(a)没有ExplicitTarget，输出的网格结果有明显的缺陷。(b)如果没有展开正则化，输出结果在某些情况下会崩溃。

我们的方法从单个图像生成的更多结果。

网格初始化的消融。我们比较使用快速初始化的结果方法，而不是使用球体作为初始化。

结论

在本文中，我们介绍了 Unique3D，这是一种开创性的图像到 3D 框架，可以高效地从单视图图像生成高质量的 3D 网格，并且保真度和一致性达到前所未有的水平。通过集成先进的扩散模型和强大的重建方法 ISOMER，Unique3D 可以在 30 秒内生成细节丰富且纹理丰富的网格，大大提升了从单幅图像创建 3D 内容的先进水平。

局限性和未来工作。我们的方法虽然能够快速生成高保真纹理网格，但也面临挑战。多视图预测模型对于倾斜或非透视输入可能会产生不太令人满意的预测。此外，几何着色算法目前不支持纹理图。未来，我们的目标是通过在更广泛和多样化的数据集上进行训练来增强多视图预测模型的稳健性。

感谢你看到这里，也欢迎点击关注下方公众号并添加公众号小助手加入官方读者交流群，一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术，欢迎一起交流学习💗～

http://mp.weixin.qq.com/s?__biz=MzU2OTg5NTU2Ng==&mid=2247487826&idx=2&sn=b298f951fb180fb519e1634ede8cf5c3

AIGC Studio

一个有趣有AI的AIGC公众号：关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术。这里不仅有简单易懂的AIGC理论实践和AI学习路线，还有大厂工作经历和体会分享。如果有幸能给你一些帮助就更好啦！

ChatTTS：对话式高可控的语音合成模型，最强文本转语音工具！

Facechain：只需1张照片，10秒就可以生成多种风格个人写真！

MS-Diffusion：一键合成你喜爱的所有图像元素，个性化生成新思路！

IFAdapter：用于基础文本到图像生成的实例特征控制，即插即用，无缝应用于各种社区模型。

Unimate,可根据单张图片和姿势指导生成视频。

AnyControl：精准控制下的创意风暴，高质量图像一键生成！

EchoMimic来袭，音频+面部标志，让你的肖像“活”起来！

FLUX的ID保持项目来了! 字节开源PuLID-FLUX-v0.9.0，开启一致性风格写真新纪元！

商汤发布UniTalker，实现高质量音频驱动3D面部动画生成。

EAFormer：场景文本分割新SOTA，图像文本擦除无痕迹！

CustomCrafter，可保留动作和概念合成功能的定制视频生成框架！

免费开源 AI 证件照制作工具：HivisionIDPhoto，文章附下载和使用教程。

3D生成新方法！GIMDiffusion：能生成合理的展开贴图和高质量mesh，速度和图像生成平齐！

Unique3D：一键操作，轻松将图片转为逼真高质量3D网格！

StructLDM：高质量可控3D生成并支持编辑。

MotionClone:一键克隆视频运动，让创意无界限！

Motionshop：AI一键替换视频人物为3D角色，效果逼真！

LLM+知识图谱新工具！ iText2KG：使用大型语言模型构建增量知识图谱。

Prompt2Fashion：自动生成多风格、类型时尚图像数据集。

RegionDrag：通过手动拖拽实现图像编辑！

StructLDM：高质量可控3D生成并支持编辑。

新个性化时尚解决方案！Prompt2Fashion：自动生成多风格、类型时尚图像数据集。

One-DM：只需单张参考图，完美仿写各种手写内容！

理想汽车提出3DRealCar：首个大规模3D真实汽车数据集!

图像抠图革新！Matting by Generation生成式抠图技术，智能识别主体，边缘处理细腻入微。

AI可以模仿人类手写签名了？DiffusionPen：实现手写文本生成的风格控制。

开源图像标注工具 X-AnyLabeling v2.4.0 正式发布！

LinFusion: 单GPU一分钟生成16K高清图像，无缝兼容SD插件！

Glyph-ByT5-v2，支持10国语言图文海报生成，效果惊艳！

MeshAnything V2：30秒生成建模师级Mesh。

快手可图上线一键换衣Kolors Virtual Try-On，直冲开源项目Top 1！

[ComfyUI] 中秋特制Flux工作流：月影婆娑月饼小丸子。

Haper SD Lora: 8步就可以用 Flux-dev生成图片!

ViewCrafter：一张图像就可以制作影视特效和游戏画面！

语言/图像/视频模型一网打尽！BigModel大模型开放平台助力开发者轻松打造AI新应用！

CustomCrafter：具有保留动作和概念合成功能的定制视频生成框架！

ReSyncer: 高质量口型同步和个性化微调！

TurboEdit：0.5秒实现高质量文本到图像编辑！

上交提出了多风格面部素描生成模型,有效解决数据不足、风格类型受限等问题。

Poetry2Image：专为中文古诗词图像生成，忠于原诗意境和语义。

Champ：只需要一个视频和一张图片，就能让图片中的人物动起来！

Pix2Gif：一张图就可以生成Gif动图！

AI生图美学在淘宝的实践应用

Google提出第一款游戏生成引擎GameNGen，可以每秒20帧速度实现游戏场景生成和交互！

anytext阿里开源，解决comfyui精准文字控制！

ViewCrafter：一张图像就可以制作影视特效和游戏画面！

开源AI证件照制作工具：HivisionIDPhoto，文章附下载和使用教程。

免费开源 AI 证件照制作工具：HivisionIDPhoto，文章附下载和使用教程。

CustomCrafter，可保留动作和概念合成功能的定制视频生成框架！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

Unique3D：一键操作，轻松将图片转为逼真高质量3D网格！

相关链接

论文阅读

摘要

方法

效果

结论