腾讯Hunyuan3D：仅需10秒生成3D视图，首个同时支持文字和图像生成3D开源模型，3D游戏|影视|电商|虚拟现实

科技 2024-11-17 18:27 四川

腾讯Hunyuan3D：仅需10秒生成3D视图，首个同时支持文字和图像生成3D开源模型，3D游戏|影视|电商|虚拟现实

🌹大家好！欢迎来到破狼公众号。感谢大家的支持与鼓励。在AIGC探索道路上，我将与你一路同行。喜欢就星标关注破狼公众号或文末扫码加入交流群！本人仅运营公众号平台，未经授权严禁CSDN等其他平台抄袭和转载！

Hunyuan3D-1.0简介

近日国内大厂腾讯开源了最新首个同时集成文生和图生的3D开源模型：Hunyuan3D-1.0，该框架是一个统一的框架，可以被应用于文本到3D和图像到3D的生成。框架包含轻量版和标准版两个版本，都支持文本和图像条件的3D生成。

同时框架采用了2阶段生产方法：

• 在保证质量和可控的基础上，仅需10秒即可生成3D物体。在第一阶段，采用了一种多视角扩散模型，轻量版模型能够在大约4秒内高效生成多视角图像。
• 这些多视角图像从不同的视角捕捉了3D资产的丰富的纹理和几何先验，将任务从单视角重建松弛到多视角重建。在第二阶段，引入了一种前馈重建模型，利用上一阶段生成的多视角图像。

因此Hunyuan3D-1.0模型能够在大约3秒内快速而准确地重建3D视图。重建模型学习处理多视角扩散引入的噪声和不一致性，并利用条件图像中的可用信息高效恢复3D结构。最终，该模型可以实现输入任意单视角实现三维生成。模型能够被广泛应用于游戏开发、电影动画、电子商务以及虚拟现实/增强现实领域等广泛的应用场景。

• Github：https://github.com/Tencent/Hunyuan3D-1
• 项目主页：https://3d.hunyuan.tencent.com/
• huggingface：https://huggingface.co/tencent/Hunyuan3D-1
• 技术论文：https://3d.hunyuan.tencent.com/hunyuan3d.pdf

性能评估

腾讯Hunyuan3D-1.0在与其它开源3D生成方法的性能评估中表现出色，获得了最高的用户偏好评分。具体来说，Hunyuan3D-1.0的轻量版能够在大约10秒内使用NVIDIA A100 GPU从单一图像生成3D网格，而标准版则需要大约25秒。评估结果显示，Hunyuan3D-1.0在质量和效率之间取得了优异的平衡，如下图所示：

官方演示

Hunyuan3D-1.0体验

当前Hunyuan3D-1.0仅可以通过WebUI源码部署、ComfyUI、在线Demo体验，具体参见项目Github。由于ComfyUI插件涉及ComfyUI-3D-Pack插件安装，这是对本地环境要求和影响比较大的插件，插件作者也建议采用全新Conda环境安装，本文就详细叙述，具体参见ComfyUI文档。

• 項目主頁：https://github.com/Tencent/Hunyuan3D-1
• ComfyUI插件：https://github.com/jtydhr88/ComfyUI-Hunyuan3D-1-wrapper/blob/master/README_zh_CN.md
• 在线体验地址：https://huggingface.co/spaces/tencent/Hunyuan3D-1

Flux文生图工作流

Flux文生图感兴趣的同学可参考LIBLIB在线运行工作流：FLUX[续篇]：12B参数23G最大开源文生图模型，Dev版直出惊艳美图欣赏

Flux模型涉及ComfyUI工作流和模型均可在LIBLIBAI上下载或在线运行体验：

• FLUX.1哩布在线可运行-黑暗森林工作室：

https://www.liblib.art/modelinfo/488cd9d58cd4421b9e8000373d7da123

• F.1-绮梦流光-水湄凝香：

https://www.liblib.art/modelinfo/134c6dd95aef48e98a22b24e003e026b

• 工作流-Flux文|图生图+LORA+提示反推一键切换工作流：

https://www.liblib.art/modelinfo/782aacd70f604da39e83368c696a02a8

另外LIBLIBAI已支持本地客户端使用可首页(https://www.liblib.art/)可下载体验。

WebUI展示工作流

Hunyuan3D-1.0工作流

ComfyUI工作流安装视图ComfyUI-Hunyuan3D-1-wrapper插件。

01.熊猫

一只黑白相间的熊猫在白色背景上居中坐着，呈现出卡通风格和可爱氛围。

透明背景图：

多面视图：

3D效果：

02.兔子

一只粉红色的拟人化兔子，站在白色背景前。照片采用居中构图方式，卡通风格

透明背景图：

多面视图：

3D效果：

03.人物

一个亚洲女人穿着红色连衣裙站在房间中间，居中，写实

透明背景图：

多面视图：

3D效果：

Hunyuan3D-1.0作为开源文生3D视图模型进一步推进社区的3D模型里程碑。更成熟Tripo商业方法可参考Tripo来袭：优秀文生3D模型，极速3D生成，效果优于zero123，ComfyUI指南。

• 15秒F.1D直出，极限无损加速方案，环境大升级敢不敢来试？

• 更像了！5个百分点提升，字节写真换脸PuLID-F1再升级，小红书流量密码

• OmniGen：统一图像生成和多任务集成模型，任意人物自由合影，8位量化体验

• Shuttle-3-Diffusion：可商用F.1去蒸馏模型！仅4步约3秒出图，性能质量显著提升

• Mochi1：更简单和可商用，ComfyUI内核支持，社区生态推动4张H100到消费级显卡可用

• CogVideo:重磅升级！图生视频完美镜头控制和3D环绕,商用级开源AI视频曙光

• 阿里InContextLoRA：更强ID一致性！基于黑森林F1身份一致性连贯视频分镜图集，10组风格无限创意

• Flux-NewReality:栩栩如生摄影级解禁模型,追求真实细节&风景&神话高品质艺术

• [ComfyUI]InstantIR：来自小红书团队模糊图像修复技术，效果是否惊艳？

• [ComfyUI]Flux：F.1多区域精确控图，无需LORA技术多区域自由构图工具

• [ComfyUI]MochiEdit：最新视频编辑工具，Mochi视频生成加速方案

感兴趣加入[AGI技术交流群]+V

如果觉得文章不错，就请赞、在看与转发三连

破狼

关注AIGC、LLM、绘图作品、软件工程、技术学习。交流+V：shunshizhiwu。

最新文章

[ComfyUI]Flux：圣诞主题皮肤！小红书照片最强网感时尚穿搭

[ComfyUI]FastVideo：混元官方点赞，6步8倍轻量级加速模型！腾讯混元视频模型一致性蒸馏技术

腾讯混元视频：ComfyUI官方原生支持！GGUF量化低显存福音！开源生态高速发展

[ComfyUI]MagicQuill：无需PS全功能P图编辑工具！8G可运行，最全避坑指南

[ComfyUI]如意：智驾企业下场搞开源视频模型！7B图生视频&首尾帧&任意宽高比&增强运动与相机控制

[ComfyUI]MEMO：让静止图片活起来！音唇同步&丰富且自然表情的对话视频生成技术

[ComfyUI]腾讯混元视频：运动镜头控制！行走动画LORA，最强开源视频可控性里程碑

[ComfyUI]OminiControl：Flux全能P图神器！乾坤大挪移&重绘&CN控制，极简全能控制器

[ComfyUI]腾讯混元视频：开源LORA生态来啦！视频人物一致性&运镜可控性里程碑，支持NSFW

[ComfyUI]ZenID：面部融合神器！揭秘基因遗传，提前预测你和她的下一代基因

ComfyUI原生精确多区域控制！官方最新LoRA和模型权重的遮罩和调度方法

腾讯混元视频:视频写真换脸,请合理使用！工作流一键视频写真,最强导演级&虚拟与现实完美融合开源视频模型

[ComfyUI]Flux：极致光影！F1复古胶片摄影写实，模拟胶片极致色彩&光影&颗粒感

[ComfyUI]Flux：MJ艺术风！基于黑森林F1的Midjourney风，光效&写实&建模&演示&特写镜头

Shuttle 3.1 Aesthetic：低显存福音！S3D升级写实提升，4步秒级出图可商用，ComfyUI体验

[ComfyUI]腾讯混元视频：v2v视频驱动，最强开源视频模型，影视级画质与导演级运镜，本地16G可体验

[ComfyUI]AWPortraitCN：更真实质感细腻！专门针对国人外貌和审美优化F1模型

[ComfyUI]腾讯混元视频：虚实完美融合创意无极限！130亿大杯&影视级画质&导演级运镜&原生切镜&遵循物理运动&连续动作

DistyFlow：与众不同的工作流体验！降低入门难度，快捷高效全新体验，不容错过高效利器

[ComfyUI]Flux：国潮经典！敦煌古韵与现代极简国潮插画，敦煌风十二生肖和邮票集锦

[ComfyUI]CATVTON-Flux:电商虚拟换衣！基于黑森林F1重绘和阿里In Context LORA电商服装一致性

写实效果炸裂！疑似AI概率最低仅1%，轻松通过AI检测适用小红书日常写实模型，无缝接入ComfyUI自动化设计流程

[ComfyUI]RecraftAI：霸榜&比F1更真实的小红书写实风格模型！小熊猫无缝接入工作流自动化设计流程

IC-Light V2-Vary：打光模型重大升级，具有更强的光照变化，适用商用产品&摄影打光

ComfyUI桌面发布和开源，汉化共享等技巧，逐步完善win&mac多平台体验

[ComfyUI]SD3.5：ControlNet重磅发布！激烈竞争能否夺回黑森林Flux高地？

Lumiere：细节真实！专注更真实保持无损原生提示遵循和构图模型

[ComfyUI]Flux-IPA：效果惊艳！IPA基于10M数据F1专属风格迁移！补齐黑森林遗憾和空缺

[ComfyUI]LTXV：超高效视频模型！仅需4秒生成5秒24帧高质量视频，运动一致性且消除物体变形

[ComfyUI]FluxCN：精确控制！F1可控性组件最全剖析，线稿上色和转绘实战，黑森林官方下场亲手打造F1生态

[ComfyUI]FluxFill：先进与高效重绘和扩图神器，超越阿里等同类模型，黑森林官方下场亲手打造F1生态

[ComfyUI]FluxRedux：超好玩创意灵感，一丝小遗憾！F1风格化溶图组件，黑森林官方下场亲手打造F1生态

FLUX.1-Tools：黑森林官方重磅出手构建F1完善生态，补齐CN&IPA！加速生态里程碑进程

智谱CogVideoX1.5：重大升级，可商用开源模型！10秒&增强质量&任意分辨率，ComfyUI无缝体验

[ComfyUI]Flux：Lovely网红写真，极致细节写实，小红书网红人物写真风格

太酷啦！实时人物表情编辑神器，ComfyUI玩转视频表情无限创意

[ComfyUI]Flux：国漫经典《诛仙》之陆雪琪

PixelWave：更真实细节|动漫|摄影多种艺术风格显著提升，基于黑森林F.1D超5周精调模型

腾讯Hunyuan3D：仅需10秒生成3D视图，首个同时支持文字和图像生成3D开源模型，3D游戏|影视|电商|虚拟现实

PromptGenV2：仅1G低显存福音！更适合F1的CLIP和T5双通道反推！接近Joy性能与速率平衡反推模型

15秒F.1D直出，极限无损加速方案，环境大升级敢不敢来试？

Shuttle-3-Diffusion：可商用F.1去蒸馏模型！仅4步约3秒出图，性能质量显著提升

Mochi1：更简单和可商用，ComfyUI内核支持，社区生态推动4张H100到消费级显卡可用

CogVideo:重磅升级！图生视频完美镜头控制和3D环绕,商用级开源AI视频曙光

阿里InContextLoRA：更强ID一致性！基于黑森林F1身份一致性连贯视频分镜图集，10组风格无限创意

Flux-NewReality:栩栩如生摄影级解禁模型,追求真实细节&风景&神话高品质艺术

[ComfyUI]InstantIR：来自小红书团队模糊图像修复技术，效果是否惊艳？

更像了！5个百分点提升，字节写真换脸PuLID-F1再升级，小红书流量密码

[ComfyUI]F.1服装生成器，20.5K数据LORA助力服装电商设计

OmniGen：统一图像生成和多任务集成模型，任意人物自由合影，8位量化7G可体验

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉