混元视频极致显存管理6G可运行129帧512x384,24G无损129帧720x1280！Lib在线工作流体验

科技 2024-12-31 18:14 四川

腾讯混元视频：极致显存管理，6G可运行129帧512x384视频！最强视频模型生态加速

🌹大家好！欢迎来到破狼公众号。感谢大家的支持与鼓励。在AIGC探索道路上，我将与你一路同行。喜欢就星标关注破狼公众号或文末扫码加入交流群！

DiffSynth Studio混元视频支持

今天介绍一款由魔搭社区开源项目DiffSynth Studio，它是一个扩散引擎，重新构建了包括文本编码器、UNet、VAE在内的架构，既保持了与开源社区模型的兼容性，又增强了计算性能。当前已支持最新开源腾讯混元视频支持。 DiffSynth Studio实现了对腾讯混元HunyuanVideo视频模型的高级显存管理，使其能够在24GB显存下无损质量的生成129x720x1280分辨率的视频，或者在极致显存情况下，6GB显存下生成129x512x384分辨率的视频。

当前DiffSynth Studio项目已支持：HunyuanVideo、CogVideoX、FLUX、Kolors、Stable Diffusion 3等共15种扩散模型运行。本文将重点关注腾讯混元视频模型的体验和使用。

• Github：https://github.com/modelscope/DiffSynth-Studio
• 项目文档：https://diffsynth-studio.readthedocs.io/zh-cn/latest/index.html

演示案例

项目提供了针对HunyuanVideo的推理代码，参见：https://github.com/modelscope/DiffSynth-Studio/tree/main/examples/HunyuanVideo

由hunyuanvideo_80G.py和hunyuanvideo_24G.py生成的视频：

使用hunyuanvideo_6G.py 和 行走LORA生成的视频：lora地址：https://civitai.com/models/1032126/walking-animation-hunyuan-video

使用hunyuanvideo_v2v_6G.py 和上例中LORA生成的V2V视频到视频：

更多混元视频模型的使用参见之前的文章：

DiffSynth Studio混元视频体验

首先需要下载和安装对应DiffSynth Studio源码，建议使用独立conda虚拟环境。

git clone https://github.com/modelscope/DiffSynth-Studio.git
cd DiffSynth-Studio
pip install -e .

# 推理代码
python examples/HunyuanVideo/hunyuanvideo_80G.py
python examples/HunyuanVideo/hunyuanvideo_24G.py
python examples/HunyuanVideo/hunyuanvideo_6G.py
python examples/HunyuanVideo/hunyuanvideo_v2v_6G.py

Flux文生图&混元视频工作流

最新LIBLIBAI平台已支持Flux文生图和混元视频ComfyUI工作流在线体验：

• F.1-绮梦流光-水湄凝香：

https://www.liblib.art/modelinfo/134c6dd95aef48e98a22b24e003e026b

• 文生图-Flux文生图(PuLID|LORA|Joy|SUPIR)工作流：

https://www.liblib.art/modelinfo/782aacd70f604da39e83368c696a02a8?versionUuid=9c5eceb01fb94d4d93d60fe2c0bd7468

• 文生视频-腾迅混元最强开源视频(LORA)工作流：

https://www.liblib.art/modelinfo/35ee21d5f6a94204abb767ad194ab9cd?versionUuid=be674032ffa14e5597a08922556f4da0

DiffSynth Studio混元视频体验

本代码还需本地部署运行，下面是核心改造代码。

# 仅需改造代码保持如下格式即可
# Enjoy!
prompt = f"文生视频提示词"
video = pipe(prompt, seed=0, height=512, width=384, num_frames=129, num_inference_steps=18, tile_size=(17, 16, 16), tile_stride=(12, 12, 12))
save_video(video,"video_girl-1.mp4", fps=30, quality=6)

01.行走动漫(6G加载)

kxsr, full body, no crop, A 3D-rendered CG animation video featuring a Gorgeous, mature, curvaceous, fair-skinned female girl with long silver hair and blue eyes. She wears a white t-shirt and a blue sports skirt, walking offering a sense of fluid movement and vivid animation.

LIBLIBAI混元视频体验

另外LIBLIBAI平台已支持混元视频在线体验，大约消耗300积分，进入主页点击运行按钮即可。体验入口：https://www.liblib.art/modelinfo/35ee21d5f6a94204abb767ad194ab9cd?versionUuid=be674032ffa14e5597a08922556f4da0

01.冬雪

A young Chinese woman, wearing a white down jacket and a white scarf, looks directly at the audience as she walks down the street in Harbin, watching the snow fall around her

02.图书馆

princess zelda sitting at a desk in a library with a stack of books and she’s texting on her iPhone

混元视频模型:关注公众号口令【混元视频模型】获取

• [ComfyUI]腾讯混元视频：官方极限优化8GB可运行！32G到8G极限优化，开源生态加速

• [ComfyUI]腾讯混元视频：强烈推荐！质量增强神器！Enhance-A-Video无性能和内存显著影响

• [ComfyUI]HelloMemeV2：表情迁移神器！直播数字人，更强保真和表情丰富的一致性迁移

• 腾讯混元视频：ComfyUI官方原生支持！GGUF量化低显存福音！开源生态高速发展

感兴趣加入[AGI技术交流群]+V

如果觉得文章不错，就请赞、在看与转发三连

破狼

关注AIGC、LLM、绘图作品、软件工程、技术学习。交流+V：shunshizhiwu。

[ComfyUI]混元图生视频：生态加速！Leapfusion新颖图生视频采样方法，仅需307M的LORA模型

[ComfyUI]FitDiT：高逼真和贴合度虚拟试穿，纹理和尺寸感知！单图1024x768推理仅4.57秒！附大批红包封面领取

ComfyUI Copilot：大模型加持工作流的生成和修复和在线运行！附6000红包封面领取

[ComfyUI]腾讯混元3D：2.0重大升级！先进的高分辨率的3D白膜和带纹理3D模型，最全本地ComfyUI部署指南

腾讯混元3D：2.0重大升级，完善3D生态产品和3D模型工作流

[ComfyUI]奈飞视频生成控制新方法，轻松掌控视频模型运动模式，Go-with-the-Flow与CogVideoX体验

[ComfyUI]英伟达Cosmos：图生视频世界模型，生成具有物理意识视频和物理智能世界状态而设计

英伟达Cosmos：世界基础模型ComfyUI官方支持，旨在生成具有物理意识的视频和物理AI开发的世界状态而设计

[ComfyUI]首块缓存：全方位模型推理加速神器。适用于黑森林Flux&腾讯混元视频&LTXV众多模型显著

[ComfyUI]最强腾讯开源混元视频炼丹炉已就绪，国漫经典李慕婉，一致性写真视频轻松批量直出

[ComfyUI]Flux：2025元旦快乐，新年心想事成！生肖蛇年之白蛇贺新年

混元视频极致显存管理6G可运行129帧512x384,24G无损129帧720x1280！Lib在线工作流体验

[ComfyUI]FlowEdit：图像局部编辑和风格转绘！无需反演&模型无关的洗图神器

[ComfyUI]腾讯混元视频：官方极限优化8GB可运行！32G到8G极限优化，开源生态加速

[ComfyUI]CLIPtion：仅需100MB内存！媲美Florence2高效轻量级图像标注模型

[ComfyUI]MMAudio：有声视频最后一公里！腾讯混元视频模型与多模态音频合成

[ComfyUI]HelloMemeV2：表情迁移神器！直播数字人，更强保真和表情丰富的一致性迁移

[ComfyUI]LTX-Video更新：增强视频质量和性能，内置STG和PAG更灵活！最快速高效的开源视频模型

[ComfyUI]Flux：圣诞主题皮肤！小红书照片最强网感时尚穿搭

[ComfyUI]FastVideo：混元官方点赞，6步8倍轻量级加速模型！腾讯混元视频模型一致性蒸馏技术

腾讯混元视频：ComfyUI官方原生支持！GGUF量化低显存福音！开源生态高速发展

[ComfyUI]MagicQuill：无需PS全功能P图编辑工具！8G可运行，最全避坑指南

[ComfyUI]如意：智驾企业下场搞开源视频模型！7B图生视频&首尾帧&任意宽高比&增强运动与相机控制

[ComfyUI]MEMO：让静止图片活起来！音唇同步&丰富且自然表情的对话视频生成技术

[ComfyUI]腾讯混元视频：运动镜头控制！行走动画LORA，最强开源视频可控性里程碑

[ComfyUI]OminiControl：Flux全能P图神器！乾坤大挪移&重绘&CN控制，极简全能控制器

[ComfyUI]腾讯混元视频：开源LORA生态来啦！视频人物一致性&运镜可控性里程碑，支持NSFW

[ComfyUI]ZenID：面部融合神器！揭秘基因遗传，提前预测你和她的下一代基因

ComfyUI原生精确多区域控制！官方最新LoRA和模型权重的遮罩和调度方法

腾讯混元视频:视频写真换脸,请合理使用！工作流一键视频写真,最强导演级&虚拟与现实完美融合开源视频模型

[ComfyUI]Flux：极致光影！F1复古胶片摄影写实，模拟胶片极致色彩&光影&颗粒感

[ComfyUI]Flux：MJ艺术风！基于黑森林F1的Midjourney风，光效&写实&建模&演示&特写镜头

Shuttle 3.1 Aesthetic：低显存福音！S3D升级写实提升，4步秒级出图可商用，ComfyUI体验

[ComfyUI]腾讯混元视频：v2v视频驱动，最强开源视频模型，影视级画质与导演级运镜，本地16G可体验

[ComfyUI]AWPortraitCN：更真实质感细腻！专门针对国人外貌和审美优化F1模型

[ComfyUI]腾讯混元视频：虚实完美融合创意无极限！130亿大杯&影视级画质&导演级运镜&原生切镜&遵循物理运动&连续动作

DistyFlow：与众不同的工作流体验！降低入门难度，快捷高效全新体验，不容错过高效利器

[ComfyUI]Flux：国潮经典！敦煌古韵与现代极简国潮插画，敦煌风十二生肖和邮票集锦

[ComfyUI]CATVTON-Flux:电商虚拟换衣！基于黑森林F1重绘和阿里In Context LORA电商服装一致性

写实效果炸裂！疑似AI概率最低仅1%，轻松通过AI检测适用小红书日常写实模型，无缝接入ComfyUI自动化设计流程

[ComfyUI]RecraftAI：霸榜&比F1更真实的小红书写实风格模型！小熊猫无缝接入工作流自动化设计流程

IC-Light V2-Vary：打光模型重大升级，具有更强的光照变化，适用商用产品&摄影打光

ComfyUI桌面发布和开源，汉化共享等技巧，逐步完善win&mac多平台体验

[ComfyUI]SD3.5：ControlNet重磅发布！激烈竞争能否夺回黑森林Flux高地？

Lumiere：细节真实！专注更真实保持无损原生提示遵循和构图模型

[ComfyUI]Flux-IPA：效果惊艳！IPA基于10M数据F1专属风格迁移！补齐黑森林遗憾和空缺

[ComfyUI]LTXV：超高效视频模型！仅需4秒生成5秒24帧高质量视频，运动一致性且消除物体变形

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉