[ComfyUI]奈飞视频生成控制新方法,轻松掌控视频模型运动模式,Go-with-the-Flow与CogVideoX体验

科技   2025-01-21 07:53   浙江  

模型 

[ComfyUI]奈飞视频生成控制新方法,轻松掌控视频模型运动模式,CogVideoX运动体验

Go-with-the-Flow简介

今天文章主题将介绍一款由奈飞提出的一个新的视频生成控制方式Go-with-the-Flow。这是一种简单高效的视频生成控制方法,可以被用于控制视频扩散模型中的运动模式。Go-with-the-Flow允许用户决定场景中镜头和物体的运动方式,甚至可以将一个视频的运动模式转移到另一个视频上

Go-with-the-Flow方法只需对基础模型进行微调,而无需对原始管道或架构进行任何更改,除了使用扭曲噪声(warped noise)代替纯独立同分布的高斯噪声(Gaussian noise)。推理的计算成本与运行基础模型完全相同,不会增加其他额外的性能影响。该方法既可以运用于图像到视频(Image-to-Video, I2V)模型,同时还可以应用于文本到视频(Text-to-Video, T2V)模型,仅通过运动信息就能推导出3D场景。

  • • Github:https://github.com/VGenAI-Netflix-Eyeline-Research/Go-with-the-Flow

  • • 项目主页:https://vgenai-netflix-eyeline-research.github.io/Go-with-the-Flow/

Cut-and-drag Motion Control

Go-with-the-Flow方法采用剪切和拖动方式运动控制( Cut-and-drag Motion Control)。剪切和拖动运动控制允许用户从一张图片开始,通过剪切图片的不同部分并将它们拖动到其他位置来创建视频。对于剪切拖动运动控制,分为两部分:

  • • 一个创建粗略动画(无需GPU);

  • • 另一个则是将这个粗略动画转化为精美的视频(需要GPU)的扩散脚本。

Go-with-the-Flow方法ComfyUI体验

@kijai大佬已经在最新的ComfyUI-CogVideoXWrapper插件中支持Go-with-the-Flow体验。模型可文末网盘下载。

  • • ComfyUI-CogVideoXWrapper插件:https://github.com/kijai/ComfyUI-CogVideoXWrapper

  • • ComfyUI-KJNodes:需要更新插件KJNodes,新增了创建NoiseWarp流程节点,配合SplineEditor使用。插件地址:https://github.com/kijai/ComfyUI-KJNodes

  • • ComfyUI-VideoNoiseWarp:还需安装新插件ComfyUI-VideoNoiseWarp。插件地址:https://github.com/kijai/ComfyUI-VideoNoiseWarp

  • • comfyui-inpaint-nodes:还需要结合comfyui-inpaint-nodescv2修复功能来生成剪切和拖动的输入视频。

  • • big-lama.pt:需要下载该模型,并放置目录/ComfyUI/models/inpaint下载地址:https://huggingface.co/spaces/aryadytm/remove-photo-object/blob/f00f2d12ada635f5f30f18ed74200ea89dd26631/assets/big-lama.pt

  • • Go-with-the-Flow LORA下载:另外还需要下载对应LORA模型。下载地址:https://huggingface.co/VGenAI-Netflix-Eyeline-Research/Go-with-the-Flow/tree/main

  • • Kijai/CogVideoX-5b-1.5模型模型会自动下载,如需手动下载模型,则需要下载整个项目全部文件,并放置ComfyUI/models/CogVideo。下载地址:https://huggingface.co/THUDM/CogVideoX1.5-5B-I2V/tree/main

  • • 关于CogVideoX模型安装请参考文章:智谱CogVideoX1.5:重大升级,可商用开源模型!10秒&增强质量&任意分辨率,ComfyUI无缝体验[ComfyUI]Flux&CogVideoX5B开源AI视频重大里程碑,附文|图|续写视频精彩案例

Flux文生图&混元视频工作流

最新LIBLIBAI平台已支持Flux文生图混元视频ComfyUI工作流在线体验:

• F.1-绮梦流光-水湄凝香

https://www.liblib.art/modelinfo/134c6dd95aef48e98a22b24e003e026b

• 文生图-Flux文生图(PuLID|LORA|Joy|SUPIR)工作流

https://www.liblib.art/modelinfo/782aacd70f604da39e83368c696a02a8?versionUuid=9c5eceb01fb94d4d93d60fe2c0bd7468

• 文生视频-腾迅混元最强开源视频(LORA)工作流

https://www.liblib.art/modelinfo/35ee21d5f6a94204abb767ad194ab9cd?versionUuid=be674032ffa14e5597a08922556f4da0


CogVideoX Go-with-the-Flow工作流

CogVideoX Go-with-the-Flow工作流已上传LIBLIBAI平台可体验:https://www.liblib.art/modelinfo/da508657610d407795297f92b992ce63?versionUuid=97ac648ac38f4c46aefe5d883ba0c4d3

注意

  • • 注意CogVideoX视频生需要保持720*480分辨率,针对输入图像需要限制,否则容易变形。
  • Go-with-the-Flow在镜头可控性表现力比较强,能够更大的控制视频运镜移动。有时在边缘处理存在少量不和谐表现。这依赖于修复模型的边缘修复精度和准确性

01.老鼠骑士

mouse knight walking in a forest

02.沙滩摩托车

A woman rides a motorbike along the beach

CogVideoX模型:关注公众号口令【CogVideoX模型】下获取
更多推荐文章:
• [ComfyUI]英伟达Cosmos:图生视频世界模型,生成具有物理意识视频和物理智能世界状态而设计
• 英伟达Cosmos:世界基础模型ComfyUI官方支持,旨在生成具有物理意识的视频和物理AI开发
• [ComfyUI]首块缓存:全方位模型推理加速神器。适用于黑森林Flux&腾讯混元视频&LTXV
• [ComfyUI]最强腾讯开源混元视频炼丹炉已就绪,国漫经典李慕婉,一致性写真视频轻松批量直出
• [ComfyUI]腾讯混元视频:官方极限优化8GB可运行!32G到8G极限优化,开源生态加速
• [ComfyUI]Flux:2025元旦快乐,新年心想事成!生肖蛇年之白蛇贺新年
感兴趣加入[AGI技术交流群]+V

    如果觉得文章不错,就请在看转发三连

破狼
关注AIGC、LLM、绘图作品、软件工程、技术学习。交流+V:shunshizhiwu。
 最新文章