2B参数搞定高质量视频！北大&快手携手打造Pyramid Flow

2024-10-12 13:48 北京

前沿科技速递🚀

近日，北京大学、快手和北京邮电大学联合推出了Pyramid Flow，一个全新的开源视频生成模型，为视频创作者带来了高效生成高质量短视频的革命性工具。作为一种基于流匹配算法的自回归视频生成模型，Pyramid Flow不仅在性能上表现出色，还大幅降低了训练成本，推动了AI视频生成技术的进一步民用化。

来源：传神社区

01 模型简介

Pyramid Flow的设计注重简洁与高效，它通过金字塔流匹配算法与自回归生成机制，减少了传统视频生成模型中的计算冗余，核心特点包括：

仅2B参数：模型采用极简参数配置，仅需2B（20亿）参数即可生成高质量的10秒视频。
单一Diffusion Transformer：不同于传统多模型架构，Pyramid Flow使用单一的Diffusion Transformer（DiT）进行统一的端到端训练，避免了多阶段模型的独立优化问题。
空间与时间金字塔结合：通过将视频生成过程划分为空间和时间金字塔，模型在低分辨率上处理早期步骤，并在最后阶段生成高分辨率的结果，大幅提高训练效率。

这一设计保证了模型的简洁性和扩展性，不仅减少了训练时间，还能生成分辨率高达768p的流畅视频，完美平衡了模型性能与计算资源的需求。

02 技术亮点

高效的自回归生成：Pyramid Flow采用了自回归生成方式，即基于前一帧生成后一帧。这种方式能够保证视频内容的时间一致性，使生成的视频流畅自然，并且支持灵活长度的视频生成。
金字塔流匹配算法：该模型的核心创新在于通过金字塔式的流匹配算法来减少冗余计算。视频生成的早期步骤在较低分辨率上进行，而只有最后阶段才使用全分辨率。这种方法显著减少了训练过程中需要处理的数据量和计算量。
多功能性：Pyramid Flow不仅支持从文本到视频的生成，还能够将静态图像转换为动态视频（图像到视频）。这一功能为创作者提供了更多创作自由，能够通过简单的文本提示实现复杂的视觉创意。
训练效率的提升：与传统的视频生成模型相比，Pyramid Flow的训练效率有了显著提高。其统一的流匹配目标将不同分辨率的金字塔阶段整合到一个模型中，实现了更快的训练速度和更优的生成效果。

03 卓越性能

在实验中，Pyramid Flow不仅在生成质量上表现出色，还大大提高了训练效率。通过在VBench和EvalCrafter等基准测试中进行评估，Pyramid Flow的表现优于多种基于公共数据训练的视频生成模型，尤其在视频的流畅度和质量评分上处于领先地位。例如，Pyramid Flow在VBench的质量评分为84.74，超过了许多商业竞争对手。

04 实例展示

Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls

Extreme close-up of chicken and green pepper kebabs grilling on a barbeque with flames. Shallow focus and light smoke. vivid colours

A drone camera circles around a beautiful historic church built on a rocky outcropping along the Amalfi Coast, the view showcases historic and magnificent architectural details and tiered pathways and patios

05 模型下载

传神社区：

https://opencsg.com/models/rain1011/pyramid-flow-sd3

huggingface：

https://huggingface.co/rain1011/pyramid-flow-sd3

欢迎加入传神社区

•贡献代码，与我们一同共建更好的OpenCSG

•Github主页

欢迎🌟：https://github.com/OpenCSGs

•Huggingface主页

欢迎下载:https://huggingface.co/opencsg

•加入我们的用户交流群，分享经验

扫描上方二维码添加传神小助手

“ 关于OpenCSG

开放传神（OpenCSG）成立于2023年，是一家致力于大模型生态社区建设，汇集人工智能行业上下游企业链共同为大模型在垂直行业的应用提供解决方案和工具平台的公司。

关注OpenCSG

加入传神社区

http://mp.weixin.qq.com/s?__biz=MzkxNTYxMjU1Mw==&mid=2247486935&idx=1&sn=2dd0a69ff6511f3c1390cbb2e2f43024

传神社区

该账号是开放传神（OpenCSG）分享大模型的技术、见解、传神开放社区等方面的内容！

最新文章

OpenCoder：开源代码大模型，推动编程AI的未来

CodeSouler v1.11.0 版本更新

倒计时2天！大模型全生命周期管理与AI应用的全栈可观测性圆桌议题公布

CSGHub All-in-One Docker 快速部署

重磅揭秘！Auto CSGHub内测视频曝光 | 国产版 HuggingFace+ 引领智能化升级

算力补贴累计超亿元！模速空间“浓缩”上海大模型产业链

报名开始｜《大模型全生命周期管理与AI应用的全栈可观测性》上海站

微软OmniParser：一切皆文档，OCR驱动智能操作

从文本到动态视频：Allegro模型让创意更轻松

传神论文中心｜第30期人工智能领域论文推荐

超快速，高性能！Meta发布移动端MobileLLM

DataFlow v202410 版本更新一站式数据处理平台

OpenCSG与传神社区的创新瞬间

OpenCSG传神社区月度功能更新

突破语言壁垒：Cohere 发布多语言大模型 Aya Expanse

Stable Diffusion 3.5震撼发布：三大版本满足多层次AI图像生成需求

OpenCSG携手书生·浦语：InternLM2.5-20B-Chat 正式上线，共建AI未来新生态

课程升级、资源加码！万人共学的书生大模型实战营第4期正式起航！

无需依赖闭源模型！司南CompassJudger为AI评测带来新选择

CSGHub SaaS快速入门指南

Mochi 1视频生成模型亮相：动作流畅，开放源代码

课程升级、资源加码！万人共学的书生大模型实战营第4期正式起航！

传神论文中心｜第29期人工智能领域论文推荐

重磅升级 | OpenCSG开源中文版fineweb edu v2数据集

英伟达推出Nemotron-70B：强大开源语言模型，基准测试中全面领先！

直播预告｜未来视界：多模态AI的创新与挑战

苹果开源Depth Pro：0.3秒实现从2D图像到3D深度图的革命性突破

传神论文中心｜第28期人工智能领域论文推荐

2B参数搞定高质量视频！北大&快手携手打造Pyramid Flow

直播预告｜当A股疯涨挑战经典金额理论，大模型能否作为一个“理性投资人”？

CodeSouler v1.0.8 版本更新

传神论文中心｜第27期人工智能领域论文推荐

OpenCSG传神社区月度功能更新

OpenCSG开源数据集再次登顶HF数据榜

OpenCSG DataFlow：锻造大模型智慧的炼金术，开启数据集Agentic新范式

微软推出GRIN-MoE：开创专家路由新范式

Llama 3.2：轻量级设计与多模态能力

英伟达发布NVLM 1.0：屠榜多模态任务，纯文本性能逆势提升

高效、精准、智能：GOT-OCR2.0引领OCR 2.0时代

传神论文中心｜第26期人工智能领域论文推荐

超越极限！Qwen2.5 助力多领域智能应用

年度巨献 | OpenCSG开源最大中文合成数据集Chinese Cosmopedia

CSGHub开源版本v0.9.0更新

传神论文中心｜第25期人工智能领域论文推荐

Mistral AI再创新高，Pixtral 12B多模态模型强势来袭

CodeSouler v1.0.7 版本更新

重磅发布！DeepSeek-V2.5：融合通用与代码能力的全新开源模型

小而强大！零一万物 Yi-Coder 模型震撼发布！

国产“小钢炮”MiniCPM3-4B：小参数，大能量！

国内独家首发 | OpenCSG开源中文版fineweb edu数据集

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉