最强开源文生视频！腾讯混元 HunyuanVideo对外开放并全面开源

科技 2024-12-03 20:15 广东

SmartFlowAI

点击上方蓝字关注我们

作者：羰汤羰
全文约 830 字，预计阅读时间 4 分钟

Github 链接：https://github.com/Tencent/HunyuanVideo

官方链接：https://aivideo.hunyuan.tencent.com/

简介

HunyuanVideo 是由腾讯开源的一个用于大规模视频生成模型训练的系统框架。该项目包含 PyTorch 模型定义、预训练权重和推理/采样代码。

GitHub 链接^[1]

什么是 HunyuanVideo？

HunyuanVideo 是一个开源的视频基础模型，其视频生成性能可媲美甚至优于领先的闭源模型。HunyuanVideo 具有一个综合框架，集成了数据整理、图像-视频联合模型训练和高效的支撑基础设施，旨在促进大规模模型训练和推理。

主要特性

统一的图像和视频生成架构：采用 Transformer 设计，并使用全注意力机制进行统一的图像和视频生成。

MLLM 文本编码器：使用预训练的多模态大型语言模型 (MLLM) 作为文本编码器，具有更好的图像-文本对齐和复杂推理能力。

3D VAE：使用 CausalConv3D 压缩像素空间中的视频和图像，将其压缩到紧凑的潜在空间。

Prompt Rewrite：为了解决用户输入文本提示的多样性和不一致性的困难，采用微调后的 Hunyuan-Large 模型对用户输入的提示词进行改写，以增强对用户意图的理解（正常模式）和增强诸如构图、光照和摄像机移动等方面的描述（大师模式）

性能评估

通过大量实验和一系列有针对性的设计，HunyuanVideo 在视觉质量、运动多样性、文本-视频对齐和生成稳定性方面均表现出色。在专业人工评估结果中，HunyuanVideo 比以往最先进的模型（如 Runway Gen-3、Luma 1.6 和 3 个表现最好的中文视频生成模型）表现得更好。

下载和使用

HunyuanVideo 的 Github 仓库提供了详细的安装指南和依赖项，并支持多种配置选项。您可以从 GitHub 下载预训练模型，并使用命令行进行推理。

下表列出了运行 HunyuanVideo 模型使用文本生成视频的推荐配置（batch size = 1）：

本项目适用于使用 NVIDIA GPU 和支持 CUDA 的设备

本项目在单张 H800/H20 GPU 上进行了测试
运行 720px1280px129f 的最小显存要求是 60GB，544px960px129f 的最小显存要求是 45GB。

测试操作系统：Linux

总结

HunyuanVideo 是一个功能强大的视频生成模型，为开源社区提供了一种高效、易用的工具。通过开源代码和权重，HunyuanVideo 有助于缩小闭源和开源视频基础模型之间的差距，促进视频生成生态系统的进一步发展，相信它将为更多研究者和应用开发者带来便利。

参考资料

[1]

GitHub 链接: https://github.com/Tencent/HunyuanVideo

往期 · 推荐

使用大语言模型进行自动且多功能的评估

上海AI实验室版o1已上线！数学竞赛题、Leetcode赛题全拿下，还会玩24点

LiveBench: 一个具有挑战性且无污染的 LLM 评测基准

o1圈的新王！阿里QwQ-32B开源

🌠 番外：我们期待与读者共同探讨如何在 AI 的辅助下，更好地发挥人类的潜力，以及如何培养和维持那些 AI 难以取代的核心技能。通过深入分析和实践，我们可以更清晰地认识到 AI 的辅助作用，并在 AI 时代下找到人类的独特价值和发展空间。“机智流”公众号后台聊天框回复“cc”，加入机智流大模型交流群！

一起“点赞”三连，点击“阅读原文”访问官网👇

机智流

共赴 AI 时代浪潮~

最新文章

Qwen开源视觉推理模型QVQ，更睿智地看世界！

聊聊大模型推理系统之 Sarathi

英特尔新款游戏显卡卖爆！24G大显存版也在路上，这下AI玩家也要抢？

又媲美 ChatGPT!? Qwen2.5 技术报告详解

回顾OpenAI系列发布会，对未来 AI 行业走向存在哪些潜在影响

HF Weekly01: Qwen2.5 tech report领衔

o3发布，OpenAI提出全新对齐范式，通过SFT和RL直接教会LLM结合安全策略进行CoT复杂推理

速报：OpenAI o3发布｜阿里Qwen2.5开源并发布技术报告

OpenAI o3震撼觉醒，AGI今夜降临？血洗o1，破解陶哲轩最难数学题

Late Chunking×Milvus：如何提高RAG准确率

GitHub Copilot推出免费订阅｜豆包推出视觉理解模型，千tokens仅3厘｜Meta和斯坦福大学合作推出多模态模型

谷歌版o1突发即屠榜！思考速度比所有模型快5倍，能解摩斯代码，数学物理秒秒钟解决

苹果Mac用户狂喜！ChatGPT深度集成应用，最后再藏AGI彩蛋

GPT-4o数学能力跑分直掉50%，上海AI Lab开始给大模型重新出题了

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

宇树机器人强化学习代码全面开源，还有训练到仿真和实操手把手教学

OpenAI 年底「百亿补贴」来了，满血 o1 API 开放，成本暴跌，定制升级

聊聊大模型推理系统之 vLLM：PagedAttention 助力内存管理

Datawhale x 机智流 “AI+硬件”开源教程共建项目来啦！

AI周报：快手联合浙大、清华推出多视角视频生成模型 | ChatGPT Projects上线 | 微软推出的14B参数小语言模型

OpenAI重磅推出ChatGPT Projects功能，让ChatGPT更容易管理！网友：这是几日来最有用的发布

「AI定义汽车」新拐点已至！小米孟二利：我们有三个工作需要做好 | MEET 2025

OpenAI版“Her”正式上线，GPT能实时视频通话+屏幕共享了！德扑AI之父：比 o1“更受宠”的模式降临

吴恩达DeepLearning.AI课程系列 - 大模型检索增强生成（五）：问题回复

周中报：全球首个“AI 程序员”Devin全面开放|谷歌Gemini2发布，全面狙击o1模型|苹果智能正式集成ChatGPT

OpenAI高调“暗示”AGI产品发布？苹果三系统正式集成ChatGPT：iPhone16一键启动多模态

具身智能机器人的行业画像

AI周报：英伟达因涉嫌垄断被立案调查 | OpenAI正式发布Sora | Meta Google 各自发布新模型

突破闭源封锁！InternVL 2.5 革新开源多模态模型格局？

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术报告，端到端VLA模型驱动，唱跳都能陪你玩

聊聊大模型推理系统之 Orca：大模型推理系统开山之作

OpenAI的强化微调：RL+Science 创造新神还是灭霸？

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI圣诞推出惊喜、商业策略却惹争议，谷歌Genie 2单图即可生成3D游戏世界，亚马逊Nova以超快输出惊艳亮相

2024 AI 产品经理大会，这个周末，不见不散～

OpenAI的第一份礼：ChatGPT Pro和o1 Pro mode，但我们真的需要吗

以通专融合方式构建AGI——路径与关键问题探索｜CNCC2024

10万元奖金池！第三届生成式 AI 应用创新挑战赛来啦！

具身智能的数据采集主流路径

AI周报：腾讯开源目前最强视频生成大模型 | 李飞飞 WorldLabs 发布革命性的单图3D场景生成技术

北大字节VAR获最佳论文、厦大清华获亚军，NeurIPS 2024最佳论文出炉

最强开源文生视频！腾讯混元 HunyuanVideo对外开放并全面开源

大模型迎拐点时刻？中国生成式AI大会上海站最终议程公布，50+重磅嘉宾集聚畅谈

10万元奖金池！第三届生成式 AI 应用创新挑战赛来啦！

ICLR 惊现[10,10,10,10]满分论文，ControlNet 作者新作，Github 5.8k 颗星

Kimi悄悄开源了自家推理框架Mooncake~

大模型迎拐点时刻？中国生成式AI大会上海站最终议程公布，50+重磅嘉宾集聚畅谈

使用大语言模型进行自动且多功能的评估

速报：O1模型扎堆发布的一周

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉