RTX 4090可运行，已完全开源，史上最快视频生成模型问世！

科技 2024-11-27 13:00 广东

来源：机器之心

押注开源人工智能视频的初创公司 Lightricks，有了重大动作。

该公司推出了最快的视频生成模型 LTX-Video，它是首个可以实时生成高质量视频的 DiT 视频生成模型。

在一块 Nvidia H100 上，LTX-Video 只需要 4 秒就能生成 5 秒时长的 24FPS 视频，分辨率 768x512，可以说视频生成速度比视频观看速度还要快。同时 LTX-Video 完全开源，包括代码库和模型权重。

LTX-Video共同作者和负责人。

「有史以来最快的文生视频模型诞生了。」

首先来看几个视频生成官方 Demo。

目前，用户可以在 GitHub Hugging Face 上体验预览版 LTX Video。完整版发布之后将免费供个人和商业使用，并即将集成到 LTX Studio 中。

项目地址：https://github.com/Lightricks/LTX-Video

我们尝试生成了两个视频，比如「a dog chasing a boy who is skateboarding」。

再比如「a girl with an umbrella standing on a bridge, and a handsome man walking towards her」。

试用地址：https://huggingface.co/spaces/akhaliq/anychat

接着来了解一下 LTX-Video 的细节。

LTX Video 是一个文本到视频和图像到视频模型，能够以惊人的速度和精度实时创建动态视频。该模型可以在 RTX 4090 等消费级 GPU 上本地运行，无需专用设备即可以低成本地生成高质量视频。

另外，LTX Video 基于开发人员的反馈和真实世界用例构建，可以提供自然逼真的结果。该模型做了高级定制化设计，可以流畅地集成各种外部工具，从而轻松地增强工作流。

在生成过程中，LTX Video 最大程度减少了闪烁和伪影，创建出具有出色细节和清晰度的高保真视频。每一帧都在精心制作下呈现清晰锐利、栩栩如生，符合用户的视觉效果。

最后，LTX Video 实现了无缝的跨帧一致性，从角色到环境，可以保持连贯的视觉效果，将每个细节整合在一起。

未来，LTX-Video 还会有技术报告放出。

推荐阅读

欢迎大家加入DLer-计算机视觉技术交流群！

大家好，群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享，主要方向有：图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注：研究方向+学校/公司+昵称（如图像分类+上交+小明）
👆 长按识别，邀请您进群！

http://mp.weixin.qq.com/s?__biz=MzU2NDExMzE5Nw==&mid=2247546061&idx=2&sn=9d37181d93e4307c1f30b9ca78788cad

深度学习技术前沿

本公众号专注于深度学习领域的前沿技术分享和学术交流。推送有关于机器学习、深度学习、强化学习、计算机视觉、自然语言处理等领域干货文章，致力于在第一时间内汇集和发布最新人工智能技术和前沿资讯。

最新文章

12万人面临降薪！国际巨头内部大动荡。。。

RTX 4090可运行，已完全开源，史上最快视频生成模型问世！

一位阿里P9的年薪和家庭资产

黄仁勋与沈向洋院士对谈GPU算力、机器人和爱情

AI顶会AAAI收了一篇论文：没算法没实验，全靠idea思路好...

打破纪录！中国科学家让薛定谔的猫活了23分钟

硅谷最神秘的「黑手党」纷纷出走创业，融资近百亿！足以改变整个AI格局的革命

CV大神，MIT何恺明教授最新课程资料！

六院院士！又一顶尖学者归国，全职加盟清华大学

Scaling Law或将终结？哈佛MIT预警：低精度量化已无路可走。。。

国际巨头，AMD宣布全球裁员4%！

大模型推理加速技术的学习路线是什么?

吴恩达：大模型的下一个热门方向

3名高中生杀出重围，论文已被顶会 NeurIPS 2024录用

香港城市大学招机器学习 /大语言模型方向全奖博士

教授含泪惜别“双一流”高校：教学，影响了我原创性科研成果的产出

谷歌2024博士奖学金名单揭晓！清华姚班大神、KAN一作大佬入选

被美国“制裁”的中国大学名单。。。

美国司法部勒令谷歌出售 Chrome

耽误业界好多年？ Karpathy：现在回想，真的后悔极了。。。。

校长书记双院士！教育部副部长，任C9党委书记

WHALE来了，南大周志华团队最新成果发布！下一个世界模型？

又一985，落地深圳！

马斯克招人策略曝光：需进行9轮面试，低底薪+股票奖励

中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文

最新版《神经网络和深度学习》中文版.pdf

Make U-Nets Great Again！北大&华为强强联合

ETH官宣制裁中国学生，国防七子等高校均在名单内。。。

清华大学获X-Embodiment最佳论文奖，机器人顶会CoRL 2024

被导师放养，后果可能很严重。。。

50s完成7B模型量化，放大招，4bit直接达到 SOTA

MIT教授，何恺明大神最新课程资料下载！

高校不给教授们涨工资了，开始裁员计划？

一个模型走天下！智源提出全新扩散架构OmniGen

2025QS亚洲大学排名出炉，197所中国高校上榜！

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

武汉大学：新增8位“国家杰青”！创历史新高

特朗普回归，硅谷科技圈大变！埃隆·马斯克身价突破3000亿

突发！OpenAI七年元老、安全副总裁Lilian Weng官宣离职！北大本科

俄罗斯对谷歌开出天价罚单！远超全球GDP总和

又一院士被“除名”！院士终生制，没了？

投资21.7亿！C9新校区

深圳一家公司造出世界上最酷机器人，卖2-3万美元

涨点神器！100个即插即用注意力模块

90后上海女生，成美国数学大奖首位女性华人得主！

TPAMI 2024｜解耦图神经网络，效果惊艳！

翁荔：掌管OpenAI安全的神

国内外有哪些不错的计算机视觉研究团队或实验室？

10秒创造一个世界！吴佳俊大神最新研究成果，比现有技术快100倍

诺奖得主，受聘西湖大学！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉