NOVA:一种无需矢量量化的新型视频自回归模型

文摘   2025-01-08 07:45   福建  

NOVA是一种新型的非量化自回归视频生成模型,旨在解决现有模型在视频生成中的效率和灵活性问题。该模型通过时间和空间的分离预测,结合预训练的语言模型和光流跟踪,实现了高效的视频生成,显著提升了图像和视频的质量,并在多个基准测试中超越了现有的自回归和扩散模型。

参考:

  1. https://arxiv.org/abs/2412.14169v1
  2. https://github.com/baaivision/nova



点个享、点赞在看,你最好看~


Halo咯咯
专注于技术知识整理,包含人工智能、大模型、机器学习、深度学习、大数据等多个领域的技术知识,以及各种开源的内容~
 最新文章