NOVA是一种新型的非量化自回归视频生成模型,旨在解决现有模型在视频生成中的效率和灵活性问题。该模型通过时间和空间的分离预测,结合预训练的语言模型和光流跟踪,实现了高效的视频生成,显著提升了图像和视频的质量,并在多个基准测试中超越了现有的自回归和扩散模型。
参考:
https://arxiv.org/abs/2412.14169v1 https://github.com/baaivision/nova
点个分享、点赞与在看,你最好看~
NOVA是一种新型的非量化自回归视频生成模型,旨在解决现有模型在视频生成中的效率和灵活性问题。该模型通过时间和空间的分离预测,结合预训练的语言模型和光流跟踪,实现了高效的视频生成,显著提升了图像和视频的质量,并在多个基准测试中超越了现有的自回归和扩散模型。
参考:
点个分享、点赞与在看,你最好看~