模型简介
从图到生,创新技术驱动“智变”
Casual VAE 模块:
负责视频数据的压缩与解压,将空间分辨率压缩至 1/8,时间分辨率压缩至 1/4。 使用 bf16 表示每个像素点,确保数据处理的高效性和精度。
采用 3D 全注意力 技术,结合 2D RoPE(归一化相对位置编码)和 sin_cos(正余弦位置编码)进行空间与时间的精准建模。 训练过程中应用 DDPM(去噪扩散概率模型),实现从图像到视频的高质量生成。
一键生成创意视频
分辨率与时长灵活调整
支持从 384x384 到 1024x1024 的多分辨率,任意长宽比,生成最长 120 帧(约 5 秒)的视频。
模型下载
OpenCSG社区:https://opencsg.com/models/IamCreateAI/Ruyi-Mini-7B
欢迎加入OpenCSG社区
•贡献代码,与我们一同共建更好的OpenCSG
•Github主页
欢迎🌟:https://github.com/OpenCSGs
•Huggingface主页
欢迎下载:https://huggingface.co/opencsg
•加入我们的用户交流群,分享经验
扫描上方二维码添加小助手
“ 关于OpenCSG