具体体现为:
模型能力全面提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力明显增强。
4K超高清分辨率:支持生成 10s、4K、60 帧超高清视频,视觉体验拉到极致,动态画面更加流畅。
可变比例:支持任意比例的图像生成视频,超宽画幅也能轻松 Hold 住,从而适应不同的播放需求。
多通道生成能力:同一指令/图片可以一次性生成 4 个视频。
带声效的AI视频:新清影可以生成与画面匹配的音效了。音效功能将很快在本月上线公测。
开源地址:https://github.com/thudm/cogvideo
视频生成——CogVideoX 音效生成——CogSound 人物旁白——GLM-4-Voice