本文一共测试了新清影视频生成模型在8个内容品类下的用例。在画面质量,新清影模型擅长生成“环境描述类镜头”,对自然语言的理解上有明显的提升,某些场景下的内容几乎可以以假乱真。 本文还测试了音效模型在8种不同内容视频下的用例,CogSound能够精准识别并生成与不同场景相匹配的音效,为视觉效果增添深度与真实感,可以广泛应用于广告、新闻等多个领域。 智谱的多模态大模型矩阵显著提升了画质、动作连贯性和语义理解,支持4K分辨率,音效生成功能即将上线,可以预见未来AI将在影视、游戏等领域得到广泛应用,显著降低内容创作门槛,助力创作者实现更高效的创意表达。
模型能力全面提升:新清影在图像质量、美学表现、运动合理性以及复杂提示词语义理解方面能力显著增强;更强的人物面部、表演细节、动作连贯性和物理特性模拟,提高了视频的自然度和逼真度。 4K超高清分辨率:新清影支持生成 10s、4K、60 帧超高清视频,视觉体验拉到极致,动态画面更加流畅。 可变比例:新清影支持任意比例的图像生成视频,超宽画幅也能轻松 Hold 住。 多通道生成能力:同一指令图片可以一次性生成 4个视频。 带声效的AI视频:新清影可以生成与画面匹配的音效了。音效功能将很快在本月上线公测。