今天在上海参加一个AI动画与视频创作的论坛,讲了一些我们团队对AI创作的表现力、可控性之间关系的理解(也非常欣慰地看到国际顶级的AI电影创作者在罗列AI动画和视频工具时提到了我们的Mootion工具)。这里分享一下我今天讲的主要观点:
AI 算法在根本上仍是一种基于统计的机器学习
AI 算法的核心能力仍是对海量信息/知识的压缩
对物理世界的理解是海量信息/知识压缩 后“涌现”出来的结果,而不是原因
生成式 AI 短期内无法像人类创作者那样 独立完成逻辑复杂,整体与细节质量均高度可控的内容创作
在真正的 AGI 出现之前,人类创作者对“可控性/表现力”的要求,总会远远超前于 AI 基础模型所直接提供的生成能力
Sora First Impressions 视频中,可以清楚看到,创作者在每个镜头之间,很难控制主角衣服颜色、样式的一致性(连续镜头中,裤子的款式和颜色一直在改变)。为了迁就AI生成内容不一致的问题,创作者不得不采用多使用局部特写,人工后期等手段来规避。
大多数 AI 艺术家目前的创作逻辑:
规避 AI 不易精准控制的问题
尽量围绕 AI 擅⻓的素材构思整体创意
人类的艺术设想有时会让位于 AI 的可控性限制
今天生成式 AI 擅⻓的:
Surreal(超现实)内容
启发式拍摄(概念内容生成)
候选素材或片段的快速生成
模仿人类创作者的⻛格化
今天人类擅⻓的:
对完整作品(故事)的逻辑控制
把控艺术方向、美学设计
制定和执行自顶向下的控制策略,对控制方式、算法的优化选择
对 AI 素材或片段的评估、遴选
目前,高质量AI创作的主流是专业艺术家提供整体流程设计、目标设计、控制方法设计,AI只负责生成素材、片段。未来,可控性能否通过带有自反馈功能的多智能体系统,提供自我生成、自我监督、自我评估、自我筛选、自我整合的能力,就像人类拍摄电影时的大分工一样?我们认为,这会是AI逐渐摆脱人类指导,更独立地完成故事、广告、影片创作的一条技术道路。
这条道路的终极目标会非常诱人:未来每个人都可以成为大导演、大制片人!在UGC内容平台上,每个人不仅可以用手机拍摄、记录日常生活,还可以创作具备相当艺术表现力的故事大片!