本期导读
当前,媒体融合进程持续深化,视听文化发展格局重构优化,高品质、智能化、沉浸式、多元化、融合化已成为影视技术发展的共性特征。智能经济与智能社会是经济与社会发展演进的基本趋势和必然要求,伴随大语言模型、多模态模型、深度学习、具身智能等现代智能科技的发展演进及广泛应用,人类社会加快步入智能计算时代。适应媒体深度融合趋势和智能计算时代特征,电影产业应积极融合应用新一代信息通信技术、现代智能科技和新兴视听技术,将全产业链信息化云化智能化升级作为战略支撑,创新升级电影摄制手段和播映方式,大力推进电影科技自主创新和自立自强,为观众提供更具高品质、科技感和沉浸感的电影作品和观影体验,努力构建新型视听文化业态和产业发展新赛道,推动电影全产业链全价值链提质优化升级。本期专栏特别刊登《智能计算时代深化电影科技创新和推进电影强国建设的思考与启示》一文,立足进一步全面深化改革、推进中国式现代化国家战略,提出了兼具思想高度、理论深度和创新思维的思考启示与发展建议;同时遴选有意义人类控制与AI影视创作、基于人工智能的音乐生成、数字人技术与大模型的融合创新、基于色彩迁移的数字调色方法、基于AI的影视版权保护等技术论文,从行业技术整体发展升级、音视频智能制作、模型生成和数字调色、安全与版权保护等角度论述了当前人工智能技术在电影行业的深度应用要点;另有缩微胶片技术、电影公益放映内容“中央厨房”等科技论文探讨了传统技术与新兴技术的融合发展,欢迎广大读者予以关注。
——本期责编
专家点评
当前,我们正处于第三次技术革命浪潮中,人工智能应用前景日趋清晰,人工智能应用场景日益广泛。特别是在电影文化领域,生成式人工智能更是具有大规模提高生产效率的潜能。在此背景下,中国电影科学技术研究所(中央宣传部电影技术质量检测所)总工程师刘达率团参加了人工智能领域国际顶级学术会议,并开展了技术调研和考察交流,在此基础上撰写完成《智能计算时代深化电影科技创新和推进电影强国建设的思考与启示》一文。文章在简明扼要介绍欧洲高新技术格式电影制作播映发展与应用最新成果的基础上,针对电影产业、现代影院和沉浸式视听技术的发展与应用,提出把电影级主动发光显示技术和沉浸式视听技术作为重要抓手,以有效提升影院视听品质和观影体验。此外,适应智能计算时代发展特征和生成式人工智能演进趋势,提出了电影行业要统筹推进模型自主研发与行业定制改造的技术思路,同时探讨了电影行业在积极探索人工智能应用中强化人工智能安全治理和版权保护的方式。文中提出我国要加快构建完善以“文生电影”为核心的电影智能化创作生产技术体系,发展完善以现代智能科技为核心支撑的电影新质生产力,推进电影摄制播映向高品质沉浸式多元化升级,构建发展新型视听文化业态,优化升级视听文化服务,为新时代新征程推进我国电影科技创新升级和高水平自立自强提供了富有前瞻性、建设性和可实施性的思考启示与发展建议。
——徐进
中央广播电视总台技术局局长
中国电影电视技术学会理事长
过去一年,生成式人工智能(Generative AI, GenAI)在音视频领域的应用呈现井喷发展态势,特别是今年2月Sora的发布,让人们对GenAI的表现有了极大的信心。当影视人致力于将这一技术应用于专业制作领域时,却发现还存在诸多问题,除了画面细节少、连续性差、角色动作受限等,最大的问题是生成的内容可控性差。如何让GenAI生成的结果能够为创作者所控制,能够听从人的指挥,是GenAI技术必须要解决的问题。《有意义人类控制(MHC)在AI 影视创作中的探索与应用》通过总结团队AI视频生成的经验,结合有意义人类控制(Meaningful Human Control, MHC)概念,对比了三种不同的自动化工具设计思路,选择了人在回路中(Human⁃in⁃the⁃Loop, HITL)的设计模式来解决可控性问题,总结了目前AI影视创作中模型微调、提示词生成、生成要素控制等几种控制方法,并预期未来会采取多模态控制技术对模型进行精细控制。本文对当前热点的GenAI可控性问题进行了理论分析,并在实践基础上提出了切实可行的解决方案,对于推动AI技术在影视行业进一步落地应用具有很高的参考价值。
——陈军
研究员
北京电影学院影视技术系主任
近年来,人工智能生成内容(AIGC)技术迅猛发展,其主流模型框架以深度神经网络为基础,由早期的GAN、VAE向Transformer、Diffusion与DiT(Diffusion Transformer)发展演进。其中,大语言模型(LLM)文本生成技术日渐成熟,引领推动图像与声音生成技术的发展,并通过不断增强可控性以满足日益增长的个性化创作需求。音乐作为电影不可或缺的表达元素,顺应AIGC技术的发展与应用,AI音乐生成正逐步成为电影配乐创作的革新力量,迄今已分化出符号生成与音频生成两种技术路线,但现有方法对音乐流派等控制条件关注不足,一定程度上影响了音乐生成质量和多样性的提升。《基于多粒度注意力Transformer的电影音乐生成研究》一文以编码后的流派信息作为条件输入从零生成符号音乐,结合音乐重复周期的结构特点,采用多粒度注意力机制Transformer架构捕获音乐结构和上下文信息,并引入流派分类判别器,输出流派分类概率用于识别判断,为音乐生成提供风格控制。本方法在流派控制效果、音乐质量结构等方面较同类方法有较大提升,但在实用性上仍有改进空间,有待进一步研究探索。
——王萃
正高级工程师
中国电影科学技术研究所(中央宣传部电影技术质量检测所)高新技术研究处副处长
本期目录
专栏:全面深化电影科技自主创新
积极推进高水平科技自立自强
◎ 有意义人类控制(MHC)在AI影视创作中的探索与应用
◎ 基于多粒度注意力Transformer的电影音乐生成研究
——熊晓钰 谢志峰 黄登云 朱永华
◎ 基于K近邻色彩迁移算法的数字调色方法研究
—— 杨岚彬 姚正安
◎ 数字人技术在电影与数字内容领域的创新应用
——刘笑微 肖婧澜 宋 震
◎ 全球化视域下数字媒体技术赋能中国神话IP电影创作
◎ 基于AI的影视版权保护技术研究
◎ 电影公益放映内容“中央厨房”设计与实现
——李聿为
◎ 缩微胶片技术在电影文图档案保存中的应用综述
——李 英 王 瑶
文章概要
智能计算时代深化电影科技创新和推进电影强国建设的思考与启示
有意义人类控制(MHC)在AI影视创作中的探索与应用
基于多粒度注意力Transformer的电影音乐生成研究
基于K近邻色彩迁移算法的数字调色方法研究
数字人技术在电影与数字内容领域的创新应用
全球化视域下数字媒体技术赋能中国神话IP电影创作
基于AI的影视版权保护技术研究
电影公益放映内容“中央厨房”设计与实现
缩微胶片技术在电影文图档案保存中的应用综述
文章全文详见《现代电影技术》期刊
2024年第9期
主管单位:国家电影局
主办单位:电影技术质量检测所
标准国际刊号:ISSN 1673-3215
国内统一刊号:CN 11-5336/TB
投稿系统:ampt.crifst.ac.cn
官方网站:www.crifst.ac.cn
广告合作:010-63245082
期刊发行:010-63245081