摘要
国家广播电视总局科技司近期公布了《数字虚拟人技术要求》的行业标准报批稿。
这一标准旨在规范广播电视和网络视听行业中数字虚拟人的技术要求,涵盖了数字虚拟人的分类、应用场景、形象、驱动技术、平台能力和安全能力等方面。
根据该文件,数字虚拟人分为2D数字虚拟人和3D数字虚拟人,以及非交互式和交互式数字虚拟人,以及算法驱动型和真人驱动型数字虚拟人。其主要应用场景包括内容播报、交互客服、虚拟演播和内容创作等。例如,内容播报包括新闻资讯播报、电影/电视/专题片/纪录片介绍和直播带货等;交互客服包括虚拟客服、智能助手和交互问答等;虚拟演播包括综艺主持、虚拟演唱会、文娱活动和用户代理虚拟分身等;内容创作则涵盖影视创作、视频创作、广告创作和游戏创作等。
总体技术架构包括数字虚拟人形象、算法驱动能力、真人驱动能力、平台能力和安全能力。其中,数字虚拟人形象包括2D真人、2D卡通、3D写实、3D卡通和建模技术。算法驱动包括驱动能力、合成能力和多模态能力,其中驱动能力又分为文本驱动能力、语音驱动能力和视频驱动能力;合成能力包含语音合成能力和视频合成能力;多模态能力包含语音识别能力和自然语言处理能力。
此外,数字虚拟人形象的要求包括符合场景的任务设定,在人物形象、表情、服饰等方面得体、美观;支持全身、大半身、半身不同景别姿态;形象完好,不存在扭曲、马赛克、跳帧、破损、音视频延时、口唇不一致等情况;支持装扮、服饰的更换;不存在侵犯第三方权利及法律法规禁止的其他情形。2D真人数字虚拟人形象方面,支持真人形象复刻,形象逼真自然,语音自然流畅;支持通过照片、视频等方式生成形象,保证面部五官、肤色、牙齿、明暗等准确还原。
众视Tech媒体矩阵
12月上海
12月深圳
——联系我们——
赞助 微信/TEL:133 4199 1901
演讲 微信/TEL:180 1769 7362
展示 微信/TEL:134 8232 5192