近段时间,多个国产视频生成大模型陆续上线、走向大众。在业内人士看来,视频生成技术在人工智能领域正日益受到重视,并且正在快速进步,未来可能会对影视制作、广告设计等多个领域产生深远影响。基于此背景,赛智产业研究院副院长邓道正接受经济参考报记者采访并发表观点。
近段时间,多个国产视频生成大模型陆续上线、走向大众。在业内人士看来,视频生成技术在人工智能领域正日益受到重视,并且正在快速进步,未来可能会对影视制作、广告设计等多个领域产生深远影响。
日前,字节跳动旗下火山引擎发布了豆包视频生成模型,具有一致性多镜头生成、动态运镜、支持3D动画等功能。火山引擎方面介绍,全新设计的扩散模型训练方法,攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性。
在对话框输入“穿着滑冰鞋的小兔子在冰面上灵活移动的可爱场景”,随即一段高清、逼真的动画视频呈现在眼前——近日,通义万相发布视频生成模型。阿里云CTO周靖人介绍,该视频生成模型针对运动生成和物理模拟等难点优化算法,实现了大幅度主体运动和运镜控制,并有效模拟真实世界物理特性,可应用于影视创作、动画设计、广告设计等领域。
今年初,文生视频大模型Sora在全球人工智能业内外引发广泛关注。近期,快手、生数科技、智谱AI等多个中国科技企业自主研发的视频生成产品加速上线。
在业内人士看来,当前大模型已经具备文本、语音、视觉的多模态能力,能够开始完成复杂指令,技术快速迭代使其可用性大幅提升。
赛智产业研究院副院长邓道正对《经济参考报》记者表示,视频生成大模型的发展将对传媒娱乐、广告营销、教育培训、元宇宙等众多行业产生深远影响,有利于大幅降低短视频、直播、影视制作的成本和周期。
“例如,在影视制作领域,视频生成大模型可根据导演或编剧的创意需求,生成具有个性和创意的视频片段,为影视创作提供更多可能性;在广告宣传领域,视频生成大模型能够根据用户的兴趣和行为数据快速生成多种风格和主题的视频广告,满足不同客户的需求,实现精准投放和个性化推荐。”邓道正说。
不过不少业内人士也表示,国产视频生成大模型层出不穷,已解决了“有”的问题,需逐步向“优”进化。
生数科技联合创始人兼CEO唐家渝表示,视频生成大模型领域竞争激烈,尽管众多模型层出不穷,但普遍存在一个核心问题——可控性不足,或者叫一致性的不足。“在实际视频创作中,视频内容往往围绕特定对象展开,这些对象在视频中的形象需要保持连续一致。然而现有的视频模型往往难以实现这一点,常常是主体在生成过程中容易崩坏。尤其在涉及复杂动作和交互时,保持主体一致性更是一项挑战。”
邓道正认为,尽管我国视频生成大模型在技术上取得了显著进步,但生成的视频质量与连贯性仍有待提升,尤其是在处理复杂场景和动作时,模型容易出现画面崩坏、动作不连贯等问题。另外,模型对自然语言提示词的理解能力也有限,难以完全捕捉和表达用户的意图,生成结果具有很大的随机性,难以生成独特、新颖的视频内容。
对此,不少企业也加快视频大模型的迭代升级。例如,由生数科技和清华大学联合研发的自研原创视频大模型Vidu更新“主体参照”功能。据介绍,所谓“主体参照”,就是允许用户上传任意主体的一张图片,Vidu就能够锁定该主体的形象,通过描述词任意切换场景,输出主体一致的视频。
火山引擎总裁谭待也表示,视频生成有很多难关亟待突破,豆包模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。
面向下一步发展,邓道正建议,加强技术创新与突破,要鼓励企业、高校和研究机构加强合作,加大在视频生成技术上的创新研发投入和人才培养,深入研究视频生成的核心算法和模型结构,包括图像生成、视频帧间关系处理、运动估计与补偿等,以提升视频生成的质量。加强高质量视频数据集建设,要支持广泛收集各类视频数据,以丰富数据集的规模和多样性,同时也要加强数据标注发展,提高数据的质量和可用性,确保数据集的准确性和完整性。拓展应用场景,要积极深入挖掘视频生成技术的应用场景,加强产业链上下游企业的合作,不断开发新的商业模式,共同推动视频生成技术的广泛应用和商业化发展。
文章来源:经济参考报
记者:郭倩
更多精彩内容请登录http://www.ciomanage.com官方网站
往/期/精/选
公司介绍
联系方式
智库服务
北京市数字经济战略研究
北京市数据要素市场促进服务(北京市新型数据交易规则体系设计)
北京数据先行区关键机制创建服务
贵州省加速构建数据要素市场培育新兴产业课题研究
国家大数据(贵州)综合试验区实施方案
中国数据服务产业图谱研究
内蒙古自治区大数据中心数据要素市场化规划咨询
保定市数据服务产业发展规划编制
朝阳数据要素市场发展研究
丰台区数字经济倍增发展路径研究
北京市大数据立法数据支撑服务
北京市智慧城市建设协调推进项目
中国算力网络发展研究白皮书
重庆两江新区数字经济发展规划
贵阳市大数据五大新领域(人工智能、量子信息、区块链、物联网、5G移动网络)产业规划
南宁市元宇宙产业创新发展研究
贵阳市数字经济产业招商引资项目评估
智能贵州发展规划
贵州省大数据新领域产业发展指南
北京市大数据应用发展报告
天津市大数据应用场景建设计划
贵州省大数据战略行动计划编制
贵州省“十三五”以大数据为引领的电子信息产业发展规划
丽水市城市大脑开发建设研究
贵阳市新基建“十四五”发展规划
中国数谷顶层设计方案
贵阳市数博大道产业规划
贵阳区块链发展白皮书
贵阳市大数据发展“十三五”规划
贵阳市数字经济发展规划
观山湖区呼叫中心产业园规划
济南新型智慧城市规划
南宁大数据建设工程规划
航天科技车联网产业商业模式研究
阿里云数智化敏捷组织:云钉一体驱动组织转型研究
百度区块链研究项目
实创集团智慧城市业务战略规划
云上贵州集团业务战略规划
贵阳大数据集团业务战略规划……
软件平台
饮鹿网精准招商大数据云(平台)是赛智产业研究院联合饮鹿网开发的针对产业招商的最新产品。涵盖大数据、人工智能、区块链、5G、智慧城市、 工业互联网等 30 多个领域,为招商部门、产业主管部门、园区管委会和产业地产提供大品牌招商、产业筛选招商、产业生态链招商、重点产品招商、资本注入式招商、区域一体化协同招商、原籍创业人才招商等招商数据分析服务。
政府提供新兴产业的产业链、企业、技术、投资等数据分析服务的平台,主要为各地发改部门、工信部门、产业分管领导提供产业仪表盘、产业链分析、产业地图、产业发展要素分析、产业政策、产业洞察等产业数据分析服务。
服务于创业投资领域,为母基金、头部投资机构、地方政府产业基金或引导基金提供绩效考核的专业化平台,主要提供投资数据(投融资仪表盘:与投资趋势洞察融合)、投资绩效分析(投资绩效分析、融资日报、投资机构百强、投资人百强)、项目分析(重点项目、产业链投资、细分图谱投资)、投资布局(投资地图)、投资要素分析、投资管理等服务。