【华龙传媒】周报:智谱推出AI视频模型“新清影”,视频生成开启“有声”时代

文摘   2024-11-12 21:11   北京  

 【核心观点】


  • 摘要:

    (1)智谱推出AI视频模型“新清影”,视频生成步入“有声”时代。11月8日,智谱技术团队发布并开源最新版本的视频模型 CogVideoX v1.5。升级后的清影在复杂提示词理解等方面的能力得到提升,能够生成10秒、4k、60帧超高清画质,同时支持任意比例图像生成视频,可以一次性生成4个视频。据官方介绍,CogVideoX v1.5 也将同步上线到“清影”平台,并与新推出的 CogSound 音效模型结合。

    (2)Meta发布新技术AdaCache,视频生成速度提升4.7倍。11月7日,Meta AI 推出自适应缓存(AdaCache)的创新解决方案,无需额外训练即可加速视频扩散变换器。AdaCache可在保持视频质量的同时优化延迟,是一种灵活、即插即用的解决方案,可提高不同视频生成模型的性能。在涉及Open-Sora的720p、2秒视频生成的测试中,AdaCache的速度比以前的方法提高了4.7倍,同时保持了相当的视频质量。

    (3)Decart推出全球首款实时生成AI游戏Oasis。11月2日,两家初创公司Decart和Etched宣布称打造了一款世界上首个实时、可玩、可交互的世界模型——Oasis。Oasis仅接收用户的键盘输入即可实时生成开放世界游戏,但其中并不包含任何游戏引擎,只有一个AI基座模型。在没有任何延迟的情况下,Oasis在H100上运行时能以360p的分辨率实现每秒20帧的渲染,并实时生成视频交互内容。

  • 投资建议:我们认为受益于国内外大模型持续迭代,推动传媒企业智能化转型和降本增效,随着增量政策接续发力,有望助力板块中期维度的业绩改善,把握传媒板块三条主线,建议关注:①估值修复叠加供给释放下业绩修复的影视板块,建议关注中国电影等。②继续看好避险属性较强,高分红、低估值的出版板块,建议关注中文传媒、凤凰传媒、山东出版、中南传媒等。③优质IP和积极布局出海的游戏企业,建议关注三七互娱、巨人网络、吉比特等。维持传媒行业“推荐”评级。

  • 风险提示:新技术发展不及预期;行业竞争加剧;新产品研发上线及表现不及预期;政策及监管环境趋严;宏观经济波动。






正文

  1 一周市场表现

    2024年11月4日-11月8日,申万传媒指数上涨5.49%。板块个股涨幅前五名分别为佳云科技(300242.SZ)、华闻集团(000793.SZ)、完美世界(002624.SZ)、广西广电(600936.SH)、华谊兄弟(300027.SZ)。板块个股跌幅前五名分别为电广传媒(000917.SZ)、思美传媒(002712.SZ)、皖新传媒(601801.SH)、天地在线(002995.SZ)、视觉中国(000681.SZ)。


2 行业要闻

   Meta发布新技术AdaCache,视频生成速度提升4.7倍

   11月8日,Meta AI 和纽约州立大学石溪分校的研究人员推出了一种名为自适应缓存(AdaCache)的创新解决方案,无需额外训练即可加速视频扩散变换器。AdaCache是一种无需训练的技术,可集成到各种视频 DiT 模型中,通过动态缓存计算来简化处理时间。通过适应每个视频的独特需求,AdaCache 可以将计算资源分配到有效的地方。AdaCache可在保持视频质量的同时优化延迟,是一种灵活、即插即用的解决方案,可提高不同视频生成模型的性能。

    研究团队进行了一系列测试来评估 AdaCache的性能,结果表明,AdaCache显著提高了多种视频生成模型的处理速度和质量保持率。例如,在涉及Open-Sora的720p、2秒视频生成的测试中,AdaCache的速度比以前的方法提高了4.7倍,同时保持了相当的视频质量。(来源:adacache.github)

   微软推出GenXD,生成任意 3D 和 4D 场景

   11月6日,微软和新加坡国立大学出的一个3D/4D场景生成项目GenXD,能同时处理3D和4D场景生成。生成的视频可遵循相机轨迹、保持物体形态一致、支持3D格式转换,并保持时空一致。可以用于虚拟现实、游戏,或者建筑可视化的场景。凭借高质量的四维数据和四维时空生成模型,GenXD在使用单个或多个输入视角的三维和四维生成方面均取得了显著性能。(来源:gen-x-d.github)

   Decart推出全球首款实时生成AI游戏Oasis

   11月2日,两家初创公司Decart和Etched宣布称打造了一款世界上首个实时、可玩、可交互的世界模型——Oasis。Oasis仅接收用户的键盘输入即可实时生成开放世界游戏,但其中并不包含任何游戏引擎,只有一个AI基座模型。游戏允许玩家进行移动、跳跃、拾取物品、打破砖块等操作,生成的视频内容中不仅包含图形学的渲染,也能体现出对物理原则和游戏规则的理解。在没有任何延迟的情况下,Oasis在H100上运行时能以360p的分辨率实现每秒20帧的渲染,并实时生成视频交互内容。(来源:decart.ai)

   Google正式推出Gemini AI驱动的视频演示应用Vids,通过简单提示即可生成视频演示

   11月7日,谷歌发布了基于Gemini AI模型的视频制作工具Google Vids,旨在简化视频创作流程,支持从模板创建到自定义调整,现已向特定级别的Google Workspace用户开放,助力用户轻松生成专业级别的视频内容。Vids是一款功能先进的视频辅助工具,可帮助用户制作故事板、提供剧本辅助、添加图片、背景音乐,甚至是人工智能解说词。值得注意的是,Google Vids与Runway或Pika等从头开始创建视频内容的文本到视频生成器不同。后者创建视频内容时都是从零开始,而Google Vids则偏向为一个用户的创意助手,通过帮助用户组装一个定制的故事板来帮助他们制作视频。(来源:google官网)

  3 重点公司公告

  【天地在线】2024年11月4日,公司发布发行股份及支付现金购买资产并募集配套资金暨关联交易预案,公司拟以发行股份及支付现金的方式购买张富、上海极那管理咨询合伙企业(有限合伙)其合计持有的上海佳投互联网技术集团有限公司(以下简称:佳投集团)100%股份,并拟向不超过35名特定投资者发行股份募集配套资金。

  【ST华通】2024年11月6日,公司发布公告,公司根据相关规定,公司股票将被实施其他风险警示。公司股票自2024年11月7日开市起停牌一天,将于2024年11月8日开市起复牌。公司股票自2024年11月8日起被实施其他风险警示,股票简称由“世纪华通”变更为“ST华通”,证券代码仍为“002602”,股票交易的日涨跌幅限制为5%。

  【百纳千成】2024年11月7日,公司发布公告,公司与上海腾讯企鹅影视文化传播有限公司(简称“腾讯影视”)达成系列合作,并于近日与腾讯影视签署《影视剧集联合合作合同》,拟与腾讯影视联合制作剧集。公司将按照合同约定完成剧集制作相关工作,腾讯影视享有合同约定的剧集权利。此次签署合同金额为4亿元,占公司2023年度经审计主营业务收入的93.55%。

  4 本周观点

   4.1智谱推出AI视频模型“新清影”,国产AI可以拍有声微电影了

   11月8日,智谱技术团队发布并开源最新版本的视频模型 CogVideoX v1.5。升级后的清影在复杂提示词理解等方面的能力得到提升,能够生成10秒、4k、60帧超高清画质,同时支持任意比例图像生成视频,可以一次性生成4个视频。据官方介绍,CogVideoX v1.5 也将同步上线到“清影”平台,并与新推出的 CogSound 音效模型结合。

   目前新清影在以下 5 个方面实现了提升。

   模型能力全面提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力明显增强。

   4K超高清分辨率:支持生成 10s、4K、60 帧超高清视频,视觉体验拉到极致,动态画面更加流畅。

   可变比例:支持任意比例的图像生成视频,超宽画幅也能轻松 Hold 住,从而适应不同的播放需求。

   多通道生成能力:同一指令/图片可以一次性生成 4 个视频。

   带声效的AI视频:新清影可以生成与画面匹配的音效了。音效功能将很快在11月上线公测。

   新清影的发布标志着AI视频进入了“有声电影时代”。真正的智能是多模态的,听觉、视觉、触觉等共同参与了人脑认知能力的形成,智谱多模态大模型矩阵包括文字、图像、语音和视觉等模态,能够进一步提高大模型的应用和工具能力。

   此次新推出的CogSound音效模型和音乐模型CogMusic,其中音效模型CogSound能根据视频自动生成音效、节奏等音乐元素,基于GLM-4V的视频理解能力,能够准确识别并理解视频背后的语义和情感,在此基础上生成与之相匹配的音频内容,甚至生成复杂音效,如爆炸、水流、乐器、动物叫声、交通工具声等。音效模型的出现能够实现视频与声音的同步创作。同时该模型在电影行业也具有广泛的应用前景,比如可以生成电影中的大规模战斗场景和灾难场景的声音,大大缩短了制作周期,降低了制作成本。

   CogSound实现了更高效的音频合成过程、以及音频与视频在语义层面的高度一致性,具有更好的连贯性和平滑过渡。

   目前,智谱已经构建了独家、完善、原创的多模态模型矩阵。包括语言模型、图像生成和理解模型、视频生成和理解模型和10月底刚刚发布的端到端情感语音模型 GLM-4-Voice。随着音效模型 CogSound 的加入,多模态大模型家族在声音模态方面实现了人声、音效的多链路布局,健全了智谱基于图像、视频和声音的多模态模型矩阵。目前海外大模型规模扩张速度有所放缓,转而更加注重推理能力的优化,国内大模型与海外的差距在不断地缩小。随着底层技术的逐步成熟和可用性,AI Agent商业化正处于产业化落地的关键时期,持续关注应用在端侧落地机会。

5 投资建议:我们认为受益于国内外大模型持续迭代,推动传媒企业智能化转型和降本增效,随着增量政策接续发力,有望助力板块中期维度的业绩改善,把握传媒板块三条主线,建议关注:①估值修复叠加供给释放下业绩修复的影视板块,建议关注中国电影等。②继续看好避险属性较强,高分红、低估值的出版板块,建议关注中文传媒、凤凰传媒、山东出版、中南传媒等。③优质IP和积极布局出海的游戏企业,建议关注三七互娱、巨人网络、吉比特等。维持传媒行业“推荐”评级。

6 风险提示

1)新技术发展不及预期。由于AI相关技术仍在关键发展阶段中,存在新技术革新不及预期的风险。

2)行业竞争加剧。若后续传媒行业竞争加剧,可能会影响相关公司的毛利率水平,进而影响相关公司的盈利能力。

3)新产品研发上线及表现不及预期。新产品从制作到上线包括多个步骤,延期上线及后期表现不及预期都将影响业绩。

4)政策及监管环境趋严。受国家相关政策和职能部门监管,政策收紧可能影响相关公司经营。

5)宏观经济波动。公司经营受宏观经济及政策影响。

本文摘自报告:《传媒周报:智谱推出AI视频模型“新清影”,视频生成开启“有声”时代
报告发布日期:2024年11月11日
报告发布机构:华龙证券
分析师   孙伯文:S0230523080004





【特别提示】

本公众号推送的观点和信息仅供华龙证股份有限公司(以下简称“华龙证券”)的专业投资者参考,其他的任何读者在订阅本公众号前,请自行评估接收相关内容的适当性,华龙证券不会因订阅本公众号的行为或者收到、阅读本公众号所载资料而视相关人员为专业投资者客户。


本公众号不是华龙证券研究报告的发布平台。本公众号只是转发华龙证券已发布研究报告的部分观点,订阅者若使用本公众号所载资料,有可能会因缺乏对完整报告的了解而对资料中的关键假设、评级、目标价等内容产生理解上的歧义,应以华龙证券研究所发布的完整报告为准。

本公众号所载信息和内容仅供参考,并不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。对任何直接或间接使用本公众号所载信息和内容或者据此进行投资所造成的任何一切后果或损失,华龙证券及相关研究人员均不承担任何形式的法律责任。


本公众号及其推送内容的版权归华龙证券所有,华龙证券对本公众号及其推送内容保留一切法律权利。未经华龙证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则将承担相应的法律责任。


扫码关注我们

查看更多精彩内容

点击“阅读原文

华龙证券研究
华龙证券研究所官方账号,研究成果交流与分享平台。
 最新文章