逆势爆发!Sora文生视频模型产业链机会

财富   2024-11-15 15:41   北京  

展望未来,随着模型规模的持续增大,模型参数将进一步放大,多模态大模型也将陆续推出,这必将引发对算力需求呈指数级的急剧提升,众多场景应用中也将带来颠覆性的革命变革,重塑各个行业的发展格局与竞争态势。

编辑|蓝猫
投顾支持 | 于晓明
执业证书编号:A0680622030012

特别提示

通过本公众号发布的观点和信息仅供陕西巨丰投资资讯有限责任公司(下称“巨丰投顾”)客户中符合《证券期货投资者适当性管理办法》规定的特定客户参考。因本公众号暂时无法设置访问限制,若您并非巨丰投顾客户,为控制投资风险,请您取消关注,请勿订阅、接收或使用本公众号中的任何信息。对由此给您造成的不便表示诚挚歉意,感谢您的理解与配合!

Risk Disclosure
A股三大指数今日集体回调,截止收盘,沪指跌1.45%,收报3330.73点;深证成指跌2.62%,收报10748.97点;创业板指跌3.91%,收报2243.62点。沪深两市成交额达到1.82万亿元,较昨日小幅缩量120亿。人工智能概念全线走强,Sora方向逆势飙升,板块指数一度创历史新高。那么,今天我们就来详细剖析一下Sora文生视频模型产业链的投资逻辑。
巴菲特为什么说回调是机会?

巴菲特一直坚守价值投资理念,认为股票的价值最终会反映在公司的内在价值上。当市场回调时,很多优质公司的股票价格可能会被过度打压,低于其内在价值。此时买入,就相当于以折扣价获得了有价值的资产,未来当市场恢复理性或者公司价值进一步提升时,就能获得丰厚的回报。安全边际是巴菲特投资的重要原则之一。市场回调会使股票价格下降,从而扩大了股票的安全边际。也就是说,投资者在回调后买入股票,其面临的潜在损失风险会降低,而未来的盈利空间会增加。这为投资者提供了更好的风险与回报比率。

在市场回调时,投资者可以有更多的机会去选择那些平时价格较高但因回调而变得更具吸引力的优质股票。巴菲特旗下的伯克希尔・哈撒韦公司资金规模庞大,市场回调能为他提供更多的投资选择,使他可以将资金配置到更多符合其投资标准的企业中。调整投资组合的时机:回调可以让投资者重新审视和调整自己的投资组合。对于巴菲特这样的长期投资者来说,这是一个优化投资组合结构的好时机,可以卖出一些估值过高或不再符合投资标准的股票,买入更具潜力的资产。巴菲特深知市场具有周期性,上涨和下跌是市场的常态。

回调是市场周期中的一个阶段,从长期来看,市场总是会经历复苏和上涨。因此,当市场回调时,巴菲特不会被短期的波动所影响,而是基于长期的投资视角,看到回调背后隐藏的投资机会。

机构:科技产业的投资主线将围绕AI展开

中信证券认为,展望2025年,科技产业的投资主线将继续围绕AI展开。随着大模型能力在多模态、逻辑推理等方面的持续进步,AI将与千行百业的数智化转型深度结合,从算力基础设施到终端应用落地,持续驱动科技产业投资。推荐关注AI算力、应用与数据、AI终端三个方向的投资机会。并且随着宏观经济环境的转暖以及产业政策的逐步落地,也推荐关注需求复苏背景下,互联网、安卓消费电子、汽车产业链、半导体、运营商等细分科技板块的投资机遇。

天风证券认为除Nvidia之外的AI芯片或许也会迎来市场机会。其研报提到,苹果在最新用于AppleIntelligence的端侧与云端大模型训练中主要使用了Google的TPU,Anthropic也使用谷歌CloudTPUv5e芯片为其大语言模型Claude提供硬件支持;AMD的MI300芯片销量持续超预期。未来,训练与推理端的算力需求有望持续增长。

华福证券认为,要关注AI相关需求的高速增长。AIPC(人工智能个人电脑)市场高速发展,AI大模型的端侧规模化扩张快速推进。AI热潮进一步驱动先进制程需求飙升,台积电HPC及AI芯片价格或将上涨,AI应用带动硬件升级,存储需求攀升,随着面向终端设备的存储器的推出,端侧AI市场有望逐步进入稳定增长轨道。

平安证券表示,国家重视人工智能发展,提出开展“人工智能+”行动、加快形成全国一体化算力体系,这有望推动我国AI基础设施建设的加快和AI产业的发展。在大模型算法的迭代升级背景下,全球和中国AI算力市场将增长强劲,我国国产AI芯片产业链也将加快成熟,相关企业会深度受益,应用端的国产大模型能力持续升级,AIGC产业未来发展前景广阔。

据相关报道,字节跳动的视频生成模型PixelDance即将于即梦AI平台上线,并面向公众开放使用。而Runway在11月9日曾宣称,OpenAI计划在大约两周内正式向公众全面推出Sora。这就意味着字节跳动的即梦平台会在Sora发布之前上线其视频生成模型PixelDance。

今年2月,OpenAI率先推出了首个AI视频生成模型——Sora。该模型能够依据用户的文本描述,生成长达60秒且画质为1080P的高质量视频,其视频内容涵盖精细复杂的场景、鲜活的角色表情以及复杂多样的镜头运动。

Sora充分彰显了AI在理解与模拟物理世界方面的卓越能力,这一成果被视作迈向通用人工智能(AGI)的关键环节。OpenAI认为,视频生成模型是构建通用物理世界模拟器的一条极具潜力的路径,它让人工智能在理解和模拟处于运动状态的物理世界方面取得了新的重大突破。

自Sora发布之后,国内外其他模型厂商也纷纷跟进,逐步推出类似Sora的产品。从长远视角来看,视频生成大模型有望在传媒影视、游戏、金融、医疗、教育、制造等众多行业引发深刻变革。Sora的问世对于上述行业而言意义非凡。依据红杉《GenerativeAI:ACreativeNewWorld》的预测,在未来2-3年,AIGC初创公司以及商业落地方案的数量将会持续攀升,并且有望创造数万亿美元的经济价值。

一、文生视频模型究竟是什么?

文生视频大模型属于一种能够借助AI生成视频内容的大型机器学习模型,它能够根据用户的自然语言描述精准地生成与之匹配的视频内容。这类模型一般基于深度学习技术构建,尤其融合了自然语言处理(NLP)、计算机视觉(CV)和语音识别(ASR)等多种技术。

以OpenAI官方发布的范例视频为例,当输入提示词:“一位时尚的女士漫步在东京街头,街上满是温暖的霓虹灯和生动的城市标志。她身着黑色皮夹克、红色长裙与黑色靴子,手中拎着一个黑色手提包。她戴着太阳镜,涂着红色口红。走路时尽显自信与洒脱。街道潮湿且具有反光效果,形成了彩色灯光的镜面效果,众多行人穿梭往来。”

二、关于Sora的详细解析

Sora模型乃是由OpenAI公司精心研发打造的一款极为先进的文本至视频生成模型,其正式面向外界发布的时间为2024年2月15日。该模型具备一项卓越的能力,即能够依据用户所提供的文本描述来创作出时长可达60秒的视频作品。这些生成的视频不仅在视觉呈现品质方面表现出色,而且能够极为精准且完整地将用户所输入的提示语内容予以还原呈现。在OpenAI官方所出具的技术报告当中,对Sora有着极为明确的定位,将其视作“作为世界模拟器的视频生成模型”,并且指出“拓展视频生成模型乃是构建物理世界通用模拟器的一条切实可行的路径”。

在与其他模型的对比之中,Sora发布之后成功奠定了视频生成领域极为重要的技术路线——DiffusionTransformer(DiT),同时还将生成视频的时长提升至分钟级别,这无疑成为了整个行业发展历程中的一个关键转折点。

从技术层面来看,Sora模型巧妙地将自然语言处理技术与视频生成技术进行有机融合。其实现的机理是从初始的静态噪声着手,历经多个步骤逐步去除噪声,最终成功生成清晰、流畅且符合用户描述的视频。在训练过程中,它借助了大量带有相应文本字幕的视频数据进行深度训练,以此来不断提升自身的生成能力与准确性。

三、Sora产业链的构成要素

Sora模型的产业链是一个多环节紧密相连且复杂的体系,其中涵盖了数据收集与处理、模型训练与开发、部署与应用、硬件与云服务以及产业链上下游企业等诸多重要环节。

首先,在数据收集与处理环节,由于AI模型的训练对于数据有着海量的需求,这些数据涵盖了文本、图像、视频等多种丰富的形式。为了能够满足模型训练的严苛要求,这些数据必须要历经收集、清洗、标注等一系列精细且复杂的处理流程。

其次,在模型训练阶段,当收集到充足的数据之后,便需要展开高强度的模型训练工作。这一过程需要极为强大的计算资源予以支撑,诸如高性能计算机、GPU、TPU等先进的硬件设备不可或缺。与此同时,还需要专业素养极高的AI算法工程师投入其中,精心进行模型的设计、调优等关键工作,以确保模型能够达到预期的性能与效果。

再者,在硬件与云服务方面,AI模型的顺畅运行离不开强大的硬件基础设施作为坚实后盾,其中包括高性能计算机、服务器,以及算力租赁服务等多样化的服务形式。这些硬件与云服务共同构建起了一个稳定、高效的运行环境,保障Sora模型能够在不同的应用场景中稳定发挥其作用。

最后,在应用端,Sora这一文本生成视频模型具备极为广泛的应用前景,能够在影视制作、动画制作、游戏开发、音乐教育等多个领域大显身手。它能够显著降低视频制作过程中的成本投入,对于各应用领域而言,均有望实现可观的降本增效成果,从而有力地推动相关行业的创新与发展,加速整个行业的供给端变革进程。

四、文生视频模型的三大核心基石剖析

算法、算力、数据堪称大模型迈向通用人工智能(AGI)的必由之路。伴随多模态AI在各个赛道全面迈向深化成熟的发展阶段,AI模型在训练、推理等方面所对应的算力需求也必然会随之获得进一步的释放与增长。

算法层面

AI算法借助用户画像、舆情分析以及预测等交易模型,以神经网络算法、聚类算法、增强算法和传统回归算法作为底层基础算法,进而分别达成了机器视觉听觉、降维分析、自然语言处理和模式识别等一系列人工智能功能。就视频生成模型算法而言,其主要由基于SD逐帧生成和基于时空Patches两种范式所构成,这两种范式在效率与效益方面展开了激烈的比拼。其中,前者所构建的模型在训练过程中相对更为容易操作,但所生成视频内容在一致性方面表现稍差,尤其是在长视频训练任务中面临诸多困难;而后者虽然训练成本相对较高,然而在生成视频的长度与一致性方面却更具优势,更容易得到有效的保障。随着下一代大模型算力需求的持续攀升,算法领域有望迎来具有重大意义的生成式革新突破。在国内,众多企业如百度、腾讯、阿里、科大讯飞、字节跳动、华为、商汤科技、旷视科技、依图科技、云从科技等纷纷加速布局AI算法研发工作,力求在这一领域占据有利地位。

算力方面

随着模型的持续迭代更新以及AIGC应用呈现出多点开花的繁荣景象,训练和推理过程中的算力需求呈现出持续增长的强劲态势,这一趋势有力地带动了算力基础设施产业链进入高速发展的黄金时期。以Sora为例,经过特定条件下的精确测算,Sora训练算力需求高达GPT-4的4.5倍,而其推理算力需求更是接近GPT-4的400倍之多。由此可见,算力基础设施的部署需求仍然处于不断扩大与升级的进程之中。AI模型的运行高度依赖强大的硬件支撑体系,包括高性能计算机、服务器、云服务、光通信、液冷温控、AIDC、AI服务器、交换机/路由器、算力模组、CDN、铜缆等各个环节均呈现出高速发展的良好态势,共同构建起了一个庞大而完善的算力产业链图谱。

数据资源方面

高质量与大规模的数据集无疑是AI大模型实现突破的关键要点所在,而用户数量或许正是开启模型迭代“数据飞轮”的核心关键所在。按照数据源的不同,可以将数据划分为核心数据、边缘数据和终端数据三大类别,其中前两者主要来源于企业,而终端数据则主要源自于个人。就当前国内的现状而言,数据资源总量颇为丰富,在总量层面具备显著的优势。然而,由于在数据挖掘方面存在不足,数据无法在市场上自由、顺畅地流通,数据的清洗与标注产业链尚不够完善等诸多问题的存在,导致优质数据集仍然处于相对稀缺的状态,这也在一定程度上制约了AI大模型的进一步发展与创新。

五、文生视频市场竞争态势剖析

在2023年期间,实际诞生的文生视频大模型数量多达数十个,其全球用户数量也突破了百万级别。不过,大多数此类视频模型尚处于产品发展的早期阶段,仍有极大的成长与完善空间。进入2024年,各大公司更是马不停蹄地持续加速文生视频模型的研发进程。自OpenAI推出Sora之后,国内外众多模型厂商纷纷效仿,逐步推出类似Sora的产品。在海外市场,有Runway、Pika、Luma、HaiperAI等知名企业积极布局;在国内,字节跳动、智谱AI、快手、爱诗科技、生数科技、商汤、智象未来等公司也不甘示弱,踊跃投身于这一领域的竞争。

依据智源研究院FlagEval在2024年8月发布的主观评测榜单显示,全球文生视频大模型排名前三的依次为OpenAISora、RunwayGen-3、字节跳动即梦。此外,在国内文生视频综合性能表现较为突出的模型还涵盖了快手可灵、爱诗科技PixVerse、科大讯飞星火绘镜等。根据最新的多方报道消息,字节跳动即梦AI即将率先上线其视频生成模型PixelDance,并且其具体上线时间会早于OpenAI的Sora正式发布时间。据Runway联合创始人CristóbalValenzuela在11月9日透露,OpenAI计划在大约两周内正式发布Sora。

快手可灵大模型是由快手AI团队自主研发而成,其采用了与Sora相似的技术路线,并巧妙结合了多项自研技术创新成果。内部评测数据表明,快手可灵1.5模型相较于可灵1.0模型,整体效果实现了高达95%的显著提升。科大讯飞星火绘镜则是科大讯飞精心打造的AI短视频创作平台,该平台能够极为便捷地让用户依据文字描述生成短视频内容,可将文本精准转换为视频分镜,并进一步扩展成完整的短视频作品。爱诗科技的海外版PixVerse已然成为全球用户数量最多的国产AI视频生成产品,并且成功搭建起了一个稳定且富有活力的创作者生态体系,其国内版PixVerse也已于3月上线开展内测工作。在11月,智谱AI郑重宣布旗下AI视频生成产品“清影”进行全面升级优化,成功实现了从纯视觉生成跨越至“有声视频”的新阶段。

就当前形势而言,国内外的大模型在视频时长、分辨率、画面比例切换等功能以及性能指标方面与Sora的差距正在逐步缩小,甚至在部分功能领域已经实现了赶超,文生视频市场竞争愈发激烈且呈现多元化发展态势。

六、Sora在应用端的广泛影响与变革

文生视频领域的迅猛发展有力地推动了生成式AI在应用端的落地生根与蓬勃发展。从应用端的视角来看,Sora的问世对诸多行业均产生了意义深远且具有变革性的影响,其中涵盖了影视视频、游戏、广告、教育、电商、制造、建筑、艺术创作、医疗等多个重要领域。

Sora与影视视频

Sora有望大幅降低影视制作的门槛与成本,并且能够极大地丰富影视作品的创造性与风格多样性。其出现无疑将对影视行业进行深度重塑,那些拥有核心导演或创意人才以及丰富IP资源的厂商在这一变革浪潮中将占据先发优势。例如,昆仑万维发布了全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。该平台集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成等多功能于一体,能够让创作者轻松实现“一键成剧”,便捷地制作出高质量的AI视频作品。当虹科技的AIGC视频内容智能生成系统巧妙融合了大模型技术,能够助力用户在新闻传播视频内容创作等多个领域中高效创作出优质视频内容。捷成股份自主研发的AI智能创作引擎ChatPV于7月29日正式上线公测,此次开放公测的ChatPV提供了影视二创、一键成片、数字人、文生视频等一系列AI智能视频创作功能。

Sora与游戏行业

游戏作为虚拟世界的一种典型体现形式,Sora对于物理世界的理解与模拟能力能够与游戏场景开发实现高度适配。它可以被广泛应用于游戏角色创立、场景开发等关键过程之中,从而有效降低游戏开发成本。

... ...

其中包括600***、002***、300***等Sora概念股。

扫码回复“机构研选-Sora”查看全文。

展望未来,随着模型规模的持续增大,模型参数将进一步放大,多模态大模型也将陆续推出,这必将引发对算力需求呈指数级的急剧提升,无论是在模型训练还是推理环节均是如此,并且在众多场景应用中也将带来颠覆性的革命变革,重塑各个行业的发展格局与竞争态势。

免责声明

陕西巨丰投资资讯有限责任公司(以下简称"巨丰投顾")出品的所有内容、观点取决于市场上相关研究报告作者所知悉的各种市场环境因素及公司内在因素。盈利预测和目标价格的给予是基于一系列的假设和前提条件,因此,投资者只有在了解相关标的在研究报告中的全部信息基础上,才可能对我们所表达的观点形成比较全面的认识。


巨丰投顾出品内容仅为对相关标的研究报告部分内容之引用或者复述,因受技术或其它客观条件所限无法同时完整提供各种观点形成所基于的假设及前提等相关信息,相关内容可能无法完整或准确表达相关研究报告的观点或意见,因而仅供投资者参考之用,投资者切勿依赖。任何人不应将巨丰投顾出品内容包含的信息、观点以及数据作为其投资决策的依据,巨丰投顾发布的信息、观点以及数据有可能因所基于的研究报告发布日之后的情势或其他因素的变更而不再准确或失效,巨丰投顾不承诺更新不准确或过时的信息、观点以及数据,所有巨丰投顾出品内容或发表观点中的信息均来源于已公开的资料,我公司对这些信息的准确性及完整性不作任何保证。巨丰投顾出品内容信息或所表达的观点并不构成所述证券买卖的操作建议。


相关内容版权仅为我公司所有,未经书面许可任何机构和个人不得以任何形式转发、翻版、复制、刊登、发表或引用。

巨丰投顾
巨丰投顾为您提供每日市场交易点评、操作策略预判等资讯类服务。新增免费诊股服务,发送“股票名称+您的问题”即可免费体验。陕西巨丰投资资讯有限责任公司创立于1997年,证券投资咨询资格证书编号:ZX0057。
 最新文章