Sora年内发布无望？视频生成还有戏吗？

科技 2024-09-13 16:58 浙江

转自：新智元

Sora深陷研究困境？

Sora在今年二月发布后，至今还是「期货」，为何迟迟不开放呢？

就在最近，外媒CNBC曝出，OpenAI的Sora模型之所以鸽了这么久，原因在于「和政策制定者的对话」。

早在2月底，彭博社就曾报道，考虑到今年的美国大选，OpenAI希望竭力避免安全风险。

此外还有一个原因，就是当时的Sora在技术上尚未准备好发布。

「期货」迟迟不兑现，背后原因复杂

Sora横空出世以来，后继者爆发成山，但它还从未真正全面开放。

OpenAI官方账号时不时便会放出，一段艺术家们用Sora生成的视频。

这不，最新视频中，一位新加坡艺术家Niceaunties，用Sora尝试了一个「衰老、美丽、自由和乐趣」主题的项目。

Niceaunties为其命名「阿姨的鸡蛋」。

另一个新视频是由居住在伦敦的韩裔艺术家David Sheldrick，用Sora创作的一个时装秀展。

看后的网友，纷纷表示惊艳。甚至，有人还将其描述为一场艺术运动的诞生。

对于许多人来说，也只能望梅止渴，OpenAI Sora还只是艺术家们手里的工具。

显而易见的是，AI视频模型中，诸如Runway Gen-3 Alpha、Dream Machine，以及国产爆火视频模型，不仅接近Sora实力，还可以免费用。

就连，Midjourney准备官宣AI视频模型。

OpenAI迟迟不发，究竟是何原因？

外媒称，Sora可能在研究上陷入了困境。一方面是必须要和政府深入探讨安全风险；另一方面则亟需好莱坞和艺术家们的入驻合作。

有网友对此猜测，Sora必须接受审查才能放出。

另一方面，OpenAI用YouTube数据训练模型，面临相关的潜在法律问题，也是一个因素。

3月，OpenAI首席技术官Mira Murati在接受彭博采访时，对Sora使用YouTube数据训练，语焉不详。

她只是表示，「我们用的是公开可用的数据，以及经过授权许可的数据」。

随后的YouTube首席执行官Neal Mohan在采访中，却对这种可能性提出了警告。

Murati曾表示，可以肯定的是，Sora将在今年发布。只不过首先需要降低生成的成本，目前Sora要比现有的其他AI系统昂贵得多。

虽不公开，但艺术家纷纷获得试用

Sora发布以来，能够拿到内测资格的好莱坞艺术家们，早就呈现了OpenAI未来想要重点发力的方向。

3月，OpenAI先是放出了首批七位艺术家们，用Sora生成的视频。

比如，令许多人印象深刻的「气球人」励志短片。

紧接着5月，编剧兼导演Paul Trillo发布了首支用Sora制作的官方MV。

为了制作这段4分钟视频，他肝了6周，一共生成了多达700个片段，并最终从其中挑选55个成片。

不仅面向好莱坞，OpenAI还向电影制片厂、媒体高管、经纪公司「推销」Sora，希望电影制作人将其应用在作品制作中。

测试Sora模型的一位导演Ashton Kutcher预计，它将对电影行业产生深远影响。

最新报道中，OpenAI正在与纽约市美术馆合作，向艺术家们提供Sora的访问权限，以参加这次的Strada画廊展出。

据介绍，Strada Nuova: New Road艺术展，为期三周。

许多艺术家、研究人员、学者、以及物理与数字艺术交叉的创意人士，都将前来参展。

策展人Paul Hill表示，大约6个月前，便与OpenAI展开合作，向艺术家们提供可访问的AI工具。

其中，不仅包括Sora视频生成器，还有Voice Engine语音生成器、Dall-E 3图像生成器、ChatGPT，以及教育资源和艺术家津贴。

一位跨学科的艺术家Minne Atairu，过去4年里一直在探索AI工具在艺术中的应用。

她使用AI生成2D/3D图像，以及视频等作品，聚焦于黑人历史档案中，未被充分研究的领域。

在这次展览中，Atairu用Sora生成了Regina Gloriana视频，灵感源自上世纪90年代，尼日利亚制作的超自然恐怖电影。

Sora开发者认为，该模型现在的水平，相当于早期的GPT-1。就像GPT-1证明了语言模型可以Scaling一样，Sora可能像GPT系列，逐渐获得新的、意想不到的能力。

由此，进一步Scaling视频生成式AI模型，可能会带来革命性的新应用。

不过，值得注意的是，GPT-1很早就出现了，直到GPT-3之后才真正开启商业计划之路。

高盛刚撤回「AI泡沫」言论，却又误读「ChatGPT崩盘」

除了无限鸽下去的Sora，OpenAI最近还有别的坏消息。

高盛的一份报告，错误解读了ChatGPT流量的下降，这直接加剧了人们对AI股票的负面情绪，开始纷纷抛售！

最近，高盛分析师Peter Oppenheimer发布了一份报告。

报告中的一张图表显示，ChatGPT的流量在最近几个月以来直线下降。

紧接着，《金融时报》转载了这张图表。

这下好了，金融市场十分敏感的「AI泡沫」故事，又有了新素材。

大家对AI股票的负面情绪，再一次被引爆！

然而，这次，属实是金融圈太过一惊一乍了。

仔细看这位高盛分析师的报告，有一个大bug。

仔细看，分析师引用了Similarweb的数据，但却并未考虑到OpenAI最近将域名从「chat.openai.com」更改为「chatgpt.com」的情况。

域名这么一改，「chat.openai.com」的流量自然就会下降了。

实际上，如果去看Similarweb自身的数据，就会发现完全不是这样。

Similarweb的每月AI服务显示，ChatGPT实现了66.2%的同比增长，依旧是迄今为止最受欢迎的生成式AI应用。

Claude和Perplexity这样的竞争对手仍在苦苦追赶，但尚未追上ChatGPT。

ChatGPT的全球用户正在迅速增长：从2022年11月到2024年7月，桌面和移动访问量激增，在6月和7月达到近25亿次访问的峰值

而其他指标，也显出了对OpenAI服务的强劲需求。

OpenAI最近宣布，公司的每周活跃用户已经达到了2亿人，是2022年11月的两倍。

不仅如此，通过API使用OpenAI模型的情况，也在增加。

使用OpenAI模型的微软应用，比如Github Copilot，增长态势也都一片大好。

可以说，如果我们要盘点OpenAI面临的挑战，安全研究员的出走、高昂的成本肯定在列。

但要说需求不足，那绝对不符合事实。

最近的一项分析表明，OpenAI今年的收入，可能会达到35亿到45亿美元。

对于一家2022年底才开始认真进行商业运营的公司来说，这个数据令人印象深刻。

不过，这背后的成本，却高达85亿美元。

「投入过多，收益过少」续集来了

而最近，高盛也特别强调：我们并不是反对生成式AI！

在6月，高盛曾发布过一份报告，名为「生成式AI：投入过多，收益太少？」。

这可能给人造成了误解，让人以为高盛在唱衰AI。

实际上他们只是提出问题而已——注意，句子后面有个问号。

为了澄清，最近高盛分析师Peter Oppenheimer及其团队发布了续篇，更深入地讲解了他们理解的所谓「科技的理性繁荣」。

在报告中，他们是这样分析的——

自2010年以来，科技行业创造了全球股权回报的32%和美国股市回报的40%。这反映了更强的基本面，而非非理性的繁荣。

全球科技行业的每股收益增长了约400%，而其他所有行业加起来，即使算上金融危机前的峰值，也仅仅实现了约25%的增长。

这么看来，高盛并不认为AI是泡沫，不过，其中仍带有一丝警告意味。

任何好的故事，都带有其他危险性。

它可能会过度放大兴趣，以至于垄断了投资者的注意力，还会牺牲其他机会，导致人们对未来利润产生不切实际的期望，这容易让公司急剧降级。

而颠覆性的技术，几乎总是经历繁荣-萧条-再繁荣的过程。

在最初的泡沫破裂后，追逐机会主义的跟风者被淘汰，大公司才会做出真正有用的事。

高盛表示，每个周期都会出现相同的风险和机遇——

从历史上看，投资者往往过度关注创新者；他们低估了利用他人资本进入行业、借此开发新产品和服务的新公司，也会低估非科技行业利用技术上产生更高回报的机会。

幸存者在死者的骨头上犁地。在高盛看来，最初投资浪潮和资本支出，所留下的基建，为新产品和新服务做了铺垫。

人工智能的泡沫，与其他领域并不完全相同。

因为，大多数主导公司，皆是从之前泡沫中脱颖而出的「赢家」。

这些科技巨头，通过广告盈利，也就意味着会有源源不断大量投入资本支出。

高盛认为，尽管投入巨大，但AI领域的发展仍存在巨大不确定性。也就是，其他新玩家未来也有机会，在AI发展中取得一席之地。

当前AI领域的赢家「护城河」相当显著，估值也不像泡沫，但该领域的新专利数量正在迅速增长，这表明新的竞争者将会出现，成本将会下降。

超大企业拥有雄厚实力投资AI模型的能力，但成本更低的开源替代方案，正在快速涌现。世界最大开源平台HuggingFace已有大约65万个模型。这表明，大规模投资的增长和有竞争力的模型，正在AI领域涌现，正如之前几波技术浪潮中所发生的那样。

高盛补充道，正如竞争常常被低估一样，创新资本支出的回报通常被高估，因为随着时间的推移，技术的边际成本会下降，产能会增加。

比如在互联网的早期阶段，电信公司曾被认为是赢家。

跟更具投机性、无利可图的互联网公司相比，它们似乎是更「安全」的带来财富的途径。

但最终赢家，一定是那些能够「搭便车」来利用支出和产能，从而构建商业模式的公司。

许多这样的公司，直到2006年智能手机和应用程序的出现，才浮出水面，随后催生出一个个发展壮大的平台公司、共享出行、社交媒体。

总之，生成式AI不是泡沫。

不过，在高盛看来，今天的AI赢家，不会再是轻资产行业。

AI正在推动一场重大的资本支出热潮，而且让15年来的高回报率不再，当前的估值也暗示了，这种情况仍将持续。

而且，目前尚无证据表明，像ChatGPT这样的先行者，具备持续的商业成功能力。

另外，科技本质上就有通缩性。

这可能有助于躲避反垄断审查，但并不利于维护利润率。

所以，高盛给投资者的建议是，投资应该更加多元化，不要一味多买英伟达的股票。

参考资料：

https://the-decoder.com/goldman-sachs-blunder-adds-to-ai-stock-sell-off/

https://the-decoder.com/openais-sora-video-ai-is-stuck-in-research-limbo-as-the-company-courts-hollywood-and-policymakers/

https://www.cnbc.com/2024/09/06/openai-gives-artists-access-to-sora-for-new-york-gallery-exhibit.html

https://www.ft.com/content/4e30b80e-ce06-40dd-86a9-139d0faff65d

机器学习实验室

专注于机器学习和深度学习技术与实践。

最新文章

245个目标检测开源项目合集，建议收藏！

制作个人的第一个RAG demo！

谷歌版Sora发布：最大对手竟是「可灵」，OpenAI反而最拉胯

NeurIPS 2024 | Ilya重磅演讲：预训练将结束，接下来是超级智能「自我意识」

多模态融合，顶会超神了！

今夜凌晨，OpenAI Sora炸裂登场！网页版已经挤爆

LSTM卷土重来！xLSTM和Vision-LSTM共同引领文艺复兴

“让AI不再难学"，知名UP主梗直哥的《破解深度学习》来了！

全球五大巨头GPU总量曝光！谷歌第一微软第二！

245个目标检测开源项目合集，建议收藏！

《深度学习图像分割》第4章：基于编解码结构的分割网络

RAG还是微调，怎么选？

吴恩达：每个AI从业者都应该关注Agent！

Flux已成当下最火热的文生图模型？

计算机视觉顶尖期刊和会议有哪些？

被导师放养，后果可能很严重。。。

两张3090复现SearchGPT！

啥工作量？！60天就卷出一篇CCF-A顶会...

AlphaFold3重磅开源，诺奖级AI颠覆世界！GitHub斩获1.8k星，本地即可部署

《深度学习图像分割》第3章：图像分割关键技术组件

涨点神器！100个即插即用缝合模块【合集下载】

导师一个idea都没有，怎么发CCF-A？

《深度学习图像分割》第2章：传统图像分割算法

ChatGPT变身AI搜索引擎免费用！

大模型可解释性怎么搞？(附代码)

新扩散模型OmniGen一统图像生成！

国内首本大模型推荐系统著作来了！

只要敢捞“偏门”，篇篇都是顶会顶刊！

245个目标检测开源项目合集，建议收藏！

NeurIPS'24大模型LoRA超级变体！仅需参数0.4%达微调效率巅峰！

Windows用户也能使用桌面版ChatGPT了！

发论文别太老实，用对方法篇篇都是顶会顶刊！！！

OpenAI王炸来了！强化学习也有scaling law？

预告 | 《深度学习图像分割》将在GitHub逐步内容开源！

算法岗和开发岗有什么区别？

算法岗就业，Kaggle金牌和CCF-A一作哪个更有用？

82个即插即用的深度学习缝合模块！

Llama 3.2 来了！支持图像推理，还有可在手机上运行的版本

张俊林详细拆解o1：OpenAI o1完整训练过程逆向推演

对标Claude Artifacts！OpenAI canvas一夜封神！

首个Mamba+Transformer混合架构多模态大模型来了！

在深度学习中，是否应该打破正负样本1:1的迷信？