Sora年内发布无望?视频生成还有戏吗?

科技   2024-09-13 16:58   浙江  
转自:新智元

Sora深陷研究困境?
Sora在今年二月发布后,至今还是「期货」,为何迟迟不开放呢?
就在最近,外媒CNBC曝出,OpenAI的Sora模型之所以鸽了这么久,原因在于「和政策制定者的对话」。
早在2月底,彭博社就曾报道,考虑到今年的美国大选,OpenAI希望竭力避免安全风险。
此外还有一个原因,就是当时的Sora在技术上尚未准备好发布。

「期货」迟迟不兑现,背后原因复杂


Sora横空出世以来,后继者爆发成山,但它还从未真正全面开放。
OpenAI官方账号时不时便会放出,一段艺术家们用Sora生成的视频。
这不,最新视频中,一位新加坡艺术家Niceaunties,用Sora尝试了一个「衰老、美丽、自由和乐趣」主题的项目。
Niceaunties为其命名「阿姨的鸡蛋」。
另一个新视频是由居住在伦敦的韩裔艺术家David Sheldrick,用Sora创作的一个时装秀展。
看后的网友,纷纷表示惊艳。甚至,有人还将其描述为一场艺术运动的诞生。
对于许多人来说,也只能望梅止渴,OpenAI Sora还只是艺术家们手里的工具。
显而易见的是,AI视频模型中,诸如Runway Gen-3 Alpha、Dream Machine,以及国产爆火视频模型,不仅接近Sora实力,还可以免费用。
就连,Midjourney准备官宣AI视频模型。
OpenAI迟迟不发,究竟是何原因?
外媒称,Sora可能在研究上陷入了困境。一方面是必须要和政府深入探讨安全风险;另一方面则亟需好莱坞和艺术家们的入驻合作。
有网友对此猜测,Sora必须接受审查才能放出。
另一方面,OpenAI用YouTube数据训练模型,面临相关的潜在法律问题,也是一个因素。
3月,OpenAI首席技术官Mira Murati在接受彭博采访时,对Sora使用YouTube数据训练,语焉不详。
她只是表示,「我们用的是公开可用的数据,以及经过授权许可的数据」。
随后的YouTube首席执行官Neal Mohan在采访中,却对这种可能性提出了警告。
Murati曾表示,可以肯定的是,Sora将在今年发布。只不过首先需要降低生成的成本,目前Sora要比现有的其他AI系统昂贵得多。

虽不公开,但艺术家纷纷获得试用


Sora发布以来,能够拿到内测资格的好莱坞艺术家们,早就呈现了OpenAI未来想要重点发力的方向。
3月,OpenAI先是放出了首批七位艺术家们,用Sora生成的视频。
比如,令许多人印象深刻的「气球人」励志短片。
紧接着5月,编剧兼导演Paul Trillo发布了首支用Sora制作的官方MV。
为了制作这段4分钟视频,他肝了6周,一共生成了多达700个片段,并最终从其中挑选55个成片。
不仅面向好莱坞,OpenAI还向电影制片厂、媒体高管、经纪公司「推销」Sora,希望电影制作人将其应用在作品制作中。
测试Sora模型的一位导演Ashton Kutcher预计,它将对电影行业产生深远影响。
最新报道中,OpenAI正在与纽约市美术馆合作,向艺术家们提供Sora的访问权限,以参加这次的Strada画廊展出。
据介绍,Strada Nuova: New Road艺术展,为期三周。
许多艺术家、研究人员、学者、以及物理与数字艺术交叉的创意人士,都将前来参展。
策展人Paul Hill表示,大约6个月前,便与OpenAI展开合作,向艺术家们提供可访问的AI工具。
其中,不仅包括Sora视频生成器,还有Voice Engine语音生成器、Dall-E 3图像生成器、ChatGPT,以及教育资源和艺术家津贴。
一位跨学科的艺术家Minne Atairu,过去4年里一直在探索AI工具在艺术中的应用。
她使用AI生成2D/3D图像,以及视频等作品,聚焦于黑人历史档案中,未被充分研究的领域。
在这次展览中,Atairu用Sora生成了Regina Gloriana视频,灵感源自上世纪90年代,尼日利亚制作的超自然恐怖电影。
Sora开发者认为,该模型现在的水平,相当于早期的GPT-1。就像GPT-1证明了语言模型可以Scaling一样,Sora可能像GPT系列,逐渐获得新的、意想不到的能力。
由此,进一步Scaling视频生成式AI模型,可能会带来革命性的新应用。
不过,值得注意的是,GPT-1很早就出现了,直到GPT-3之后才真正开启商业计划之路。

高盛刚撤回「AI泡沫」言论,却又误读「ChatGPT崩盘」


除了无限鸽下去的Sora,OpenAI最近还有别的坏消息。
高盛的一份报告,错误解读了ChatGPT流量的下降,这直接加剧了人们对AI股票的负面情绪,开始纷纷抛售!
最近,高盛分析师Peter Oppenheimer发布了一份报告。
报告中的一张图表显示,ChatGPT的流量在最近几个月以来直线下降。
紧接着,《金融时报》转载了这张图表。
这下好了,金融市场十分敏感的「AI泡沫」故事,又有了新素材。
大家对AI股票的负面情绪,再一次被引爆!
然而,这次,属实是金融圈太过一惊一乍了。
仔细看这位高盛分析师的报告,有一个大bug。
仔细看,分析师引用了Similarweb的数据,但却并未考虑到OpenAI最近将域名从「chat.openai.com」更改为「chatgpt.com」的情况。
域名这么一改,「chat.openai.com」的流量自然就会下降了。
实际上,如果去看Similarweb自身的数据,就会发现完全不是这样。
Similarweb的每月AI服务显示,ChatGPT实现了66.2%的同比增长,依旧是迄今为止最受欢迎的生成式AI应用。
Claude和Perplexity这样的竞争对手仍在苦苦追赶,但尚未追上ChatGPT。

ChatGPT的全球用户正在迅速增长:从2022年11月到2024年7月,桌面和移动访问量激增,在6月和7月达到近25亿次访问的峰值
而其他指标,也显出了对OpenAI服务的强劲需求。
OpenAI最近宣布,公司的每周活跃用户已经达到了2亿人,是2022年11月的两倍。
不仅如此,通过API使用OpenAI模型的情况,也在增加。
使用OpenAI模型的微软应用,比如Github Copilot,增长态势也都一片大好。
可以说,如果我们要盘点OpenAI面临的挑战,安全研究员的出走、高昂的成本肯定在列。
但要说需求不足,那绝对不符合事实。
最近的一项分析表明,OpenAI今年的收入,可能会达到35亿到45亿美元。
对于一家2022年底才开始认真进行商业运营的公司来说,这个数据令人印象深刻。
不过,这背后的成本,却高达85亿美元。

「投入过多,收益过少」续集来了

而最近,高盛也特别强调:我们并不是反对生成式AI!
在6月,高盛曾发布过一份报告,名为「生成式AI:投入过多,收益太少?」。
这可能给人造成了误解,让人以为高盛在唱衰AI。
实际上他们只是提出问题而已——注意,句子后面有个问号。
为了澄清,最近高盛分析师Peter Oppenheimer及其团队发布了续篇,更深入地讲解了他们理解的所谓「科技的理性繁荣」。
在报告中,他们是这样分析的——
自2010年以来,科技行业创造了全球股权回报的32%和美国股市回报的40%。这反映了更强的基本面,而非非理性的繁荣。

全球科技行业的每股收益增长了约400%,而其他所有行业加起来,即使算上金融危机前的峰值,也仅仅实现了约25%的增长。

这么看来,高盛并不认为AI是泡沫,不过,其中仍带有一丝警告意味。
任何好的故事,都带有其他危险性。
它可能会过度放大兴趣,以至于垄断了投资者的注意力,还会牺牲其他机会,导致人们对未来利润产生不切实际的期望,这容易让公司急剧降级。
而颠覆性的技术,几乎总是经历繁荣-萧条-再繁荣的过程。
在最初的泡沫破裂后,追逐机会主义的跟风者被淘汰,大公司才会做出真正有用的事。
高盛表示,每个周期都会出现相同的风险和机遇——
从历史上看,投资者往往过度关注创新者;他们低估了利用他人资本进入行业、借此开发新产品和服务的新公司,也会低估非科技行业利用技术上产生更高回报的机会。
幸存者在死者的骨头上犁地。在高盛看来,最初投资浪潮和资本支出,所留下的基建,为新产品和新服务做了铺垫。
人工智能的泡沫,与其他领域并不完全相同。
因为,大多数主导公司,皆是从之前泡沫中脱颖而出的「赢家」。
这些科技巨头,通过广告盈利,也就意味着会有源源不断大量投入资本支出。
高盛认为,尽管投入巨大,但AI领域的发展仍存在巨大不确定性。也就是,其他新玩家未来也有机会,在AI发展中取得一席之地。
当前AI领域的赢家「护城河」相当显著,估值也不像泡沫,但该领域的新专利数量正在迅速增长,这表明新的竞争者将会出现,成本将会下降。

超大企业拥有雄厚实力投资AI模型的能力,但成本更低的开源替代方案,正在快速涌现。世界最大开源平台HuggingFace已有大约65万个模型。这表明,大规模投资的增长和有竞争力的模型,正在AI领域涌现,正如之前几波技术浪潮中所发生的那样。
高盛补充道,正如竞争常常被低估一样,创新资本支出的回报通常被高估,因为随着时间的推移,技术的边际成本会下降,产能会增加。
比如在互联网的早期阶段,电信公司曾被认为是赢家。
跟更具投机性、无利可图的互联网公司相比,它们似乎是更「安全」的带来财富的途径。
但最终赢家,一定是那些能够「搭便车」来利用支出和产能,从而构建商业模式的公司。
许多这样的公司,直到2006年智能手机和应用程序的出现,才浮出水面,随后催生出一个个发展壮大的平台公司、共享出行、社交媒体。
总之,生成式AI不是泡沫。
不过,在高盛看来,今天的AI赢家,不会再是轻资产行业。
AI正在推动一场重大的资本支出热潮,而且让15年来的高回报率不再,当前的估值也暗示了,这种情况仍将持续。
而且,目前尚无证据表明,像ChatGPT这样的先行者,具备持续的商业成功能力。
另外,科技本质上就有通缩性。
这可能有助于躲避反垄断审查,但并不利于维护利润率。
所以,高盛给投资者的建议是,投资应该更加多元化,不要一味多买英伟达的股票。
参考资料:
https://the-decoder.com/goldman-sachs-blunder-adds-to-ai-stock-sell-off/
https://the-decoder.com/openais-sora-video-ai-is-stuck-in-research-limbo-as-the-company-courts-hollywood-and-policymakers/
https://www.cnbc.com/2024/09/06/openai-gives-artists-access-to-sora-for-new-york-gallery-exhibit.html
https://www.ft.com/content/4e30b80e-ce06-40dd-86a9-139d0faff65d

机器学习实验室
专注于机器学习和深度学习技术与实践。
 最新文章