今天咱们继续聊Sora,OpenAI最新的「震撼世界」的科技「玩具」。试想一下,当用户只需输入一段简单的描述,Sora就能生成一段逼真的视频画面,无论是人物的动作、表情,还是背景的细节,不能说与描述分毫不差,只能说是完全一样。这样的能力确实令人惊掉下巴。
提示词: 一位时尚的女士走在充满温暖发光的霓虹灯和动画城市标牌的东京街道上。她穿着一件黑色皮夹克、一件红色长裙和黑色靴子,还带着一个黑色钱包。她戴着太阳镜和红色口红。她自信而随意地走路。街道潮湿且有反射性,创造了五颜六色的灯光的镜面效果。许多行人走来走去。
见到这样的惊叹效果,看起来真像是「影视界的工业革命」。或许以后的抖音,不只是记录美好生活,更是记录「美好」的想象。这意味着影视创作将逐渐从人工劳作升级为机器生产,绝大部分人工成本转化为了机器成本,即机器(芯片)的损耗与能源的消耗。
当然,作为嗅觉最为灵敏的资本市场,热炒和过度反应总是少不了。英伟达的股价在Sora发布前夕,创下了历史新高。不过,这种预期有些过于乐观了。资本,赚的就是预期差的钱。
AIGC的演示效果确实炸裂,实际上对于生产力确实有不少提升,但跟想象中还是不一样的。它们更大的价值体现在是灵感创作与内容装填,到底能发挥多大的上限还是看人。以写文章为例,如果作者能提供有价值的观点输出,那么GPT会让他如虎添翼;反之,只能是一个空洞的凑字数工具。目前Sora的宣传价值远大于实际意义,胖胖会在文末讲述原因。
Sora好比一杆枪,数据是子弹,光有枪无法构成杀伤力。而造枪的难度,在于第一把枪的问世,后续的模仿并没有想象中那么难,它只是需要一些时间。对于美国而言,这杆枪确实有着特殊的意义以及更为强大的效果。毕竟美国掌握着全球最具影响力的媒体资源,有了Sora这样的技术,可进一步彰显其在科领域的巨大优势,同时也在互联网媒体上巩固了其文化传播与意识形态输出的霸权。如果你不想未来被大洋彼岸输出的信息所包围而不知真假,那你就要有自己的AIGC宣发机器。
所以,现阶段的AI比拼不仅是科技战,也是宣传战。表面上看它是人类与机器的竞争,本质上是文明与意识形态在新时代的对抗。失去了AI,在互联网上就失去了文明的踪迹。保住最纯粹的数据不被(虚假数据)污染,就是留下文明的数字火种。
当然,我们永远都有另一种选择——把网掐了,回归现实。
问:为什么说Sora的宣传价值大于实际意义?
胖胖:如果想认认真真做好「文字生成视频」的AI、甚至所谓的通用AGI,必须区分出「物理引擎」和「社会引擎」进行研发、训练与协作。前者关心的是物理世界的设定与模拟,后者关注点在于人类社会中不同文化与意识形态下的创作。物理引擎才是使影视创作生产力爆发的核心,社会引擎则是上层建筑。揉在一起的训练,看起来唬人,在实际应用中的上限并不高,很快就会遇到创作瓶颈。当然,技术本身的突破还是值得肯定的。