OpenAI首席执行官Sam Altman添加了第十三天特别奖励——Sora。
他表示,为了迎接圣诞节,人们在12月底通常会放假休息,OpenAI的GPU就没有那么繁忙。所以,假期期间能为所有用户无限制的提供文生视频模型Sora,轻松跳过烦人的队列等待。
非常感谢!这真是很好的圣诞礼物。只希望Sora不会崩溃或者等待时间太长!
持续赠送礼物,真的感谢Sam。
这太棒了。我想尝试一些提示,但受到积分的限制。非常感谢你!
史诗级的礼物,感谢Sam。
没想到会有额外福利。是时候充分利用Sora生成视频了。
赶紧利用这段时间,用Sora制作更多的好视频。
但是什么时候在欧盟和西班牙,开放Sora使用权呢?
欧盟正在扼杀自身发展潜力。由于严格且不切实际的数据和AI法规,不满的情绪正在大幅度增长。
Sora是前不久OpenAI刚公测的文生视频模型,能通过文本直接生成最多20秒1080P视频,开放当天就因为使用人太多直接崩溃了。
Sora核心技术之一便是对Patch的应用,允许在大量的图像和视频数据上进行密集训练。从每一个存在的视频中剪出的Patch,可以被堆叠起来并输入到模型中。
这种基于Patch而非视频全帧的训练方式,使得Sora能够处理任何大小的视频或图片,无需进行裁剪。这不仅增加了用于训练的数据量,也提高了输出质量。
为了进一步提升效率和效果,Sora采用了视频压缩网络,这是一种专门设计用来降低视觉数据维度的神经网络。通过该网络,原始视频被转换成一个在时间和空间上都经过压缩的潜在表示。Sora在这个压缩后的潜在空间内接受训练,并学习如何生成新的视频内容。同时,还训练了一个解码器模型,用于将生成的潜在表示映射回像素空间,恢复为可视化的视频帧。
对于时空潜伏斑块,在获取压缩输入视频后,OpenAI 从中提取出一系列时空 Patch 作为转换标记。基于这种 Patch 表示法,Sora 得以在各类视频和图像数据上进行训练,无论是不同分辨率、时长还是长宽比的素材都能轻松应对。在推理阶段,通过在适宜大小的网格中合理排列随机初始化的 Patch,便能精准控制生成视频的尺寸规格。
目前,由于规则原因,有些地区可能无法直接访问Sora。
本文素材来源Sora,如有侵权请联系删除
END