2月16日那天深夜我恰巧还没入睡,第一时间经历了Open AI突然放个大招,以及围观了Sam在社交媒体上与粉丝互动,使用Sora即时生成视频,和一众围观群众颅内高潮,High到早上才睡着。
这几天被各种Sora相关的自媒体内容狂轰乱炸,大量碎片化的、噱头唬人的、以及缺乏深度思考的各种观点泛滥。老实说,目前看到Sora相关的自媒体信息都有些应激性疲乏,基本不会点击打开任何介绍Sora的媒体文章。
但不管如何,目前尚未看到严谨、深度、硬核的分析文章,需要出现一篇至少达到张俊林老师的《通向AGI之路:大型语言模型(LLM)技术精要》这篇文章的质量水平,以及微软研究院出品的,类似《Sparks of Artificial General Intelligence: Early experiments with GPT-4》这篇论文水准的研究报告。
除此之外,应该围绕OpenAI发布的Sora技术报告《Video generation models as world simulators》为第一研究资料,以及所引用的32篇相关论文,并由此展开。至于Meta首席AI科学家,Yann LeCun在X上对Sora的各种抨击言论,在其没有发表Sora的深度报告之前,也不必放在心上,没有必要被国内的信息二道贩子,搬运过来制造焦虑获取流量,因为99%的媒体信息都是噪音。
因此,在全球科研界尚未弄清楚Sora的完整技术原理,以及将其复现成功的窗口期,我梳理了 Sora 背后引用的 32 篇论文,从思维导图到 32 篇论文每一页的全局展开,当前该版本有助于对诸技术路线形成全局基本认识,避免当前普遍存在的碎片化交流与泛泛而谈。
眼下对于任何人,这一模型都值得进一步深度研究,因此构建一个深度研究的基础空间,方便各位读者Do Your Own Research,有助于各位读者在颠覆性模型的诞生初期,构建一个硬核干货的研究基础,与各类泛泛而谈的兴趣爱好者拉开距离,避免被不具备深度思考能力的平庸之辈拉低认知,导致你错过当前的最优深度学习窗口期;
https://boardmix.cn/app/share/CAE.CMuUng0gASoQYAg7FqOjIkUItryBrwOqqzAGQAE/GJhP9X
点击链接加入boardmix中的文件「Sora深度研究空间-1.0版本」,当前版本将会随着研究内容的展开而逐步按版本迭代;
模块1:展示32篇引用论文,包括论文链接
模块2:将32篇论文进行平铺展示,预览全局主题
模块3:将32篇论文中的每一页展开,构成论文内容全局展开,可以通过缩放快速预览论文的详情内容
one more thing......