新智元报道
新智元报道
【新智元导读】斯坦福天才少女,让AI视频的格局再次颠覆!Pika 2.0上线不久即引发全网狂潮,强大场景元素功能、超强文本对齐、深刻物理学理解,让它在AI视频大混战中脱颖而出,效果不输谷歌Veo 2.0。网友们疯狂实测,人手一部广告大片。
刚诞生不久的Pika 2.0,就已经在AI社区引发了新的轰动。
十一期间,Pika凭借万物皆可捏捏、融化和挤爆的网红特效,迅速在全网形成病毒式传播,引爆整个社交媒体。
一个月内,相关内容浏览量突破十亿,还引来大品牌Balenciaga、Fenty、Vogue的垂青。
现在,全新Pika 2.0来了!延续创意和社交特色的同时,还再次获得了三大重磅升级。
第一点,也是Pika 2.0最大的看点,就是新增的「场景元素」功能了。我们可以随意上传自己想要的角色、物体、服装、地点和场景设置,来创建想要的镜头。
其次,是在文本对齐上进行了前所未有的提升!在理解prompt细节和意图上,Pika 2.0可以说超越了所有AI视频,再复杂的提示词都不怕。
最后,Pika 2.0对于物理学也有了更深一层的理解,以往AI视频中的种种怪异动作,明显少了很多,动作看起来更加真实,更有可信度了。
有趣的是,Pika官号这样描述道:这次的发布,「相当于一次性收到了12天的礼物」。
Pika 2.0的诞生,正赶在几大AI视频巨头集中火拼的这几天。
憋了11个月终于姗姗来迟的Sora,实际效果让人大失所望,用户们直言它已跌落神坛。
谷歌的Veo 2,能更好地理解现实世界规律,还懂电影摄影语言,实测后被公认「碾压Sora」。
而Pika 2.0比之Veo 2,也完全不输。
而且跟Sora不同的是,Pika的这个节日礼物不仅针对专业人士,更是送给普通用户的。因为在定制化和输出控制上的颠覆性突破,所有人都能做出震撼AI大片了!
场景元素,重磅上线
Pika 2.0这次新登场的场景元素功能,具备惊人的一致性。
只要上传想要作为镜头成分的角色图图像,再添加prompt,就可以得到完全看不出破绽的视频。
无论是任何你想要的角色、物体、服装、场景,都将转化为场景的构建模块。
这是因为,Pika 2.0的高级图像识别功能,能直观理解每个参考图像的角色,将它们无缝结合在同一个镜头里。
从莫奈的睡莲池中出现,到电影院中吃爆米花,再到冰川中穿着豹纹大衣,每个视频的每个场景中,人物的脸始终保持着一致性,几乎没有任何破绽。
左右滑动查看下
想让自己飞起来吗?
输入自己的照片,加一段「一个男人在飞」的prompt,让自己瞬间飞翔。
想撸一下邻居的猫?那就输入自己和猫的照片,再来个prompt。
下一秒,你就开始美滋滋撸猫了。
甚至,还能骑着猫在路上溜达。
场景元素功能,让你可以和已经去世的祖母拍张合影。
或者和祖母手牵着手,走在一幅画中。
各种搞笑的表情包,可以p在自己的真实场景里了。
我们非常熟悉的着火小狗表情包,主角居然变成了奥特曼?
这个全新的功能,拍起广告大片来是so easy!人物、服装、香水,可以在不同场景中随机组合,效果惊艳。
和蒙娜丽莎合个影,和戴珍珠耳环的少女一起看电影,你可以随意放飞自己的想象。
甚至让祖母来拍香水大片广告。
尤为值得一提的是,在Pika 2.0生成的视频中,主体产品不仅和素材中的一模一样,而且也不会随着画面的变化而随意改变。
对于电商和广告领域的朋友们来说,可以说是新的「神器」了。
空中俯瞰,镜头缓缓推进,一只香水瓶在海浪中轻盈起伏,四周簇拥着盛放的花朵,画面氛围如梦似幻,朦胧而浪漫。
以后广告制作也能完全放心交给Pika 2.0了。一张背景图、一张模特图、外加一张服装图,三图瞬间完美合一。
看得出,整个画面氛围很有广告大片那味儿了。
文本对齐,物理世界理解超强
得益于Pika 2.0无与伦比的文本对齐能力,杂糅了如此多的的角色和物品之后,场景里的每个元素依然能保持原有的样子。
因为能准确反映文本提示的细节和意图,即使最复杂的提示,它都能生成不遗漏任何重要元素的视频,绝不会因为无法生成太有想象力的概念而崩溃!
这样一来,我们就可以按照内心所想实现任何想要的效果,而不用像之前那样大量「抽卡」了。
比如,把白人模特换成黑人之后,背景的影棚和身上的绿色皮草并没有发生改变。
再比如,模特向镜头喷洒香水,以及镜像迷宫中的重重倒影,Pika 2.0都理解得十分准确。
在极简的灰调空间内,点缀着几个圆球装置,一位身着华贵皮草的黑人模特优雅地向镜头喷洒香水,随即转身款款离去
一个人在镜像迷宫中小心探索,重重倒影扭曲了现实,让身影在虚实之间无限延展
而对物理学理解的加深,则会让画面中各个元素的动效更加符合自然规律,人物的动作也会更加自然。
其他AI视频中种种诡异的非正常动作,我们都见识过了。但Pika 2.0视频中的动作显然更加真实。
摄影机徐徐推进,镜头中一位端庄的黑人女性在幽静花园中品茗小憩,舒适惬意的神情,沉静思忖的姿态,与周遭恬淡的意境融为一体
昏暗的影院中,一对身着黑色皮夹克的观众正共享着一桶爆米花,他们目不转睛地注视着银幕,眼神中流露出全神贯注的专注
甚至让想象更狂野,让模特和高跟鞋一起飞在天上的云朵中。
阳光、云层、人物的飞行动作、大衣上毛随风摆动的样子,都十分符合现实物理世界的规律,因此,这种奇幻动作都更具有可信度。
在视觉效果上,Pika 2.0更是到达了全新的境界,完全到了「视频还是电影,傻傻分不清楚」的级别。
媲美Sora,重塑广告创意
从以上实例我们已经看到,升级版Pika在定制化、控制方面取得重大突破。
Pika 2.0创新不仅仅是技术的突破,更是为广告行业带来了无限的创意可能。
如今,巴黎世家、Fenty、Vogue在内的主要品牌,都已经利用Pika模型生成创意的社交广告。
传统上,广告制作往往需要高昂的成本,包括专业的团队、复杂的拍摄设备等因素。
而现在,Pika 2.0彻底颠覆了这一现状。
不同于OpenAI将Sora推向好莱坞主流制片场,Pika则是专注于为普通人,而非专业人士打造的一个AI视频平台。
对于个人,甚至是小团队来说,不需要投入巨额成本制作有吸引力的广告。
一个创意,一个文字提示,就能快速生成引人注目的视频内容。你还可以根据不同的目标受众群体,高度定制化视频内容。
不仅如此,从概念到成片,AI一般就在几分钟内完成,大大缩短了广告的制作周期。
这些优势就足以证明,Pika 2.0将会彻底颠覆广告创作的生态,在降低内容创作的门槛同时,打开了视频创意之钥。
对于创意工作者来说,这意味着前所未有的机遇。
这位网友,用Pika 2.0在30秒内做出了属于自己的广告大片,直言「游戏规则被改变!」
网友玩疯了
Pika 2.0一更新,网友们再次沸腾了。
有人说,Pika是自己在所有平台中,最喜欢的AI视频功能。
更让人惊喜的是,这次Pika官方提供了众多模板,让我们进行各种有趣的尝试。
动态的摄像机运动和对元素一致性的理解,让Pika用户可以随意创作自己的好莱坞电影片段。
这画面,和电影还有什么区别?
被惊艳的网友感慨道:Pika 2.0彻底改变了广告圈的工作流!试想一下,一旦实现了100%的对象一致性,威力将会多么巨大。
任何人都可以让自己秒变广告大片主角。
左右滑动查看
任何想要的元素,也都可以添加到视频里。
这位小哥,直接恶搞自己上瘾。
在X上,网友「farfetchd」用梵高和他的名作《星月夜》打造了长达一分钟的梦幻旅程。
梵高和戴着珍珠耳环的少女得以共舞,质量高到令人惊叹。
网友们迫不及待地把自己传送进各种奇幻的场景,在天空飞翔,骑着鳄鱼穿越亚马逊丛林,或者进入异形世界。
你可以和梅西一起坐在沙发上看足球赛。
更有人用它做出了一部动漫美学风格十分强烈的3分钟短片,角色一致性保持得很好,可以说是十分优秀的作品了。
还有人做出了十分可爱的黏土动画。
毫不意外,已经有宅男用Pika2.0,开始和自己的二次元老婆开始共舞了。
鉴于Pika 2.0已经如此优秀,我们似乎可以期待一波「Pika APP」的推出了!