没想到击败OpenAI的居然是谷歌

文摘   2024-12-17 09:16   广东  

 

今天又和前两天一样和朋友们一起的熬OpenAI的发布会,结果开始之前,突然有个哥们发了个链接,说别等什么OpenAI了。来看看谷歌!他们这波站起来了!来了个大的!

目前最先进的AI视频模型Veo 2,还有生图模型Imagen的最新版——Imagen 3 

 

 

半信半疑的点开链接,woc!效果真好啊! 

废话不多说,直接带大家看效果! 

 

AI视频生成模型Veo 2 :

下面是官方Blog给的几个例子,大家可以看一下,非常惊艳 


女科学家:

Prompt:电影镜头中,一名身穿深黄色防护服的女医生,被实验室刺眼的荧光灯照亮。镜头慢慢拉近她的脸,轻轻摇摄,强调她眉宇间刻画的忧虑和焦虑。她弯腰伏在实验台上,全神贯注地盯着显微镜,戴着手套的手仔细调整焦距。场景的色调柔和,以防护服的病态黄色和实验室无菌钢为主,强调了情况的严重性和她所面临的未知的重量。浅景深聚焦于她眼中的恐惧,反映出她所承受的巨大压力和责任。



蜂农:
Prompt:相机轻轻地飘过一排排粉刷过的木制蜂箱,嗡嗡作响的蜜蜂在画面中进进出出。动作落在站在中心的优雅农民身上,他洁白的养蜂服在金色的午后阳光下闪闪发光。他举起一罐蜂蜜,稍微倾斜以捕捉光线。在他身后,高大的向日葵在微风中有节奏地摇曳,花瓣在温暖的阳光下闪闪发光。相机向上倾斜,露出一座复古的农舍,带有薄荷绿色的百叶窗,墙壁上点缀着摇曳的树木的阴影。使用 35 毫米镜头在柯达 Portra 400 胶片上拍摄,金色的光线在农民的手套、果酱罐和蜂箱的风化木材上创造出丰富的纹理。


煎饼:
Prompt:太阳在摆盘完美的早餐场景后缓缓升起。浓稠的金色枫糖浆以慢动作倒在松软的煎饼上,每个煎饼都散发出柔软温暖的蒸汽云。特写镜头中,脆培根发出嘶嘶声,金色油脂的细小余烬飘向空中。咖啡以顺滑的旋转动作倒入水晶般透明的杯子中,杯子里充满了深棕色的咖啡油脂层。场景结束时,相机俯冲到新鲜切好的橙子上,以令人惊叹的微距细节展示出其明亮多汁的果肉。


然后是一些来自网友的例子 


未来足球赛: 

Prompt:来自未来的足球


调酒师: 

Prompt:一名调酒师正在调制老式鸡尾酒。


深海宇航员: 

Prompt:宇航员探索水下外星人沉船



可以看到Veo2的表现非常惊艳!给我的感觉不亚于三月份第一次看到Sora的时候 

但Sora正式发布之后的那个样子。。。。 

 

Veo 2 可以创建具有逼真运动和高质量输出的视频,分辨率高达 4K。 

 

 

它可以遵循简单和复杂的指令,并令人信服地模拟真实世界的物理现象以及各种视觉风格。与其他 AI 视频模型相比,它在细节、真实感和伪影减少方面有显著改进。 

 

 

由于其对物理学的理解和遵循详细指令的能力,它可以高度准确地表示运动。它可以精确地解释指令,以创建各种拍摄风格、角度、动作以及所有这些的组合。 

在人类评审员对顶级视频生成模型输出的面对面比较中,它取得了最先进的结果。它在整体偏好和准确遵循提示的能力方面表现最佳。 

 

没想到我们的Kling和MiniMax都已经成为评测对象了 

 

创建逼真、动态或复杂的视频,并在整个复杂场景或具有复杂运动的场景中保持完整的一致性仍然是一个挑战。 

 

AI图像生成Imagen 3 :

除了视频模型Veo 3 3之外,Google这次还一起发布了他们的生图模型Imagen 3  

 


 

 

有的朋友可能感觉不对。我怎么记得Imagen 3 已经发过了?! 

 

是的,你没有记错,第一代Imagen 3 是在今年的谷歌的I/O开发者大会上(2024年5月14日),现在的Imagen 3 其实是第二代,Imagen3-002。 

 

5月份的Google I/O其实还没有太大波澜


跑分非常抽象,直接横扫其他模型。  



目前可以在Gemini里面玩,或者去他们新的页面ImageFX里面(推荐这个),用谷歌账号登录就行了(废话,可不得用Google账号,你用百度人家也得同意啊) 

免费玩! 


 

他可以选择几个不同的宽高比,比如方形、16:9、3:4,以及质量选择(目前只能选最佳质量) 

 

 

如果你不知道Roll什么图,你既可以根据他给你预制的Prompt去生成,只需要按一下Tab。或者你也可以点击手气不错按钮,随机抽取的一个Prompt进行测试。 

 

我觉得最有意思的也最实用的就是ImageFX允许你随时调整Prompt里面的关键词,让你很方便的实现局部重绘。 

例如我这张图里的秘密花园,可以换成公园或者绿屋等关键词 


 

并且你可以调整局部的颜色,例如花可以换成黄色,红色等等  


 

总体来说这个生图产品ImageFX的设计我觉得是比较不错的,模型能力也很好。即使你Prompt很烂,也不会太差。 

例如我这个Prompt "一只猫跑起来了“ 



可以看到效果还是很好的,反正低质Prompt能稳稳接住。 


写在最后:

其实Google最近一段时间很猛,比某个只会开发布会却不发好东西的OpenAI强了不知道多少个Claude。

从Gemini2.0的Flash(别急,其他的在路上)

到现在的Veo2 和 Imagen 3-022

谷歌有点站起来的的意思,但其实OpenAI也有类似的大货。只是不知道为什么,一直不发。

求求你了快端上来吧!

别让等待,成为遗憾!



感谢您的观看🥹

我是Max,一个在AI方向持续探索的小学生。

01Founder会持续更新一些AI方向最新最快的产品,技术,思考

求各位看官点赞,关注,再看三连🙇

PS:如果有好的产品欢迎私戳我,

我会帮有价值的产品匹配它应有的价值。



01Founder
一群在0与1之间构建属于自己未来的人
 最新文章