超过Sora!谷歌发布Veo 2,支持4K、逼真到难以分辨

文摘   2024-12-17 02:20   河北  
今天凌晨1点,谷歌Deepmind发布了最新文生视频模型——Veo 2。

Veo 2可直接生成8秒4K视频,同时能根据用户对镜头类型、拍摄角度、电影效果等需求进行精准摄像头生成,包括低角度跟踪镜头、特写镜头等不同类型。
例如,18mm 镜头的广角效果、浅景深聚焦主体,这对于影视媒体制作人员来说帮助巨大。

此外,Veo 2具备很强的物理模拟效果,在动作一致性、光影处理、运动频率以及写真等方面非常优秀。

根据Veo 2的测试数据显示,在总体偏好方面达到了58.8%,大幅度超过了Sora Turbo、可灵1.5、Minimax、Meta Gen,而在文本语义还原方面,以58.2%同样超过了这些模型。基本上,Veo 2已经成为目前T0级别的视频模型。

以下是Veo 2生成的视频欣赏,细节、物理模拟、文本语义还原真的很好。

一个低角度的镜头捕捉到一群粉红色的火烈鸟在郁郁葱葱、宁静的泻湖中优雅地涉水。它们鲜艳的粉红色羽毛与周围植被的翠绿和清澈的碧蓝水面形成了美丽的对比。阳光在水面上闪烁,创造出在火烈鸟羽毛上跳动的闪亮倒影。鸟儿们优雅、弯曲的脖子浸入水中,行走在浅水里,她们的动作在泻湖中激起温柔的涟漪。构图强调了场景的宁静与自然美,突出了生态系统的微妙平衡以及这些宏伟鸟类固有的优雅。

一个电影般的镜头捕捉到了一只毛茸茸的可卡犬和贵宾犬的混种狗,坐在一个鲜艳的粉色火烈鸟浮枕上,位于阳光明媚的洛杉矶游泳池中。清澈的水在明亮的加州阳光下闪闪发光,映照出这幅充满玩趣的画面。可卡贵宾犬的毛发是柔和的白色和杏色混合,在金色阳光的映衬下显得格外醒目,柔软的耳朵在微风中轻轻摇曳。它快乐的表情和摇摆的尾巴传达出纯粹的喜悦和夏日的幸福。鲜艳的粉色火烈鸟增添了一丝奇趣,创造出一幅在洛杉矶阳光下无忧无虑的完美影像。

一个电影般的镜头中,一位穿着深黄色防护服的女医生被实验室刺眼的荧光灯照亮。镜头慢慢地拉近她的脸,轻轻地移动以强调她眉头上刻画的担忧和焦虑。她弓着身子伏在实验台上,目不转睛地看着显微镜,戴着手套的手小心地调整焦距。

场景的柔和色调,以病态的黄色防护服和实验室的无菌钢铁为主,突显了情况的严峻和她所面对的未知重压。浅景深聚焦于她眼中的恐惧,反映出她承受的巨大压力和责任。

太阳缓缓升起,照亮了一幅完美摆盘的早餐场景。浓厚金黄的枫糖浆慢动作淋在一叠松软的煎饼上,每块煎饼都冒出柔软温暖的蒸汽。
特写镜头展示酥脆的培根在滋滋作响,细小的金色油脂微粒飘散在空气中。咖啡以平滑旋转的动作倒入晶莹剔透的杯子,杯中充满了深褐色的奶油层。场景以镜头快速移向一颗新切的橙子结尾,展示其明亮多汁的果瓣,呈现惊艳的微距细节。

谷歌这波真的挺猛的,一个又一个惊喜。

老铁们,这个模型尝试了一下真的挺棒的。

这些生成的视频,看起来难以置信。

质量和物理模拟效果,令人惊叹!

非常棒的物理模拟效果,谷歌Deepmind正在快速崛起。

同时,今天谷歌还发布了文生图模型Imagen 3,能生成构图更好、光影更明亮的图像,能精准地呈现多种艺术风格,从写实、印象派、赛博朋克、抽象到二次元动漫等不同类型,文本语义还原也更加优秀,能渲染出更丰富的细节和纹理。

目前,Veo 2支持候补测试申请,Imagen 3已经全面推出使用,可以在谷歌的ImageFX直接使用。

本文素材来源谷歌,如有侵权请联系删除

END

AIGC开放社区
专注AIGC领域的专业社区,关注微软OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
 最新文章