超过Sora！谷歌发布Veo 2，支持4K、逼真到难以分辨

文摘 2024-12-17 02:20 河北

今天凌晨1点，谷歌Deepmind发布了最新文生视频模型——Veo 2。

Veo 2可直接生成8秒4K视频，同时能根据用户对镜头类型、拍摄角度、电影效果等需求进行精准摄像头生成，包括低角度跟踪镜头、特写镜头等不同类型。

例如，18mm 镜头的广角效果、浅景深聚焦主体，这对于影视媒体制作人员来说帮助巨大。

此外，Veo 2具备很强的物理模拟效果，在动作一致性、光影处理、运动频率以及写真等方面非常优秀。

根据Veo 2的测试数据显示，在总体偏好方面达到了58.8%，大幅度超过了Sora Turbo、可灵1.5、Minimax、Meta Gen，而在文本语义还原方面，以58.2%同样超过了这些模型。基本上，Veo 2已经成为目前T0级别的视频模型。

以下是Veo 2生成的视频欣赏，细节、物理模拟、文本语义还原真的很好。

一个低角度的镜头捕捉到一群粉红色的火烈鸟在郁郁葱葱、宁静的泻湖中优雅地涉水。它们鲜艳的粉红色羽毛与周围植被的翠绿和清澈的碧蓝水面形成了美丽的对比。阳光在水面上闪烁，创造出在火烈鸟羽毛上跳动的闪亮倒影。鸟儿们优雅、弯曲的脖子浸入水中，行走在浅水里，她们的动作在泻湖中激起温柔的涟漪。构图强调了场景的宁静与自然美，突出了生态系统的微妙平衡以及这些宏伟鸟类固有的优雅。

一个电影般的镜头捕捉到了一只毛茸茸的可卡犬和贵宾犬的混种狗，坐在一个鲜艳的粉色火烈鸟浮枕上，位于阳光明媚的洛杉矶游泳池中。清澈的水在明亮的加州阳光下闪闪发光，映照出这幅充满玩趣的画面。可卡贵宾犬的毛发是柔和的白色和杏色混合，在金色阳光的映衬下显得格外醒目，柔软的耳朵在微风中轻轻摇曳。它快乐的表情和摇摆的尾巴传达出纯粹的喜悦和夏日的幸福。鲜艳的粉色火烈鸟增添了一丝奇趣，创造出一幅在洛杉矶阳光下无忧无虑的完美影像。

一个电影般的镜头中，一位穿着深黄色防护服的女医生被实验室刺眼的荧光灯照亮。镜头慢慢地拉近她的脸，轻轻地移动以强调她眉头上刻画的担忧和焦虑。她弓着身子伏在实验台上，目不转睛地看着显微镜，戴着手套的手小心地调整焦距。

场景的柔和色调，以病态的黄色防护服和实验室的无菌钢铁为主，突显了情况的严峻和她所面对的未知重压。浅景深聚焦于她眼中的恐惧，反映出她承受的巨大压力和责任。

太阳缓缓升起，照亮了一幅完美摆盘的早餐场景。浓厚金黄的枫糖浆慢动作淋在一叠松软的煎饼上，每块煎饼都冒出柔软温暖的蒸汽。

特写镜头展示酥脆的培根在滋滋作响，细小的金色油脂微粒飘散在空气中。咖啡以平滑旋转的动作倒入晶莹剔透的杯子，杯中充满了深褐色的奶油层。场景以镜头快速移向一颗新切的橙子结尾，展示其明亮多汁的果瓣，呈现惊艳的微距细节。

谷歌这波真的挺猛的，一个又一个惊喜。

老铁们，这个模型尝试了一下真的挺棒的。

这些生成的视频，看起来难以置信。

质量和物理模拟效果，令人惊叹！

非常棒的物理模拟效果，谷歌Deepmind正在快速崛起。

同时，今天谷歌还发布了文生图模型Imagen 3，能生成构图更好、光影更明亮的图像，能精准地呈现多种艺术风格，从写实、印象派、赛博朋克、抽象到二次元动漫等不同类型，文本语义还原也更加优秀，能渲染出更丰富的细节和纹理。

目前，Veo 2支持候补测试申请，Imagen 3已经全面推出使用，可以在谷歌的ImageFX直接使用。

本文素材来源谷歌，如有侵权请联系删除

END

AIGC开放社区

专注AIGC领域的专业社区，关注微软OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

最新文章

所有用户无限用Sora，OpenAI放圣诞福利！

极限压缩380倍！比OpenAI的Whisper更高效，开源模型超2000颗星

OpenAI 12天直播大盘点！o3、Sora，一次看完所有新技术

AI工具 | AI商品图工具合集

多模态解锁无限可能！AIGC多模态技术与应用峰会火热报名中~

函子科技CEO蒋耀锴，将出席“ISIG-AIGC多模态技术与应用峰会”

OpenAI甩王炸！发布新模型o3，一夜再次改变世界！

AI——有自由意志会怎样？

AI大模型/AIGC多模态/RPA超级自动化/低代码四大科技峰会来袭！

集思科技销售VP陈曙光，将出席“ISIG-AIGC多模态技术与应用峰会”

讯飞机器人超脑平台总经理刘可为，将出席“ISIG-AI大模型技术与应用发展峰会”

谷歌版o1模型发布：霸榜排名第一，深度展示思维链

ChatGPT重磅功能！支持AI Agent玩法，OpenAI加入智能体了

苹果正与腾讯、字节跳动洽谈，在iPhone集成类ChatGPT

多模态解锁无限可能！AIGC多模态技术与应用峰会火热报名中~

聚力维度创始人&CEO赵天奇，将出席“ISIG-AIGC多模态技术与应用峰会”

AI核心技术，颠覆传统数据整合模式！全球数据管理领导者Denodo技术干货分享来啦~

微软全球黑带技术专家武帅，将出席“ISIG-AI大模型技术与应用发展峰会”

OpenAI整大活！ChatGPT新增电话功能，全民AGI要来了

开个AI局，探索大模型的无限可能！AI大模型技术与应用发展峰会火热报名中~

重磅来袭！HealthAI 2024健康智能挑战赛启动报名

英伟达发布微型大模型计算机，每秒计算67万亿次

达观数据联合创始人张健，将出席“ISIG-AI大模型技术与应用发展峰会”

壹沓科技大模型产品总监王琰元，将出席“ISIG-AI大模型技术与应用发展峰会”

重磅！OpenAI开放满血o1模型API，成本暴降60%

开启智能之旅！RPA超级自动化与流程挖掘峰会火热报名中~

Liquid AI获2.5亿美元融资，创新液态大模型

ChatGPT搜索大更新！实时搜索、高级语音，AI搜索时代来了

AI工具 | AI内容检测合集

AI加速，码力全开！低代码/零代码技术与应用发展峰会火热报名中~

超过Sora！谷歌发布Veo 2，支持4K、逼真到难以分辨

开个AI局，探索大模型的无限可能！AI大模型技术与应用发展峰会火热报名中~

多模态解锁无限可能！AIGC多模态技术与应用峰会火热报名中~

微软发布Phi-4，最强小模型！参数极小、超GPT-4o

IBM推出化学大模型：可精准预测分子性质和行为

突破性功能！OpenAI发布ChatGPT Projects，万能工具箱上线！

AI核心技术，颠覆传统数据整合模式！全球数据管理领导者Denodo技术干货分享来啦~

微软 Azure AI 荣耀登榜，2024最受开发者欢迎的 AI 应用开发平台！

极客说｜深度对比：SFT、ReFT、RHLF、RLAIF、DPO、PPO

AI现身2024国际象棋世界冠军赛！世界棋王丁立人守擂，看AI如何让国际象棋更有趣

重磅！ChatGPT解锁高级视频对话、屏幕共享，实时交互时代

ISIG年度盛会来袭！RPA/低代码/AI大模型/AIGC多模态四大科技峰会共掀数字化创新浪潮

AI Agent成主打！谷歌发布超强多模态大模型—Gemini 2.0

极客说｜多智能体时代

王者降临！苹果全家桶接入ChatGPT，重塑iPhone、iPad 、Siri

多模态解锁无限可能！AIGC多模态技术与应用峰会报名开启~

人人可用，AI Copilot 场景学习资料大放送！

史上最贵！首个AI Agent程序员商业化，比ChatGPT Pro贵2倍

突发！OpenAI发布Canvas，ChatGPT新增史诗级功能

AI应用 | 可口可乐AI广告惹争议

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉