没想到击败OpenAI的居然是谷歌

文摘 2024-12-17 09:16 广东

今天又和前两天一样和朋友们一起的熬OpenAI的发布会，结果开始之前，突然有个哥们发了个链接，说别等什么OpenAI了。来看看谷歌！他们这波站起来了！来了个大的！

目前最先进的AI视频模型Veo 2，还有生图模型Imagen的最新版——Imagen 3　

半信半疑的点开链接，woc！效果真好啊！　

废话不多说，直接带大家看效果！　

AI视频生成模型Veo 2 :

下面是官方Blog给的几个例子，大家可以看一下，非常惊艳　

女科学家：

Prompt：电影镜头中，一名身穿深黄色防护服的女医生，被实验室刺眼的荧光灯照亮。镜头慢慢拉近她的脸，轻轻摇摄，强调她眉宇间刻画的忧虑和焦虑。她弯腰伏在实验台上，全神贯注地盯着显微镜，戴着手套的手仔细调整焦距。场景的色调柔和，以防护服的病态黄色和实验室无菌钢为主，强调了情况的严重性和她所面临的未知的重量。浅景深聚焦于她眼中的恐惧，反映出她所承受的巨大压力和责任。

蜂农：
Prompt：相机轻轻地飘过一排排粉刷过的木制蜂箱，嗡嗡作响的蜜蜂在画面中进进出出。动作落在站在中心的优雅农民身上，他洁白的养蜂服在金色的午后阳光下闪闪发光。他举起一罐蜂蜜，稍微倾斜以捕捉光线。在他身后，高大的向日葵在微风中有节奏地摇曳，花瓣在温暖的阳光下闪闪发光。相机向上倾斜，露出一座复古的农舍，带有薄荷绿色的百叶窗，墙壁上点缀着摇曳的树木的阴影。使用 35 毫米镜头在柯达 Portra 400 胶片上拍摄，金色的光线在农民的手套、果酱罐和蜂箱的风化木材上创造出丰富的纹理。

煎饼：
Prompt：太阳在摆盘完美的早餐场景后缓缓升起。浓稠的金色枫糖浆以慢动作倒在松软的煎饼上，每个煎饼都散发出柔软温暖的蒸汽云。特写镜头中，脆培根发出嘶嘶声，金色油脂的细小余烬飘向空中。咖啡以顺滑的旋转动作倒入水晶般透明的杯子中，杯子里充满了深棕色的咖啡油脂层。场景结束时，相机俯冲到新鲜切好的橙子上，以令人惊叹的微距细节展示出其明亮多汁的果肉。

然后是一些来自网友的例子　

未来足球赛：　

Prompt：来自未来的足球

调酒师：　

Prompt：一名调酒师正在调制老式鸡尾酒。

深海宇航员：　

Prompt：宇航员探索水下外星人沉船

可以看到Veo2的表现非常惊艳！给我的感觉不亚于三月份第一次看到Sora的时候　

但Sora正式发布之后的那个样子。。。。　

Veo 2 可以创建具有逼真运动和高质量输出的视频，分辨率高达 4K。　

它可以遵循简单和复杂的指令，并令人信服地模拟真实世界的物理现象以及各种视觉风格。与其他 AI 视频模型相比，它在细节、真实感和伪影减少方面有显著改进。　

由于其对物理学的理解和遵循详细指令的能力，它可以高度准确地表示运动。它可以精确地解释指令，以创建各种拍摄风格、角度、动作以及所有这些的组合。　

在人类评审员对顶级视频生成模型输出的面对面比较中，它取得了最先进的结果。它在整体偏好和准确遵循提示的能力方面表现最佳。　

没想到我们的Kling和MiniMax都已经成为评测对象了　

创建逼真、动态或复杂的视频，并在整个复杂场景或具有复杂运动的场景中保持完整的一致性仍然是一个挑战。　

AI图像生成Imagen 3 :

除了视频模型Veo 3 3之外，Google这次还一起发布了他们的生图模型Imagen 3 　

有的朋友可能感觉不对。我怎么记得Imagen 3 已经发过了？！　

是的，你没有记错，第一代Imagen 3 是在今年的谷歌的I/O开发者大会上（2024年5月14日），现在的Imagen 3 其实是第二代，Imagen3-002。　

5月份的Google I/O其实还没有太大波澜

跑分非常抽象，直接横扫其他模型。　

目前可以在Gemini里面玩，或者去他们新的页面ImageFX里面（推荐这个），用谷歌账号登录就行了（废话，可不得用Google账号，你用百度人家也得同意啊）　

免费玩！　

他可以选择几个不同的宽高比，比如方形、16：9、3：4，以及质量选择（目前只能选最佳质量）　

如果你不知道Roll什么图，你既可以根据他给你预制的Prompt去生成，只需要按一下Tab。或者你也可以点击手气不错按钮，随机抽取的一个Prompt进行测试。

我觉得最有意思的也最实用的就是ImageFX允许你随时调整Prompt里面的关键词，让你很方便的实现局部重绘。　

例如我这张图里的秘密花园，可以换成公园或者绿屋等关键词　

并且你可以调整局部的颜色，例如花可以换成黄色，红色等等　

总体来说这个生图产品ImageFX的设计我觉得是比较不错的，模型能力也很好。即使你Prompt很烂，也不会太差。　

例如我这个Prompt "一只猫跑起来了“　

可以看到效果还是很好的，反正低质Prompt能稳稳接住。　

写在最后：

其实Google最近一段时间很猛，比某个只会开发布会却不发好东西的OpenAI强了不知道多少个Claude。

从Gemini2.0的Flash（别急，其他的在路上）

到现在的Veo2 和 Imagen 3-022

谷歌有点站起来的的意思，但其实OpenAI也有类似的大货。只是不知道为什么，一直不发。

求求你了快端上来吧！

别让等待，成为遗憾！

感谢您的观看🥹

我是Max，一个在AI方向持续探索的小学生。

01Founder会持续更新一些AI方向最新最快的产品，技术，思考

求各位看官点赞，关注，再看三连🙇

PS：如果有好的产品欢迎私戳我，

我会帮有价值的产品匹配它应有的价值。

01Founder

一群在0与1之间构建属于自己未来的人

最新文章

美团AI短剧爆火的背后”：技术与产品实力的冰山一角

一文详解o3：无限接近AGI，但你用不起

今夜过后，闪极已经是一家领先的科技公司了。

从今天开始，你难过的时候可以随时打电话给AI倾诉 | OpenAI发布会Day10

OpenAI马拉松发布会Day9：不只有实时语音API，还发布了三个新模型+o1满血版API，同时大降价！

没想到击败OpenAI的居然是谷歌

OpenAI马拉松发布会Day8：AI搜索免费用，并支持实时语音搜索！但比字节豆包慢了几个月~

全网首发！实测全球首个 AI 程序员 Devin，月薪3500的全能实习生？

好消息，我们有中国人自己的Recraft和Midjourney了！

OpenAI马拉松发布会Day3：Sora 正式发布，从今天开始真实与虚拟的界限已经消失

OpenAI马拉松发布会Day1：GPT-o1全新升级

李飞飞首个“空间智能”模型，一张图生成一个可交互的3D世界！

太好啦！是AI输入法！我们有救啦！！！

出事了，Sora疑似被泄露了？？？（附实际生成的视频）

深度 | AI 何时代替你操作OS？

十问“AI应用”现状、机会与启示

吐血整理：AI淘金日记

Search GPT 杀不死谷歌，但会杀死通用 AI 搜索

三个人、远程、两个月，他们颠覆了内容创作

这家默默无闻的AI公司，突然成了世界第一

妙刷火了，团队却感到很意外

当你的想法被大公司抄走之后

做不出AI应用，阶跃决定改革（歌）

请所有AI圈子里的女性朋友们小心这个人！！

最终反转，某厂模型实习生事件真相

你以为卖课割韭菜就是AI圈极限了？

复盘李一舟，他到底做错了什么？

从国务院会议文件中看中国人工智能未来的发展

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉