首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

谷歌逆风翻盘暴击OpenAI，90天王者归来！44页报告押注25年三大技术前沿

科技 2024-12-18 12:42 北京

新智元报道

编辑：编辑部

【新智元导读】在这场如火如荼的AI军备竞赛中，谷歌在年底彻底打响翻身仗，成功逆袭！Google Cloud于近日也发布了一份44页「2024 数据和AI趋势报告」，直指AI智能体、多模态AI，企业搜索将成为2025年三大主导技术。

逆袭之战开启，谷歌用90天重回巅峰！

短短90天，谷歌就从业内笑柄，逆袭成突破最大、产品最颠覆的科技大公司。

用AI初创创始人Ole Lehmann的话说，「我们正在见证2024年最大的科技转变」。

如今，前方是捷报频传。

根据OpenRouterAI的数据，Google Gemini在开发者中的市场份额从9月份的约5%，上升到了上周的>50%市场份额。

Google Gemini系列在OpenRouterAI的趋势排行中独占鳌头，远超其他模型。

在被公认是下一个AI前沿的智能体领域，谷歌的Project Mariner，可以直接让Gemini控制我们的浏览器，自行执行任务！直接一步跨越到人机交互的未来。

惊人之处在于，Mariner是一个真正可以在浏览器上完成复杂任务而不会失败的AI。预定航班、定餐馆，它都可以通过在屏幕上看到的内容完成操作。

此外，谷歌的Project Astra的早期测试报告结果也令人兴奋不已。

受邀参加项目测试的Linus Ekenstam表示，这一天很快就会到来：人手一个AI私人助理，而且它们无所不在。

我们会严重依赖这些AI助手，甚至在2025年，人类发展格局都会被带来重大改变。

更不用说，就在昨天放出的AI视频模型Veo 2.0，无论是在物理学、质量还是指令遵循上，效果都妥妥吊打Sora，全网测试，为之疯狂。

有人实测Veo 2和Sora后直言：这是自行车和宇宙飞船的区别

现在，市场已经给出了反应，在过去一个月内，谷歌的市值直接上涨了14%。

不再追逐头条，而是集中精力做产品、注重实用性的谷歌，已经成为了OpenAI真正的可怕对手。

突然逆袭，重拳反击OpenAI

曾被认为遥遥领先的OpenAI，正面临着来自谷歌的迎头痛击。

网友Chubby做了一篇长文分析，指出两个AI巨头的对战潮流正在转向。

声明：目前一切都还未定论，我的分析仅是对现状的一瞥

早在2017年，Sam Altman在一次邮件交流中就明确表示，谷歌DeepMind是在AGI竞争中最大的对手。

当时，他还未能预见其他玩家会加入这场竞争。不过，估值180亿美金Anthropic的崛起，证明了新玩家也能翻身成巨头。

Meta通过「开源」（虽然并非真正的开源）另辟蹊径，避免了与谷歌占据主导地位路线的直接竞争。

ChatGPT如同一匹黑马，自2022年横空出世以来，OpenAI一直牢牢掌握着AI的话语权。与此同时，ChatGPT成为了「AI」的代名词。

凭借此，奥特曼带领着团队迅速征服消费市场，甚至直接带飞了微软。

然而，谷歌却在这场竞赛中措手不及，连连败北。

最初的几轮交锋中，谷歌试图通过Gemini去挽救落下的成绩，并期望以此获得市场青睐，但总是未能如意。

此前，AI Overview总结能力大翻车，遭到网友连连的吐槽。

比如，建议孕妇吸烟、建议自杀跳桥、建议用胶水将胶水和披萨固定在一起....

各种荒谬的建议，简直震碎三观。

上半场的比赛中，谷歌彻底输掉了。

更耐人寻味的是，OpenAI几乎毫不费力，每次都能在谷歌发布新产品前后抢尽风头。即便在模型推理能力上，到目前为止，OpenAI也一直是遥遥领先。

人们不理解的是，谷歌DeepMind拥有世界上最好的资源，为什么会在这场竞争中略显得仓促和被动？

与OpenAI不同，他们有大量用于训练推理的TPU、更多的训练数据（比如YouTube），以及DeepMind这个世界级研究机构和顶尖人才。

DeepMind团队也在努力用实力，去证明这一切。在科学领域，AlphaFold、GenCast等等，取得了难以置信的成就。

但这些研究成果，在消费市场上并没有给谷歌带去任何实质性的帮助。

甚至，就连Anthropic这样后来者，也赢得了AI社区更多关注和支持。

然而，这种局势在12月发生了戏剧性的逆转。突然间，谷歌发力给OpenAI来了当头一棒。

就在OpenAI接连献上12天产品秀之际，谷歌推出了两款惊艳的模型——Gemini 2.0 Flash和Veo 2。

Gemini 2.0 Flash在所有基准测试中，超越了GPT-4。

AI视频模型Veo 2直接吊打Sora，展现出令人惊叹的物理世界理解能力。

它还能根据提示中的方程式2x-1=0，直接生成出得到解答x=1/2的视频。

相较之下，Sora的生成简直一言难尽。

关于新模型的亮相，谷歌并没有做任何事先的炒作和预热，用低调有力的方式做出了反击。

而对于，过去一年总结，和未来一年技术预测，谷歌也有话要说。

谷歌AI年，2025年三大技术向

今天，Google Cloud发布的一份44页「2024 数据和AI趋势报告」，直指AI智能体、多模态AI，企业搜索将成为2025年三大主导技术。

报告地址：https://services.google.com/fh/files/misc/data_ai_trends_report.pdf

多智能体将催生出一个巨大的市场机会

当前，智能体已经能够独立完成多步骤任务，而只有约10%的大公司已经采用，另外82%公司计划三年内将智能体整合到工作流中。

谷歌云全球GenAI副总Oliver Parker表示，「不久的将来，你会看到不同智能体之间相互频繁地交流协作」。

在谷歌，他们将智能体划分为六个类：

- 面向客户的智能体：用于了解客户需求、回答与解决问题并推荐相应的产品和服务。它们支持跨多模态工作，可以分析语音与视频内容

- 员工智能体：有助于简化流程、管理重复性任务、解答问题和文档编辑与翻译。

- 创意智能体：生成有助于设计、营销、文案等项目的内容、图像，提供灵感

- 数据智能体：可以在确保准确性的基础上，通过检索与数据处理来协助研究和数据分析。

- 代码智能体：支持代码生成与提供辅助编码

- 安全智能体：降低网络攻击的危害，或者加快安全漏洞的筛查速度

然而，Parker指出，过多的智能体同时处理多个流程，可能会导致系统的混乱。

他看到了这一现象背后蕴藏着巨大的机遇，这将催生出全新的平台——智能体治理。

「我们认为一个巨大的机会即将到来，那就是一个能够管理协调你各种智能体的平台」，他讲道，这将会催动「智能体管理」或者需要一个支持「在不同系统中的任何地方都能提供不同服务的智能体层」。

人工智能发展的五大趋势

多模态AI将会带来千亿美元市场

全球多模态人工智能市场在2025年估值为24亿美元，预计到2037年底将达到989亿美元。

多模态人工智能将人工智能的理解能力提升到一个新的水平，使模型能够解读和处理一系列数据源，不仅包括文本，还包括图像、视频和音频。

目前一些主要的供应商和前沿的初创公司已经发布了许多功能强大的多模态工具，例如谷歌自己的Gemini 2.0 Flash、Mistral的Pixtral 12B或Cohere的Embed 3。谷歌预测，多模态人工智能的爆发将支持复杂的数据分析，并为人们带来对于事物更深刻的基本认识和更个性化的见解。

Parker指出，在过去的12个月里，企业已经从单一模型转变为针对不同的场景去部署多个模型，如Gemini、Anthropic、Mistral、Cohere、Llama等，而不仅仅是OpenAI模型。

虽然当前谷歌云的重点依然大多在开发上，但2025年的目标则是让企业级用户自己掌握生成式人工智能能力。

目前企业已经不仅仅只是关注模型本身，而且开始分析不同的部署平台并制定人工智能和智能体的规划发展路线图。Parker对此表示，这些通常是几年内才能看到的趋势，但在12个月内就快速呈现了，令人惊叹。

企业级搜索大幅提高信息获取效率

你是否还在苦恼于查询工作文档却因忘记对应关键词而无法入手项目？

现在结合了生成式人工智能的企业搜索，再也不用局限于仅基于关键词的查询了。

你可以使用图像、音频、视频或者是对话提示来快速查询访问企业内部数据。毫无疑问，这将让搜索变得极其丝滑。

在实际工作中，人们往往是搜寻到相应信息并将其整合以获得见解，做出相应决策，进而采取行动。由于许多组织的不同信息通常分散在不同的应用程序中，而人工智能搜索可以快速跨越这些应用程序将数据整合在一起，这就彰显了结合生成式人工智能的企业搜索的巨大优势。

Gemini 2.0加持编码助手，一键打通软件开发全流程

上周，谷歌发布的Gemini 2.0 Flash在编程基准SWE-bench Verified上，刷新了SOTA。

它的性能完全碾压满血版o1、Claude 3.5 Sonnet，成为公认的最强编码AI。

就在今天，谷歌宣布在Gemini Code Assist中，集成最新模型Gemini 2.0 Flash，并推出了一系列工具。

由此，开发者们可以将外部系统加入IDE，直接与GitHub、GitLab、Sentry、Google Chrome和Atlassian交互。

在此之前，Gemini Code Assist已经接入了VS Code和JetBrains。

谷歌云产品管理高级总监Ryan J. Salva表示，这个想法是为编码任务扩展更多的上下文，而不中断工作流程。

开发者只需进入Code Assist聊天页面，说明需要处理的数据，然后LLM可以自动从数据源查询并对其分析。

为了给开发者们提供便捷，谷歌计划未来还将更多工具，直接集成到Gemini Code Assist中，比如可观察性工具、安全软件以及数据库。

从ChatGPT可以协助编码之后，人工智能编码助手是GenAI的首批重要用例。GitHub、甲骨文、Harness纷纷推出了以企业为重点的编码助手。

与此同时，OpenAI和Anthropic对外提供API接口，让程序员直接在聊天平台上编程。

比如，我们可以直接在ChatGPT中的Canvas运行Python代码，还能进行交互性的编辑生成。

Anthropic推出的Claude Artifacts，与Canvas产品理念相同，皆是便于开发者们生成、编辑和运行代码。

另外，OpenAI还在ChatGPT MacOS桌面应用程序中添加了与VS Code、XCode、Terminal和iTerm 2等工具的集成。

据Gartner估计，「截止2028年，90%的企业软件工程师将使用AI编码助手，这一比例在2024年初还不到14%」。

谷歌宣称，Gemini Code Assist企业版已超越了IDE中的AI编码辅助功能，不仅可以理解本地代码库，还可以定制代码，提供代码建议。

它的定制功能可索引来自GitHub和GitLab的repos，并将于2025年初支持其他源码控制系统和自托管的内部repos。

同时，它还能完成复杂的任务，如在整个软件包中升级Java版本。此外，企业版提供了企业级安全以及法律赔偿条款。

在推出Gemini 2.0时，谷歌同步发布了编码工具 Jules。

Salva表示Code Assist与其完全隔离，Code Assist仍是唯一由Gemini支持的通用企业级编码工具。

参考资料：

https://venturebeat.com/ai/google-ai-agents-multimodal-ai-enterprise-search-will-dominate-in-2025/

https://venturebeat.com/ai/google-upgrades-its-programming-agent-code-assist-with-gemini-2-0-adds-source-integrations/

https://x.com/kimmonismus/status/1869111765700853779

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

最新文章

27亿刀天价员工首个成果，谷歌版o1算出最难高考数学题！物理代码难题闪电秒解

刚刚，GPT开山一作被曝离职OpenAI！被Ilya感谢，ChatGPT无名英雄选择单飞

2025英伟达奖学金名单公布，7位华人入选！中科大浙大校友在列，人均6万美元

全球百模争霸，国产大模型拿下多个冠军！智源FlagEval全球评测榜单出炉

一键生成万字专利！中科院发布多智能体框架AutoPatent，含1933个「草稿-专利」数据对

Meta斯坦福全新多模态Apollo，60分钟视频轻松理解！7B性能超越30B

招人！新智元邀你勇闯ASI之巅

OpenAI开通ChatGPT热线了！美国电话就能打，老人机也能玩，15分钟免费

全球最强GPU订单曝光，TOP 1微软一年买爆近50万块！xAI晒首批GB200提前过年

28年数据枯竭？AI炼出数据飞轮2.0，智能体+多模态数据湖硬核掘金

AI改变数学的一年！黎曼假说、朗兰兹猜想，盘点2024年数学里程碑

全面超越CoT！Meta田渊栋团队新作：连续思维链

2025年，AI Agent还会是风口吗？11个问题揭秘智能体技术发展全貌

招人！新智元邀你勇闯ASI之巅

OpenAI圣诞第9天：满血o1 API放出，开发者大狂欢！实时API升级音频token暴降60%

Pika 2.0横扫Sora惊艳全网，一键颠覆广告业！上传自拍秒变好莱坞大片，和明星同框不是梦

用上AI，升职提前4年？清华等分析6790万篇论文：科学界收缩，不用AI的领域无人问津

稳定学习预后标志物，多种癌症生存曲线证实！清华最新成果登Nature顶级子刊

沃顿商学院教授发文解析o1：能力仍有短板，「人机协同智能」或成AGI最重要难题

招人！新智元邀你勇闯ASI之巅

谷歌逆风翻盘暴击OpenAI，90天王者归来！44页报告押注25年三大技术前沿

举报人「自杀」，OpenAI表示震惊！NYU教授发长文悼念：警钟仍在回响

谷歌版Sora来了，4K高清暴击OpenAI！视频生图新卷王，更理解物理世界

ChatGPT搜索，全球免费！Her动嘴实时搜，暴打谷歌边聊边搜

北大开源全新图像压缩感知网络：参数量、推理时间大幅节省，性能显著提升 | 顶刊TPAMI

语言游戏让AI自我进化，谷歌DeepMind推出苏格拉底式学习

招人！新智元邀你勇闯ASI之巅

视频一键拆分PS层！DeepMind新模型效果碾压同级，物体、背景完美分离，还能脑补

图像领域再次与LLM一拍即合！idea撞车OpenAI强化微调，西湖大学发布图像链CoT

Nature再发招聘调查：学术界和工业界大不同，帮你避坑从简历到面试的N个细节

招人！新智元邀你勇闯ASI之巅

MIT教授NeurIPS歧视言论炸雷，中国女学生霸气反击！AI大佬集体痛斥，道歉信来了

OpenAI官方爆料，长文开怼马斯克：靠打官司实现不了AGI！

Claude 3.5编程收入暴增10倍，抢走Cursor反杀OpenAI！估值180亿初创3年颠覆硅谷

招人！新智元邀你勇闯ASI之巅

「中美科技合作协定」终于续签！但AI半导体等关键技术却遭排除

Ilya向全世界宣布：预训练结束了！全球AI数据耗尽，超级智能才是未来

26岁OpenAI举报人疑自杀！死前揭ChatGPT训练黑幕

欧洲万亿美元科技巨头为0，被美国「泰坦」无情碾压！LeCun转评

招人！新智元邀你勇闯ASI之巅

ChatGPT「睁眼」了！OpenAI版「Her」满血上线，还有圣诞限定彩蛋

LSTM之父：我也是注意力之父！1991年就发表线性复杂度，遥遥领先Transformer 26年

再也不怕显存爆炸了！高效重建「几何精准」的大规模复杂三维场景，中科院提出CityGaussianV2

Meta公布黑科技：戴上腕带即可隔空打字，引领神经接口AR革命

招人！新智元邀你勇闯ASI之巅

ChatGPT崩溃4小时！DDL打工人、期末大学生全慌了

2024 ACL Fellow名单出炉！微软高剑峰等4位华人科学家入选

OpenAI深夜被狙，谷歌Gemini 2.0掀翻牌桌！最强智能体组团击毙o1

谷歌Gemini再添猛将！GPA 5.0毕业即DeepMind高级科学家，开挂博士给科研新人7点建议

超图计算+目标检测，性能新SOTA！清华发布Hyper-YOLO：用超图捕捉高阶视觉关联

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉