谷歌版o1突发即屠榜！思考速度比所有模型快5倍，能解摩斯代码，数学物理秒秒钟解决

科技 2024-12-20 05:33 广东

SmartFlowAI

点击上方蓝字关注我们

本文转载自量子位
全文约 1200 字，预计阅读时间 3 分钟

谷歌版o1来了！在奥特曼“双十二”倒数第二天——

他们发布Gemini 2.0 Flash Thinking，顾名思义，以闪电般的速度解决复杂问题并展示其思考过程的实验模型。

从姐夫哥展示出的Demo来看，它能在几秒钟之内解决一个物理问题，并且给出思考过程。

还可以给一张图，同时涉及视觉和文本线索的谜题。

如何用其中三个数字加起来等于30？

结果同样也是短短几秒，思考了好几种方案，最终确定是需要将9号球翻转为6号球，以实现6+13+11等于30这样一个结果。

所有综合类别指标中显示，目前Gemini 2.0 Flash Thinking排名第一，包括数学、代码、指令跟随、长QA、创意写作等等各方面。

目前在谷歌AI Studio就可以免费使用。

谷歌版o1第一波实测

从众多网友实测中，主要分为两大“派系”，一种是纯文本型，另一种是视觉类谜题。

最明显感知的就是一个快字。

它还可以解决像抛硬币这样的概率问题：如果我一直抛硬币，直到得到HHH或HTH，那么得到这两个几率之比是多少？

甚至它还可以解析摩斯代码，让网友直呼：怪吓人的。

有解决这种视觉类谜题的，比如找出这里面的字母和数字，并且说明出现了多少次。

结果它都一一指出来了。

DeepMind首席科学家拿出了他当年面试时遇到第一个问题，是用笔和纸写下的一道关于数论的问题。

结果它也秒秒钟回答了出来。

目前仅支持32k上下文窗口，也不支持联网。不过主创表示接下来会在新的一年里快速跟进，提供更长的token、更多的工具支持等。

今天之所以推出这个实验版，主要是为了接受大家的反馈意见。

也有网友反馈，它没有考虑到一些关键的物理因素。

△没有考虑到河流流动所暗示的海拔

不过也有不少网友反应，有个bug是，它似乎还是搞不清楚Strawberry有多少个r。

但如果进一步「仔细思考一下」，它就能回答出来。

姐夫哥还透露，未来还会有更多功能，可以在这里期待一下子。

好了，感兴趣的小伙伴可以前往去试试。

体验链接：
https://aistudio.google.com/prompts/new_chat
参考链接：
[1] https://x.com/OfficialLoganK/status/1869789820308074837
[2] https://x.com/JeffDean/status/1869789813232341267
[3] https://x.com/lmarena_ai/status/1869793847548817563
[4] https://x.com/drjwrae/status/1869806621024772096/video/2
[5] https://x.com/catebligh/status/1869823074809647589

往期 · 推荐

聊聊大模型推理系统之 vLLM：PagedAttention 助力内存管理

刚刚，ChatGPT Search 已面向全球所有免费用户开放

Datawhale x 机智流 “AI+硬件”开源教程共建项目来啦！

GPT-4o数学能力跑分直掉50%，上海AI Lab开始给大模型重新出题了

🌠 番外：我们期待与读者共同探讨如何在 AI 的辅助下，更好地发挥人类的潜力，以及如何培养和维持那些 AI 难以取代的核心技能。通过深入分析和实践，我们可以更清晰地认识到 AI 的辅助作用，并在 AI 时代下找到人类的独特价值和发展空间。“机智流”公众号后台聊天框回复“cc”，加入机智流大模型交流群！

一起“点赞”三连👇

机智流

共赴 AI 时代浪潮~

最新文章

Qwen开源视觉推理模型QVQ，更睿智地看世界！

聊聊大模型推理系统之 Sarathi

英特尔新款游戏显卡卖爆！24G大显存版也在路上，这下AI玩家也要抢？

又媲美 ChatGPT!? Qwen2.5 技术报告详解

回顾OpenAI系列发布会，对未来 AI 行业走向存在哪些潜在影响

HF Weekly01: Qwen2.5 tech report领衔

o3发布，OpenAI提出全新对齐范式，通过SFT和RL直接教会LLM结合安全策略进行CoT复杂推理

速报：OpenAI o3发布｜阿里Qwen2.5开源并发布技术报告

OpenAI o3震撼觉醒，AGI今夜降临？血洗o1，破解陶哲轩最难数学题

Late Chunking×Milvus：如何提高RAG准确率

GitHub Copilot推出免费订阅｜豆包推出视觉理解模型，千tokens仅3厘｜Meta和斯坦福大学合作推出多模态模型

谷歌版o1突发即屠榜！思考速度比所有模型快5倍，能解摩斯代码，数学物理秒秒钟解决

苹果Mac用户狂喜！ChatGPT深度集成应用，最后再藏AGI彩蛋

GPT-4o数学能力跑分直掉50%，上海AI Lab开始给大模型重新出题了

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物

宇树机器人强化学习代码全面开源，还有训练到仿真和实操手把手教学

OpenAI 年底「百亿补贴」来了，满血 o1 API 开放，成本暴跌，定制升级

聊聊大模型推理系统之 vLLM：PagedAttention 助力内存管理

Datawhale x 机智流 “AI+硬件”开源教程共建项目来啦！

AI周报：快手联合浙大、清华推出多视角视频生成模型 | ChatGPT Projects上线 | 微软推出的14B参数小语言模型

OpenAI重磅推出ChatGPT Projects功能，让ChatGPT更容易管理！网友：这是几日来最有用的发布

「AI定义汽车」新拐点已至！小米孟二利：我们有三个工作需要做好 | MEET 2025

OpenAI版“Her”正式上线，GPT能实时视频通话+屏幕共享了！德扑AI之父：比 o1“更受宠”的模式降临

吴恩达DeepLearning.AI课程系列 - 大模型检索增强生成（五）：问题回复

周中报：全球首个“AI 程序员”Devin全面开放|谷歌Gemini2发布，全面狙击o1模型|苹果智能正式集成ChatGPT

OpenAI高调“暗示”AGI产品发布？苹果三系统正式集成ChatGPT：iPhone16一键启动多模态

具身智能机器人的行业画像

AI周报：英伟达因涉嫌垄断被立案调查 | OpenAI正式发布Sora | Meta Google 各自发布新模型

突破闭源封锁！InternVL 2.5 革新开源多模态模型格局？

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术报告，端到端VLA模型驱动，唱跳都能陪你玩

聊聊大模型推理系统之 Orca：大模型推理系统开山之作

OpenAI的强化微调：RL+Science 创造新神还是灭霸？

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI圣诞推出惊喜、商业策略却惹争议，谷歌Genie 2单图即可生成3D游戏世界，亚马逊Nova以超快输出惊艳亮相

2024 AI 产品经理大会，这个周末，不见不散～

OpenAI的第一份礼：ChatGPT Pro和o1 Pro mode，但我们真的需要吗

以通专融合方式构建AGI——路径与关键问题探索｜CNCC2024

10万元奖金池！第三届生成式 AI 应用创新挑战赛来啦！

具身智能的数据采集主流路径

AI周报：腾讯开源目前最强视频生成大模型 | 李飞飞 WorldLabs 发布革命性的单图3D场景生成技术

北大字节VAR获最佳论文、厦大清华获亚军，NeurIPS 2024最佳论文出炉

最强开源文生视频！腾讯混元 HunyuanVideo对外开放并全面开源

大模型迎拐点时刻？中国生成式AI大会上海站最终议程公布，50+重磅嘉宾集聚畅谈

10万元奖金池！第三届生成式 AI 应用创新挑战赛来啦！

ICLR 惊现[10,10,10,10]满分论文，ControlNet 作者新作，Github 5.8k 颗星

Kimi悄悄开源了自家推理框架Mooncake~

大模型迎拐点时刻？中国生成式AI大会上海站最终议程公布，50+重磅嘉宾集聚畅谈

使用大语言模型进行自动且多功能的评估

速报：O1模型扎堆发布的一周

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉