深夜惊喜！谷歌版o1免费上线，支持图片和音频输入！还能在Cursor里用，支持代码批量修改！

科技 2024-12-20 20:58 湖南

🍹 Insight Daily 🪺

Aitrainee | 公众号：AI进修生

Hi，这里是Aitrainee，欢迎阅读本期新文章。

昨天深夜，当大家都准备睡觉的时候，Google突然放了个大招。

他们悄悄上线了一个新模型，叫 Gemini 2.0 Flash Thinking 。这名字听起来可能有点拗口，但这就是谷歌版的o1！更让人兴奋的是，它现在已经可以集成到像 Cursor 这样的代码编辑器里直接使用了！

可能有些朋友知道，我之前的文章写到 Gemini 2.0 Flash 也可以在 Cursor 的 chat 模式中使用，速度非常快。这对于一些头脑风暴或者不需要直接修改代码的场景非常有用。

但这次更新更厉害的是，它可以使用 composer 模式了！这意味着它可以自动化进行多个代码修改，效率直接提升了一个档次。

考虑到 Claude 模型的调用次数限制，以及 Gemini 2.0 Flash 完全免费且速度极快的特点，在很多非核心的代码修改场景下，它会是一个非常好的选择。

而且最重要的是，它 完！全！免！费！

让我们来看看这个模型有多强：

1、速度快得惊

• 复杂数学题秒出答案，完全不用等待，复杂数学题14秒就能解出，比其他模型快5倍

▲ 14 秒内破解了 goto 数学题

2、推理能力超强

• 在LMSYS排行榜上横扫所有类别：数学、编程、创意写作全部第一

• 首个成功解决"三赌徒问题"的模型

有网友测试，Gemini 2.0 Flash Thinking 成为了首个正确解答该问题的模型，而他之前测试的 o1-preview、o1、r1、QwQ 模型都未能过关。

三赌徒问题：假设三个赌徒最初有 (a, b, c) 美元。每次试验都是随机选择两个玩家，让他们公平地掷一枚硬币；根据输赢，他们会正常地转手 1 美元。玩家一旦破产，就会退出。令 (S_1) 表示一名玩家破产所需的游戏局数。令 (S_2) 表示两名玩家破产所需的游戏局数。求 S_1 和 S_2 的期望。

这是模型的部分回答：

• 能解决最难高考数学题

有人把号称史上最难的高考数学题扔给Gemini 2.0 Flash Thinking，居然答对了（连o1都做不到）

3、思维过程透明化

• 会展示完整的思考步骤

• 像人类一样一步步推理

• 思维链条清晰可见

4、多模态理解

• 支持图片和音频输入

• 能看懂手写数学题

• 可以理解复杂图表

能够快速解答问题并展示思考过程，例如在Gemini解决了一个数学期望题，而 OpenAI 的 o1 则需要多花3.5倍的时间。

Gemini 2.0 Flash Thinking 和 o1 一样，也采用「推理时计算」策略，投入更多计算能力以提升解决问题的能力。

它具备一定的自我纠错和变通能力，例如在解决台球数字题时，能够识别数字的不同朝向并调整解题思路。

这个模型的上下文窗口有32000 tokens，虽然不及某些百万级的模型，但是对于日常使用来说已经完全够用了。

最后，如果你想试用这个新模型，只需要：

1. 打开Google AI Studio：https://aistudio.google.com/。

2. 选择Gemini 2.0 Flash Thinking模型或创建API 。

3. 开始体验免费、快速、强大的 Gemini 2.0！

最后说一句，看到谷歌这次的表现，我真的觉得AI的竞争要开始变得更有意思了...

往期推荐

从0到1用AI做了个AI服务网站, 全程没写一行代码。

当Claude3.5 遇上 Gemini 2，这个免费的AI编程竞技场炸了。

TEN Agent 一键让 Coze Bot 开口说话，这下AI助手终于能跟我聊天了。

我花了72小时研究Cursor Agents，以下是必须分享的硬核干货！

Cursor从入门到精通：不可错过的七大技巧分享，Agent、Cursorrules（详细教程）

🌟 知音难求，自我修炼亦艰，抓住前沿技术的机遇，与我们一起成为创新的超级个体（把握AIGC时代的个人力量）。

AI进修生

AI算法工程师 / Prompt工程师 / ROS机器人开发者 | 分享AI动态与算法应用资讯，提升技术效率。

MiniPerplx：一款全新开源的AI搜索引擎，xAI 和 Vercel 赞助。

Gemini CodeGen + Search：全新免费的 AI 编码器与使用Replit2小时复刻Perplexity。

一手体验STORM写作系统，这才是AI写作的未来形态。

DeepSeek Artifacts：全新免费的 AI 编码器，构建公共前端代码数据集（Bolt、V0类）

我用Bolt DIY + Deepseek V3做了个跨年倒计时，2024留给你最后的温暖。

用思维链激活Cursor + Cursor绝不仅仅是代码编辑器。

三分钟带你看完Lovable，这款全新的AI全栈APP构建器击败了Bolt吗？

如何让 Cursor 在大型项目中更好地工作 - 进阶技巧分享

Cursor 0.44版本悄悄上线，体验YOLO模式，我知道编程再也回不去了。

10分钟入门Cursor+Git，让AI编程如虎添翼。

深夜惊喜！谷歌版o1免费上线，支持图片和音频输入！还能在Cursor里用，支持代码批量修改！

从0到1用AI做了个AI服务网站, 全程没写一行代码。

PDF转Markdown，TextIn文档解析工具全体验，兼容多种格式！（附独家免费权益）

又一篇AI顶会！这个idea简直“ 杀疯了 ” ....

告别算力焦虑，轻松玩转大模型，请低调使用

当Claude3.5 遇上 Gemini 2，这个免费的AI编程竞技场炸了。

ChatGPT实时视频通话功能全量开放，AI终于睁开了"眼睛"。

谷歌的Gemini 2.0来了! 这是我见过最强的免费AI助手。

TEN Agent 一键让 Coze Bot 开口说话，这下AI助手终于能跟我聊天了。

我花了72小时研究Cursor Agents，以下是必须分享的硬核干货！

浏览器标签管理太乱？这款神器帮我整理得井井有条！

AI编程 x ，跑提示词 v，开发AI saas网站，全新免费 Websim AI 生成网站、小游戏和工具！

Copycoder：这个工具和 Cursor、Bolt、V0 配合太棒了！提供更好的前端开发提示词（AI导航网站生成）

Cursor从入门到精通：不可错过的七大技巧分享，Agent、Cursorrules（详细教程）

WindSurf+Bolt+Cursor+Sealos：构建AI播客应用程序，前后端分离、对象存储、数据库存储、部署、K8S

终于不用为GPU算力发愁了，趋动云免费算力、火热AI项目一键启动包、大模型微调与部署

V0更新：AI驱动的全栈Web开发工具，击败了Bolt 、Cursor、Windsurf 吗？

中国版的o1来了！DeepSeek-R1-Lite媲美o1-preview，还原完整COT推理过程！

Bolt + Supabase：1分钟实现APP的登陆功能、连接数据库（Bolt、Cursor、BaaS、AI全栈）

豆包MarsCode：AI带你刷题、解析代码仓库、云IDE支持，还免费，这也太酷了吧。

Windsurf：这款全新免费的 AI IDE 击败了Cursor 吗？超强上下文感知、AI代理和工作流支持

Gemini Exp 1114：有史以来最好的大模型！击败 o1-Preview + Claude 3.5 Sonnet！

李彦宏百度世界2024圆桌访谈：应用驱动是第一性原理，百度的多模态能力非常强

Qwen-2.5 Coder (32B)+ Cursor+ Aider：这个最强开源代码模型击败了 Claude、GPT-4o？

使用 Bolt + Cursor 构建任何东西：AI实时语音助手、AI播客应用程序，每个人都可以拥有自己的专属软件。

Ollama 更新！手把手教你用Ollama轻松搭建Llama 3.2 Vision + 视觉RAG系统（本地安装）

Fast GraphRAG：一个比 GraphRAG 更快、成本更低、更高效的RAG框架开源了（本地安装 & 测试）

Grok-2 免费API + Cline : 使用Grok API 免费运行AI编码代理，每月都有25美元免费额度！

Cofounder：这个新的AI代理，全栈架构师+项目经理，一个提示生成应用（比 Aider、v0、Cline 更强吗？）

Bolt + 免费的Mistral 和 Github API：免费且强大的AI代理工作流，无需V0（o1-preview免费）

媲美GPT4o！教你用智谱GLM-4-Plus在Fastgpt、Dify中构建知识库，并结合o1思维链和工具调用！

幻图AI：一款全新免费工具，换脸、换装、文生图、创意融合，轻松搞定！（无需 ComfyUI、Midjourney）

LongVU：Meta AI 开源长视频语言理解的多模态模型！能记住视频中的细节，处理大量视频帧！

MaskGCT：这款全新的开源语音大模型太强了，击败CosyVoice、XTTS-v2（视频翻译、声音克隆、跨语种合成）

Claude出来后，还有这些 Agent 代理操作电脑，很棒。

开源向量数据库哪个好？Milvus、Chroma 和 Qdrant 的选择指南

Claude 3.5 Sonnet 升级后，很强。用它写代码不知道有多爽。

一键翻译视频！SoniTranslate 轻松生成多语言音频与字幕，满足教育、内容创作、跨文化交流需求！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉