深夜惊喜!谷歌版o1免费上线,支持图片和音频输入!还能在Cursor里用,支持代码批量修改!

科技   2024-12-20 20:58   湖南  

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

Hi,这里是Aitrainee,欢迎阅读本期新文章。

昨天深夜,当大家都准备睡觉的时候,Google突然放了个大招。
他们悄悄上线了一个新模型,叫 Gemini 2.0 Flash Thinking 。这名字听起来可能有点拗口,但这就是谷歌版的o1!更让人兴奋的是,它现在已经可以集成到像 Cursor 这样的代码编辑器里直接使用了!

可能有些朋友知道,我之前的文章写到 Gemini 2.0 Flash 也可以在 Cursor 的 chat 模式中使用,速度非常快。这对于一些头脑风暴或者不需要直接修改代码的场景非常有用。

但这次更新更厉害的是,它可以使用 composer 模式了!这意味着它可以自动化进行多个代码修改,效率直接提升了一个档次。

考虑到 Claude 模型的调用次数限制,以及 Gemini 2.0 Flash 完全免费且速度极快的特点,在很多非核心的代码修改场景下,它会是一个非常好的选择。

而且最重要的是,它 完!全!免!费!
让我们来看看这个模型有多强:
1、速度快得惊
• 复杂数学题秒出答案,完全不用等待,复杂数学题14秒就能解出,比其他模型快5倍

▲ 14 秒内破解了 goto 数学题

2、推理能力超强
• 在LMSYS排行榜上横扫所有类别:数学、编程、创意写作全部第一
• 首个成功解决"三赌徒问题"的模型

有网友测试,Gemini 2.0 Flash Thinking 成为了首个正确解答该问题的模型,而他之前测试的 o1-preview、o1、r1、QwQ 模型都未能过关。

三赌徒问题:假设三个赌徒最初有 (a, b, c) 美元。每次试验都是随机选择两个玩家,让他们公平地掷一枚硬币;根据输赢,他们会正常地转手 1 美元。玩家一旦破产,就会退出。令 (S_1) 表示一名玩家破产所需的游戏局数。令 (S_2) 表示两名玩家破产所需的游戏局数。求 S_1 和 S_2 的期望。

这是模型的部分回答:

• 能解决最难高考数学题
有人把号称史上最难的高考数学题扔给Gemini 2.0 Flash Thinking,居然答对了(连o1都做不到)

3、思维过程透明化
• 会展示完整的思考步骤

• 像人类一样一步步推理
• 思维链条清晰可见
4、 多模态理解
• 支持图片和音频输入

• 能看懂手写数学题
• 可以理解复杂图表

能够快速解答问题并展示思考过程,例如在Gemini解决了一个数学期望题,而 OpenAI 的 o1 则需要多花3.5倍的时间。

Gemini 2.0 Flash Thinking 和 o1 一样,也采用「推理时计算」策略,投入更多计算能力以提升解决问题的能力。

它具备一定的自我纠错和变通能力,例如在解决台球数字题时,能够识别数字的不同朝向并调整解题思路。

这个模型的上下文窗口有32000 tokens,虽然不及某些百万级的模型,但是对于日常使用来说已经完全够用了。
最后,如果你想试用这个新模型,只需要:
1. 打开Google AI Studio:https://aistudio.google.com/。
2. 选择Gemini 2.0 Flash Thinking模型 或 创建API 。

3. 开始体验 免费、快速、强大的 Gemini 2.0!
最后说一句,看到谷歌这次的表现,我真的觉得AI的竞争要开始变得更有意思了...

往期推荐



从0到1用AI做了个AI服务网站, 全程没写一行代码。

当Claude3.5 遇上 Gemini 2,这个免费的AI编程竞技场炸了。

TEN Agent 一键让 Coze Bot 开口说话,这下AI助手终于能跟我聊天了。

我花了72小时研究Cursor Agents,以下是必须分享的硬核干货!

Cursor从入门到精通:不可错过的七大技巧分享,Agent、Cursorrules(详细教程)

🌟 知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。

AI进修生
AI算法工程师 / Prompt工程师 / ROS机器人开发者 | 分享AI动态与算法应用资讯,提升技术效率。
 最新文章