Gemini 2.0 发布，几乎免费无限量使用，能力不比 OpenAI 差

乐活 2024-12-17 14:00 四川

我的个人博客：www.moonkite.cn

各位好，我是风筝

目前国外 AI 大模型中，OpenAI 和 Claude 是公认最好的了，尤其是在编程方面，Claude 更是各种插件和 IDE 的首选大模型，例如 Cursor、Windsurf 。

Gemini 是 Google 的AI大模型，但是反响一直不佳，主要原因肯定体现在能力上。作为生产力工具，肯定是能者居之，也就有更多人买账。

最近 Google 终于发力了，前几天，发布了 Gemini 2.0。

Gemini 2.0 进一步发展了代理模型，能够更好地理解周围世界，提前思考，并在用户监督下代表用户采取行动。

目前无论是 Gemini 1.0还是 2.0 都差不是免费的，拿最新的 Gemini Experimental 1206 来说，每天有2097152免费 token，按照一次问答消耗1000个token算，一天能问2000次左右，是绝对用不完的。

OpenAI 和 Claude 的会员每个月都是几十刀，能力上现在几乎不相上下了。

使用地址： https://aistudio.google.com/prompts/new_chat

功能和能力

编码能力

作为程序员，首先肯定是看它的编码能力，有相关的测评显示，其编码能力几乎超过了目前公认最会写代码的 Claude Sonent 3.5。

但是，耳闻不如亲见。还得亲自试一下，之前1.0 的版本我是用过的，当时比 ChatGPT 免费版还要差很多，而且对中文的理解非常有限。让它改个bug都挺费劲的。

然后这次我想用它做一个小功能，就是一个 markdown 编辑器，左边是 markdown 源码区，右侧显示渲染后的结果，另外就是可以将渲染后的图片下载下来。

我用 Claude 和 ChatGPT 都做过这个功能，实话说，这功能没什么复杂度，用 Claude 是可以实现的，但是用 ChatGPT 免费版还是有些问题的。

下面是完整的 prompt，

我想要设计一个markdown 转图片的产品，要求如下：
用 React Nextjs 实现
左边是 markdown 编辑器，右侧是预览区；
不要使用markdown 默认的解析样式，可以只简单支持几个标签，例如 H1 、H2、引用、图片、代码标签；
要将 markdown 排版为美观大气的样式，可参考一些专业UI设计、广告设计等；
可将预览下载为无损图片，默认尺寸为1080×1350像素，可动态调整大小，样式要自适应
整体风格以天空蓝为主，要求简洁大气好了，开始帮我实现吧

然后基本上是一次成型，只是图片下载有点问题，把问题告诉它，修复一下就好了，基本可用。

OCR 能力

OCR 是一个大众需求，如果用第三方服务的话，不是很便宜。我用一张发票试了一下，效果绝对是比 OpenAI 强的。

这张发票有横向文字还是纵向文字，用其他的大模型，识别横向文字都没什么问题，但是基本上没有识别出纵向的。而 Gemini 竟然纵向文字识别的也很准确。

逻辑能力

经典问题，就是 13.8和13.11哪个大，下图是 Gemini 2.0 的回答。

答对了。

而 ChatGPT 还是说 13.11大。

Claude 也同意 13.11 更大。

国内的 kimi 也表示赞同。

当然这一个回答可能不能说明什么问题，因为国内的一些大模型也能回答对。

实时对话

可以在 Gemini 中进行实时对话，反应速度还是非常快的，但是不支持中文，能听懂中文，但是不会说中文，不知道是不是因为所在地区的问题。

入门应用程序

在 Gemini 上还有一个入门应用程序的功能，主要包含三大类功能。

1、上传照片并将 2D 或 3D 空间分析与推理相结合。让 Gemini 为您提供对象、文本等的位置。 2、一个交互式视频播放器，可让您汇总、描述场景、提取文本、搜索对象等。 3、使用 Gemini 和 Google Maps API 探索世界各地的地点。询问 Gemini 为您找到有趣的地方等等。

还可以看看风筝往期文章

程序员如何设计logo，如何找Icon和插画（绝对干货）

用这个方法，免费、无限期使用 SSL(HTTPS)证书，从此实现证书自由了

为什么我每天都记笔记，主要是因为我用的这个笔记软件太强大了，强烈建议你也用起来

「差生文具多系列」最好看的编程字体

我患上了空指针后遗症

一千个微服务之死

搭建静态网站竟然有这么多方案，而且还如此简单

被人说 Lambda 代码像屎山，那是没用下面这三个方法

古时的风筝，一个程序员，一个写作者。

古时的风筝

努力成为独立开发者的程序员，分享我了解的关于编程、独立开发等知识，知不不言，言无不尽

最新文章

GitHub Copilot 现在可以免费使用了!

Gemini 2.0 发布，几乎免费无限量使用，能力不比 OpenAI 差

AI 给初级程序员定价了，一个月3600元（第一个AI程序员 Devin 发布）

MySQL 索引失效了吧

字节被起诉实习生是如何给代码投毒的，还有公司敢用吗？

自学编程应该学什么语言？

程序员、独立开发者 icon 自由了

为什么有人说一些程序员很傲慢？

一个苹果快捷指令卖60万，RPA 大有可为

Linux：小老弟，还得给你上一课！

为什么程序员不拿自己写的程序去卖，而要在公司领死工资呢？

腾讯新推出的云端 IDE，同时对标字节MarsCode和Google Colab

不懂设计的程序员如何做出好看的页面（还是干货）

IDE 还在卷，Cursor 的对标产品 Windsurf 出来了

程序员如何设计logo，如何找Icon和插画（绝对干货）

「差生文具多」增大IDE字体，增大显示器

阿里又出状况了，这次是支付宝崩了

爬虫有风险，入门须谨慎

现在画个架构图都这么卷了吗

我发现，飞书多维表格可以做免费的数据仓库+数据大屏

苹果 M4 发布了，性能提升了，价格却没什么变化，要不要买呢，犹豫中

微软发布了自然语言开发工具，程序员砸起自己的饭碗子是一点儿也不手软啊

送 5 本好书，纯送

写代码不写注释，难道是我天生不爱写吗？

Linux 移除多名贡献者，Linux 本人表示不会撤回，开发者很是失望

1024 程序员节了，买几本书看看吧

Nginx 这个赛道还是被 JavaScript 闯进来了

jQuery 创始人是如何不熬夜还做那么多 Side Projects 的?

据说有 90% 的人做错了这道编程题

孤陋寡闻了，原来 MySQL 还能这么写？

45k*16薪，进字节了！

只用5分钟，就可以自动生成你的语音播客

就非得用反射才行吗？

都2024了，还在用 Postman 做 HTTP 接口测试吗？

淘宝网搞个 VsCode 、Excel 主题是几个意思，上班摸鱼刷淘宝？

难道这就是传说的自然语言 IDE

咱就是说，node_modules 非得这么玩儿吗？

硬核UP主稚晖君，开源了机器人框架，果然够硬

大A五天连涨，股民的热情直接搞瘫了上证股票交易系统（坐等回本）

又浪费时间了，我改了一款开源的安卓启动器，从此手机变得极度宁静了

Java 离AI还是太远了，这两个Spring AI 框架能稍微接近一下

阿里云盘照片泄漏到底是什么原因？

不管你是不是还用 Java 8，JDK23都如约而至了

独立开发者都用什么框架开发移动端产品

独立开发者都用什么框架开发客户端产品（PC客户端篇）

大家都用什么工具提交代码？腾讯也出了一个 Git 客户端，免费但不开源

我是如何开发这款摸鱼插件的

PostgreSQL 凭什么连续两年超越 MySQL，成为最受欢迎数据库

现在刚入行的 Java 开发者已经不知道 Tomcat 了

「差生文具多系列」Jetbrains IDEs中也能养宠物了，而且还有拳皇人物

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉