谷歌发布自研“推理”大模型：目前可免费体验，简单问题没翻车

科技 2024-12-20 10:47 北京

北京时间12月20日，谷歌发布自研新型“推理”人工智能大模型——Gemini 2.0 Flash Thinking Experimental ，目前该模型处于实验阶段。从简短测试来看，该模型确实在用更多时间进行分步推理，一些此前大模型翻车的简单题目上，该模型给出了准确答案。

新模型名为Gemini 2.0 Flash Thinking Experimental，目前可在谷歌AI原型平台AI Studio（https://aistudio.google.com/）中使用。模型卡将其描述为“最适合多模态理解、推理和编码”，能够“推理”编程、数学和物理等领域最复杂的问题。

在X上的一篇帖子中，AI Studio产品负责人Logan Kilpatrick称 Gemini 2.0 Flash Thinking Experimental 是“谷歌推理之旅的第一步”。

Google DeepMind 首席科学家Jeff Dean在X上发帖表示，Gemini 2.0 Flash Thinking Experimental “经过训练，可以使用思维来强化其推理能力”。

“当我们增加推理时间计算时，我们看到了有希望的结果，”Jeff Dean说，他指的是在考虑问题时“运行”模型所使用的计算量。

Gemini 2.0 Flash Thinking Experimental建立在谷歌最近发布的Gemini 2.0 Flash模型之上，其设计与OpenAI 的o1等推理模型类似。与此前的大模型不同，推理模型可以有效地进行自我事实核查，这有助于它们避免一些通常会绊倒人工智能模型的陷阱。缺点是，推理模型通常需要更长时间（通常需要几秒到几分钟）才能得出最后的答案。

根据智能超参数的体验，给出提示后，Gemini 2.0 Flash Thinking Experimental会暂停一下再做出反应，考虑一系列相关提示，并在此过程中“解释”其推理，并给出它认为的最准确答案。

当智能超参数问单词“strawberry”中有多少个R时，它回答“三个”。当问 9.11 和 9.9 谁更大时，它分步给出了 9.9 更大。此前不少大模型在这些简单题目上表现翻车，给出了错误答案。

推理大模型目前正成为大模型厂商的竞争焦点。随着 OpenAI 发布 o1 模型之后。11 月初，人工智能研究公司DeepSeek发布了其首个推理模型DeepSeek-R1的预览版。11月底，阿里云通义千问团队公布了更擅长推理任务的QwQ(Qwen with Questions)开源推理模型。

推理模型能否最终获得市场认可仍然需要进一步观察。因为，这类模型在运行时需要消耗大量算力，并且给出答案的时间更长。目前，大模型厂商对此类模型的收费也更高，部分原因是因为运行成本较高。

觉得内容有收获，请您加个关注，标个星～谢谢您

智能超参数

看趋势，涨知识，开眼界。记录AI技术与商业。提供独立思考与理性价值。

1.92亿元！深圳龙华区人工智能项目（5类大模型应用）开标，科大讯飞、讯飞医疗等联合体中标

AI标讯｜浙江树人学院智慧健康公共服务工程研究中心项目，讯飞智元中标，金额497万元

AI标讯｜同方水务集团水务AI大模型及厂长AI助手项目开标，中工互联中标，金额350万元

AI标讯｜晋能控股煤炭板块AI管理平台应用研究项目，科大讯飞中标，金额478万元

AI标讯｜邮储银行北京分行智能抽取写作平台建设服务项目，融汇金信中标

挡不住的AI编程助手Cursor：仅用4个月时间，估值暴涨6.5倍

谷歌发布自研“推理”大模型：目前可免费体验，简单问题没翻车

AI标讯｜浙商证券代码智能辅助大模型系统采购项目，阿里云中标，金额14.5万元

AI标讯｜沈阳市大东区人工智能大模型项目开标，辽宁讯飞中标，金额约1.16亿元

AI标讯｜浙能集团AI平台优化升级项目开标，百度中标，金额未披露

AI标讯｜上海银行AI服务器设备（推理型）采购项目，超云中标，金额约800万元

Salesforce CEO：企业将向“Agent为先”转变

AI搜索公司Perplexity完成5亿美元新融资，估值较上一轮涨2倍，达90亿美元

AI标讯｜宁夏电信1亿元大模型采购项目开标，智谱成最大赢家，预计将拿下7000万元

AI标讯｜哈工大人工智能产教融合创新平台第一阶段项目，中移系统集成中标，金额6918万元

AI标讯｜国投资本智能问答系统首期建设项目开标，火山引擎中标，金额83.7万元

AI标讯｜国投瑞银AI代码辅助工具采购项目，阿里云中标，金额2.13万元

AI标讯｜北京移动基于AI大模型的安全防护创新研究采购项目，绿盟科技中标，金额约52万元

AI时代，跟着亚马逊云科技赚“出海”的钱

AI标讯｜石景山区大模型产业服务平台项目开标，火山引擎中标，金额3935万元

AI标讯｜河北交投智能科技公司AI大模型能力建设项目开标，智谱中标，金额256万元

AI标讯｜四川省市场监督管理局AI服务平台项目开标，百度中标，金额236万元

AI标讯｜四川才子软件公司AI大模型基座采购项目开标，百川智能中标，金额2680万元

智谱完成30亿元融资，商业化能力赢得信任票

红杉资本合伙人展望2025年AI行业：大模型将会分化，AI搜索成杀手级应用，资本竞赛减缓

AI标讯｜中国星网网络创新研究院科研智能助手项目，亚信科技中标，金额238万元

AI标讯｜招商证券公司级内容审核服务采购项目开标，数美科技中标

AI标讯｜南京鼓楼医院AI大模型训练平台项目开标，宽泛科技中标，金额135.7万元

用于训练大模型的数据将于2028年耗尽，模型研究方向可能转向更小、更专

AI标讯｜联通视频AI智能体服务项目公示，火山引擎中标，单一来源采购

AI标讯｜招商公路高速公路安全生产大模型场景应用项目，招商新智中标，金额766万元

AI标讯｜广州白云区政务民生数据AI大模型分析平台项目，中电信广东分公司中标，金额918.5万元

AI大模型一周标讯：商汤科技、百度、智谱华章、科大讯飞、阿里云、火山引擎等中标

Ilya Sutskever在NeurIPS 2024大会演讲全文：预训练将结束，超级智能将完全不同

AI大牛Ilya最新发声：预训练将结束，AI将有自我意识

AI标讯｜北航人工智能学院国产化高性能计算平台项目，商汤科技中标，金额7385万元

AI标讯｜联通(广东)产互公司AI研发助手软件产品采购项目，科大讯飞中标，金额约61万元

AI标讯｜北金所CFAE平台智能文档撰写辅助工具三期项目，百度中标，金额未披露

AI标讯｜广州电信多模态CV大模型采购项目开标，百度中标，金额691万元

AI标讯｜吉林银行大模型知识引擎（一期）建设项目，开科唯识中标，金额168万元

AI标讯｜北京邮电大学教育服务大模型智算底座采购项目，联通数科中标，金额2298万元

AI标讯｜深圳水务多模态大模型开发服务项目开标，天源迪科中标，金额726.6万元

ChatGPT核心研发科学家演讲：有些智能可能永远不会出现在数据中

AI标讯｜中国外汇交易中心大模型创新研发支持服务采购项目，百度中标，金额58万元

AI标讯｜安徽烟草数字虚拟人制作服务项目开标，科大讯飞中标，金额47.5万元

AI标讯｜上海“闵智心语”心理健康大模型——AI赋能咨询体系建设项目，科大讯飞中标

AI标讯｜北京银行京信妙笔智能会议二期建设项目，火山引擎中标，金额90万元

AI标讯｜华东师范大学人工智能训练全流程开发应用系统项目，阿里云中标，金额149万元

AI标讯｜北航人工智能通识课教学实践一体化平台采购项目，郑州云海科技中标，金额696万元

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉