首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

不怕OpenAI抢风头！谷歌发布Gemini 1.5升级模型，综合能力提升，价格减半

科技科技 2024-09-26 18:02 北京

出品 | 搜狐科技

作者 | 郑松毅

运营编辑 | 王一晴

审核｜孟莎莎

9月25日，就在OpenAI宣布GPT语音功能正式开放之际，谷歌也亮出了大招，发布了两个“招牌”模型的升级版本——Gemini-1.5-Pro-002和更轻量化的Gemini-1.5-Flash-002。

这次升级可谓是诚意满满，两款模型不仅在性能表现方面得到增强，1.5 Pro的使用价格更是直接砍半。

对于多数开发者来说，这无疑是个好消息，因为比起性能强大但价格昂贵的模型来说，如今的Gemini 1.5系列模型是个不错的性价比之选。

综合素质、数学、

逻辑推理能力明显提升

关于两个升级模型的具体表现，先放一份谷歌官方披露的“成绩单”供参考：

在更具挑战性的“MMLU-Pro（改进版本的综合素质测试）”测试中，两个升级模型较前一版本有7%-8%的性能提升。

MMLU-Pro是大规模多任务理解数据集，涵盖STEM、人文、法律等数十个学科，旨在测试模型理解和解决问题的能力。

在回答常规数学问题（Math）和竞赛数学问题（HiddenMath）方面，两个升级模型性能分别提升了约20%。

逻辑推理（Reasoning）方面，两个升级模型都有超过10%的性能提升。

除此之外，在多模态信息（文本、图像、音频、视频）理解、安全等多方面，两个升级模型表现均有提升。

谷歌介绍，“除了性能有所提升外，模型的回答输出速度较之前提升了2倍，延迟降低了3倍。”

为更好地满足用户实际使用需求，升级模型的响应风格采用了更简洁的样式（对于摘要、问答等用例，更新模型的默认输出长度比之前短5%-20%左右），旨在让模型更易使用并降低成本。

此外，谷歌将1.5 Flash的付费层速率限制从1000 RPM提升至2000 RPM，1.5 Pro从360 RPM提升至1000 RPM，以便开发者能够利用Gemini高效构建更多应用。

1.5 Pro是谷歌最初于2月份发布的AI模型，最突出的特点是具有高达200万个tokens的上下文长度，支持处理超大量的推理任务。

而1.5 Flash模型更为轻量化，以满足处理大量数据时能迅速响应的需求。

从近期LMSYS竞技场数据来看，榜单上游位置已长期被OpenAI和谷歌两家占领。两大AI巨头的模型更新已成为竞技场放榜的最佳看点。

截止发稿，OpenAI最新模型o1暂居榜首位置，9月3日更新版本的GPT-4o暂时领先于8月27日更新版本的Gemini 1.5 Pro。

最新版本的1.5 Pro和1.5 Flash模型在LMSYS竞技榜单中的排名暂不得知。

1.5 Pro价格打对折，

比GPT-4o便宜

说完了性能提升，再来看看大家最关心的模型使用价格。

谷歌宣布，从今年10月1日起，Gemini-1.5-Pro模型使用将更加优惠。

当提示词少于或等于128K Token时，每百万输入Token价格降低64%，每百万输出Token价格降低76%。

当提示词大于128K Token时，每百万输入Token价格降低29%，每百万输出Token价格降低53%。

与其直接对手GPT-4o相比，谷歌1.5 Pro的使用价格更具优势。GPT-4o每百万输入Token价格为5美元，每百万输出Token价格为15美元。

自年初以来，大模型价格战持续升级。海内外包括谷歌、OpenAI、百度、智谱等一众科技大厂相继打低模型使用价格，争抢市场客源。

有业内人士表示，“短期来看，大模型的性能遇到了瓶颈，谁也甩不开谁，谁也拿不出杀手锏。降低成本和使用价格是每一家厂商的最高优先级任务。”

但更多声音认为，“AI大模型不能只是拼价格，更要拼技术，拼解决行业痛点，应把更多精力放在超级应用当中。”

http://mp.weixin.qq.com/s?__biz=MzU2OTgzMDg3Mg==&mid=2247510781&idx=2&sn=cb173cf1a3a242317daf61553a554189

搜狐科技聚焦前沿科学与科技产业报道，深度跟踪基础科学、人工智能、互联网、通信等领域重大事件，洞察科技趋势与商业逻辑。

最新文章

谁扶听泉凌云志？

对话PandaX实验刘江来：暗物质有“隐身术”，会穿墙，甚至能穿越整个宇宙来到地球

营收首超特斯拉，比亚迪用1600亿构筑技术护城河

每日优鲜们烧了几百亿都没成的市场，被“00后”救活了？

被裁设计师转行AI创作，为赚钱200元代写作业的活儿也接

频繁使用GPS丧失方向感？清华大学陈霓虹：影响或可逆，可通过学习训练提升

疯狂小杨哥，换“马甲”复播？

百万年薪大厂人35岁被裁：AI创业3个项目赚3万，为还房贷重返职场

商汤十周年陷裁员风暴：员工不知裁员标准，押注AI六年半亏528亿元

舆论场和直播间，两个不同的董宇辉

苹果第四财季净利润下滑36％，大中华区收入仍在下滑

任正非最新讲话：美国科技非常发达，源于它的开放包容；华为要向美国学习

把上海孩子逼得可能停课的“康妮”，到底是什么来头？

联想为什么在国外起诉中兴？

双十一破财买清净？阿里巴巴主动赔给股东30亿，但并非所有股东都能拿到

ARM计划“断供”高通，昔日伙伴为何“反目成仇”？

对话梅宏院士：现在的大语言模型技术路径不可能通往AGI，天花板是能预测到的

VIP会员只支持1台设备！爱奇艺，心太急

为何会海水倒灌？海大江文胜：风暴潮叠加天文大潮等多种因素造成，小概率事件

“大龄”转行AI设计师：早先会AI是加分，现在是必备；想让自己留在“牌桌”上

“纯血鸿蒙”的AI，摁着苹果Apple Intelligence打？

OpenAI劲敌甩大招！Claude 3.5升级，能力反超GPT-4o，训练AI自己操控电脑

华为原生鸿蒙操作系统发布！余承东宣布：我们用一年走过了外国人十几年的路

对话智源研究院院长王仲远：纯语言模型无法实现AGI，多模态将是必经之路

小马智行冲刺美股IPO：Robotaxi何时赚钱，两年半亏损23亿，IPO前估值600亿

当AI遇上美国大选：你猜大模型们觉得谁能赢？

盒马换帅200天，阿里新零售没有新故事

揭秘团播生意经：有中腰部主播月薪五万，爱豆“下海”团播；“卷”是行业共识

纯血鸿蒙公测版体验如何？有用户4天反馈40个BUG，想用微信要靠“抢”

搜索引擎真要被替代了？实测Kimi、智谱、360最新AI搜索功能，它的表现最强

撒哈拉沙漠发洪水？兰州大学王澄海：危害比内陆大，会威胁动植物，传播疾病

“AI教父”否定AI？！无论再堆多少GPU，现在的AI也实现不了AGI！

黄仁勋谈AI改变工作方式，生产力提升不意味需要裁员

警惕短剧收割老年人！大妈天天熬夜刷短剧，半年花了1.3万

见证历史！SpaceX星舰第五次发射：“筷子”成功夹住超大型火箭，完成回收任务

AI手机进化一年，厂商们不再一心求“大”

特斯拉的Robotaxi，和百度萝卜快跑有什么不同？

特斯拉Robotaxi亮相！除了没有踏板和方向盘，还有哪些意外惊喜?

对话清华刘嘉：诺奖颁给AI是物理学的自我革命，AI必须纳入物理体系

县城贵妇，买爆山姆

获66亿美元融资、估值1570亿美元，OpenAI“抛弃”技术理想，加速商业化

2024诺贝尔物理学奖颁给了“AI 教父”，物理学真的不存在了？

钢铁侠大战奥特曼！旧金山不容二虎的AI商战，你站谁？

霸道总裁为什么偏偏爱上绝经的我

滞留太空114天，马斯克拯救宇航员布奇和苏尼

余承东最新发言：三折叠手机春节前至少生产100多万台，大家都说我疯了

氢能是21世纪“终极能源”还是“大骗局”？

山姆·奥特曼，寡王当立

不怕OpenAI抢风头！谷歌发布Gemini 1.5升级模型，综合能力提升，价格减半

华为终端业务再发力：智界R7亮相，余承东自曝卖一台亏3万；纯血鸿蒙下月商用

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉