出品 | 搜狐科技
作者 | 郑松毅
运营编辑 | 王一晴
审核|孟莎莎
9月25日,就在OpenAI宣布GPT语音功能正式开放之际,谷歌也亮出了大招,发布了两个“招牌”模型的升级版本——Gemini-1.5-Pro-002和更轻量化的Gemini-1.5-Flash-002。
这次升级可谓是诚意满满,两款模型不仅在性能表现方面得到增强,1.5 Pro的使用价格更是直接砍半。
对于多数开发者来说,这无疑是个好消息,因为比起性能强大但价格昂贵的模型来说,如今的Gemini 1.5系列模型是个不错的性价比之选。
综合素质、数学、
逻辑推理能力明显提升
关于两个升级模型的具体表现,先放一份谷歌官方披露的“成绩单”供参考:
在更具挑战性的“MMLU-Pro(改进版本的综合素质测试)”测试中,两个升级模型较前一版本有7%-8%的性能提升。
MMLU-Pro是大规模多任务理解数据集,涵盖STEM、人文、法律等数十个学科,旨在测试模型理解和解决问题的能力。
在回答常规数学问题(Math)和竞赛数学问题(HiddenMath)方面,两个升级模型性能分别提升了约20%。
逻辑推理(Reasoning)方面,两个升级模型都有超过10%的性能提升。
除此之外,在多模态信息(文本、图像、音频、视频)理解、安全等多方面,两个升级模型表现均有提升。
谷歌介绍,“除了性能有所提升外,模型的回答输出速度较之前提升了2倍,延迟降低了3倍。”
为更好地满足用户实际使用需求,升级模型的响应风格采用了更简洁的样式(对于摘要、问答等用例,更新模型的默认输出长度比之前短5%-20%左右),旨在让模型更易使用并降低成本。
此外,谷歌将1.5 Flash的付费层速率限制从1000 RPM提升至2000 RPM,1.5 Pro从360 RPM提升至1000 RPM,以便开发者能够利用Gemini高效构建更多应用。
1.5 Pro是谷歌最初于2月份发布的AI模型,最突出的特点是具有高达200万个tokens的上下文长度,支持处理超大量的推理任务。
而1.5 Flash模型更为轻量化,以满足处理大量数据时能迅速响应的需求。
从近期LMSYS竞技场数据来看,榜单上游位置已长期被OpenAI和谷歌两家占领。两大AI巨头的模型更新已成为竞技场放榜的最佳看点。
截止发稿,OpenAI最新模型o1暂居榜首位置,9月3日更新版本的GPT-4o暂时领先于8月27日更新版本的Gemini 1.5 Pro。
最新版本的1.5 Pro和1.5 Flash模型在LMSYS竞技榜单中的排名暂不得知。
1.5 Pro价格打对折,
比GPT-4o便宜
说完了性能提升,再来看看大家最关心的模型使用价格。
谷歌宣布,从今年10月1日起,Gemini-1.5-Pro模型使用将更加优惠。
当提示词少于或等于128K Token时,每百万输入Token价格降低64%,每百万输出Token价格降低76%。
当提示词大于128K Token时,每百万输入Token价格降低29%,每百万输出Token价格降低53%。
与其直接对手GPT-4o相比,谷歌1.5 Pro的使用价格更具优势。GPT-4o每百万输入Token价格为5美元,每百万输出Token价格为15美元。
自年初以来,大模型价格战持续升级。海内外包括谷歌、OpenAI、百度、智谱等一众科技大厂相继打低模型使用价格,争抢市场客源。
有业内人士表示,“短期来看,大模型的性能遇到了瓶颈,谁也甩不开谁,谁也拿不出杀手锏。降低成本和使用价格是每一家厂商的最高优先级任务。”
但更多声音认为,“AI大模型不能只是拼价格,更要拼技术,拼解决行业痛点,应把更多精力放在超级应用当中。”