为何开发者们纷纷弃用谷歌Gemini

财富 2024-09-19 09:19 北京

谷歌的对话式AI“Gemini”相比竞争对手的技术，对开发者和企业来说使用起来过于复杂，导致其在人工智能竞赛中遇到挑战。

根据与开发者和帮助企业使用人工智能的多位谷歌员工的采访，谷歌的对话式AI“Gemini”相比竞争对手的技术而言，对应用开发者和企业来说过于复杂，难以使用。

Topology初创公司创始人艾登·麦克劳克林便是其中之一。他的公司专注于开发提升现有AI模型推理能力的软件。麦克劳克林表示，首次使用OpenAI的应用程序接口只花了30秒，而使用谷歌的Gemini却耗费了4个小时，因为谷歌要求他设置一个云账户并进行大量配置。此外，谷歌系统中的一些漏洞有时还迫使他不得不回退。

他表示：“如果谷歌的模型远远优于OpenAI和Anthropic的产品，我愿意跳过所有这些障碍。”但他补充道：“最重要的是模型的性能有多好，然而除了少数特殊情况，谷歌的模型似乎只能排在第三。”

开发者在使用Gemini时遇到的困难对谷歌的云业务也有影响，谷歌希望通过Gemini吸引更多客户使用其服务器租赁服务。部分谷歌员工认为，这些问题还可能影响Gemini本身的开发。

OpenAI通过吸引大量付费用户购买其AI模型或使用ChatGPT，获得了大量关于其AI性能的隐性和显性反馈，从而进行改进。如果谷歌的Gemini无法达到同样的使用量，该公司可能在制定改进计划时面临更多不确定性。

两名曾参与Gemini开发的员工表示，这可能还会影响谷歌为其消费者产品和广告产品开发Gemini模型的进程，特别是在搜索引擎和语音助手中提供对话式回答的功能。

Abacus AI公司首席执行官宾杜·雷迪表示：“让开发者使用Gemini解决复杂的现实世界问题……是为下一代Gemini提供至关重要的反馈。使用越多，改进的效果越好。”她还指出，尽管Gemini今年取得了巨大进步，但在支持企业AI应用方面，其可靠性仍不如竞争对手的模型。

谷歌发言人表示，开发者反馈对于改进Gemini模型非常重要，但这并非唯一的数据来源。部分AI研究人员认为，通过让AI向各个领域的专家学习，也可以带来显著的进步。

无论是小型开发者还是大公司，都在使用像OpenAI的GPT-4这样的大型语言模型开发各种应用，涵盖从自动化客服、数据分析到欺诈检测和生成计算机代码的广泛领域。OpenAI和微软每月通过向开发者销售大型语言模型大约创造1亿美元的收入，客户包括量化交易公司Jane Street、摩根士丹利等银行以及金融科技公司Stripe等。

谷歌列举了几家使用Gemini的客户，包括梅赛德斯-奔驰、高盛集团和优步。这些公司表示，AI用于从客户服务到代码辅助等各个领域，但具体的采购规模尚未得知。（谷歌此前设定了今年在北美通过AI云服务创造10亿美元收入的目标，但其销售的AI服务不止限于LLM。）

Alphabet公司首席执行官桑达尔·皮查伊在7月的第二季度财报电话会议上表示，自年初以来，已有超过200万名开发者使用了Gemini，但并不清楚其中是否包括仅尝试过一次或两次的开发者。

相较于OpenAI的模型，Gemini在开发者中的不受欢迎似乎在谷歌内部和外界已是公开的秘密。

对比分析

例如，企业软件初创公司Retool在6月对超过750名科技工作者进行的调查显示，只有2.6%的受访者表示他们最常使用谷歌的Gemini来构建AI应用程序，而使用OpenAI的比例高达76%。虽然Gemini略微领先于Anthropic的Claude（后者的使用率为2.3%），但Retool公司指出，Claude的使用率自2023年11月报告以来已增长了四倍多。（Gemini直到一个月后才对开发者开放。）

Similarweb的数据显示，从6月到8月，OpenAI的开发者页面获得了8280万次访问，而谷歌在同期仅有840万次浏览量。

一些小规模的非正式调查也提供了类似的证据。上月底，Finetune初创公司创始人朱利安·萨克斯在旧金山的共享办公空间内询问了50位AI初创公司开发者，他们主要使用的对话式AI模型是什么。几乎所有人都表示他们大多使用Anthropic或OpenAI的模型，而没有人主要使用Gemini。对此，萨克斯并不感到惊讶。

他表示：“我觉得在编程方面，Gemini无法与其他模型相比。”

谷歌花了近一年时间，经过一次重大重组，才推出了可以与OpenAI的GPT-4竞争的模型，而后者早在2023年初就已发布。谷歌在2023年12月开始向开发者提供Gemini模型，虽然在一些流行的对比评估中，其表现接近OpenAI的模型，但OpenAI的先发优势使其在开发者中树立了知名度。

一些谷歌员工认为，今年另一家年轻的AI公司Anthropic也凭借开发者之间的口碑营销快速崛起，许多开发者推荐Claude作为OpenAI模型的替代品，尤其是在编程辅助方面。

“Gemini令人困惑”

Gemini似乎未能引起太多关注。开发者表示，Gemini模型在分析长篇文档或代码库时非常有用，因为它们能够一次处理比其他模型更多的信息。然而，开发者也指出，谷歌使得使用这些模型比竞争对手更加复杂，原因在于其提供的选项种类繁多、某些选项需要的步骤较多，以及其开发者系统与OpenAI相比存在的其他差异。

有时，谷歌为使用Gemini提供的不同选项甚至会在搜索结果中相互竞争。据一名知情人士透露，今年春天的一段时间里，谷歌推广给大企业使用Gemini的服务Vertex AI Studio，曾在谷歌AI Studio的广告中作为赞助结果出现，而后者是一个让开发者更容易使用Gemini的简化工具。

“人们在试图弄清楚这些选项时常常会感到困惑，”OpenSea的前首席技术官亚历克斯·阿塔拉说，他在为自己创业公司OpenRouter使用Gemini时遇到了类似的困难，该公司为使用大型语言模型的开发者提供软件服务。

尽管谷歌在去年12月推出了AI Studio服务，旨在让开发者更容易使用Gemini，但开发者在Gemini上发送查询的方式与GPT和Claude不同，而后两者使用的是相似的格式。这一差异让开发者不太愿意转向Gemini，麦克劳克林说。

Gemini在社交媒体，尤其是X（原Twitter）上经常受到批评。本月早些时候，安全初创公司Xbow的AI研究员布伦丹·多兰-加维特发布了一篇关于他通过谷歌另一款AI开发应用Vertex使用Gemini时遇到的繁琐步骤的帖子，迅速走红。其他开发者也纷纷跟帖，表达了相同的感受。

“巩固的市场份额”

谷歌正试图改变外界对Gemini的负面看法，包括在X上回应对Gemini的批评。此外，谷歌还在举办开发者活动以推广Gemini，并推出了其他激励措施，例如举办开发者竞赛，要求参赛者开发出最佳的Gemini驱动应用程序，第一名将获得定制的电动版DeLorean跑车，车牌号为“G3M1N1”。（谷歌最近将最终结果推迟到今年晚些时候公布。）

据一位参与开发者产品工作的内部人士透露，谷歌还在考虑合并一些功能重叠的应用程序开发产品，以减少开发者的困惑。

“现实情况是，OpenAI在LLM API的开发者生态中，比谷歌早一点推出了实用的解决方案，”谷歌AI Studio产品负责人洛根·基尔帕特里克表示。他于今年4月加入谷歌，此前在OpenAI负责开发者关系。“我们必须与他们目前在开发者群体中的固有市场份额竞争。”

本周，OpenAI发布了一款名为“o1-preview”的推理模型，能够在一些技术或复杂任务中优于现有的大型语言模型。这可能会给谷歌带来压力，迫使其发布类似技术，否则可能在开发者的评价中进一步落后于OpenAI。

“VIP待遇”

与此同时，谷歌正在开发Gemini的下一版本2.0。由于AI竞赛可能会持续较长时间，这给了谷歌机会去寻找突破，追赶或超越OpenAI的技术。

实际上，Gemini已经赢得了一些忠实用户，尤其因为它能够处理比竞争对手更多的信息。Starcycle的创始人杰克琳·修表示，她的公司使用Gemini 1.5 Pro，这是谷歌为开发者提供的最先进的大型语言模型），用于从文档中提取数据。汤森路透也类似地使用Gemini开发了一款法律援助工具，比较冗长的法律文件并查找不一致之处。

对于一些大公司来说，使用谷歌AI的复杂性并不是决定性问题。Wayfair零售平台的首席技术官菲奥娜·谭表示，公司获得了谷歌员工的“白手套”服务，他们正在帮助Wayfair开展一个项目，依靠Gemini将旧数据库转换为更易用的格式。

然而，其他开发者则没有给Gemini机会，因为他们不需要改变已经在使用的解决方案。Martyn Strydom正在开发一款名为Dots的应用程序，该应用根据健身追踪器的数据提供健康建议。他表示，公司使用Claude作为代码助手来开发应用，并使用OpenAI的旧版GPT模型来回应客户。他认为公司没有时间不断测试不同的语言模型。

“现在，基本上所有人都在使用OpenAI、Claude或者Cursor，”他提到Cursor是一个由OpenAI和Anthropic模型驱动的AI代码助手。“如果世界上顶尖的工程师都在使用这些工具，我们怎么能说‘让我们去试试别的东西’呢？”（The Information）

AI新智能

一个致力于探索人工智能对商业世界和社会影响的平台。

最新文章

OpenAI正式推出Sora Turbo

OpenAI推出全新O1模型，支持图片上传与分析，同时发布ChatGPT专业版

AWS将多代理编排功能引入Bedrock

人工智能代理入门（下）：自主性、保障措施和陷阱

人工智能代理入门（上）：捕获流程、角色和连接

马斯克与OpenAI分手的复杂内幕

人工智能开启Web4.0时代：互联网将具备自主预测、计划和行动能力

AI如何重塑我们的思维方式？

多智能体将缩短大型语言模型与通用人工智能之间的差距

谷歌将推出接管电脑的人工智能技术

这家公司洞悉了AI商业化的秘密，CEO揭示其秘诀

被马斯克开除的前Twitter CEO，官宣了自己的人工智能创业项目

《纽约时报》的律师们在一个秘密房间里检查OpenAI的源代码

首个被人工智能重塑的城市

被撕裂的OpenAI

雷朋AI眼镜是目前已知的最佳人工智能硬件

为何开发者们纷纷弃用谷歌Gemini

GPT5暂时没戏了

苹果的AI手机没有任何亮点，难怪巴菲特提前把股票卖了

硅谷风投推荐的2024人工智能创业公司（内含商业模式）

一家AI诊所在伦敦开业了

代币价格大崩溃，人工智能将出现巨大赢家和输家

世界呼叫中心之都陷入AI狂热与恐惧之中

文远知行在最后关头推迟美股IPO

美国无人出租车现在每周提供10万次服务

GPU经济学：如何在“不破产”的情况下训练AI模型

苹果计划推出AI桌面机器人

人工智能的训练数据正在枯竭，合成数据引发巨大争议

马斯克曾考虑收购Character.AI

黑芝麻科技IPO首日暴跌35%

星野海外版—Talkie火爆美国，年轻人可以与川普、马斯克聊天

OpenAI 需马上融资，今年预计巨亏50亿美元

2024年吸引到顶级风投的28家人工智能公司名单

苹果公司将以观察员身份加入OpenAI董事会

Gemini的数据分析能力不像谷歌所宣称的那么好

AI“搬砖王”的崛起

大模型集体“用户焦虑”，豆包能否不靠字节赢一次？

这家眼镜公司成了AI巨头追捧的对象

Anthropic 的 Claude 3.5 表明：大模型还有提升空间

DeepMind推出新型AI，为视频生成音轨和对话

人工智能的负效应：没有大语言模型的语种未来会消亡

MiniMax在海外的AI陪聊产品，爆了！

30万个AI助理，正排队等待召唤

奥特曼围绕OpenAI打造出一个致富帝国

投资人依然愿意为AI搜索引擎付费

当ChatGPT的广东话“讲唔正”：AI 年代，低资源语言是否注定被边缘化？

来看看微软是如何将Windows打造成AI操作系统的

大模型“价格战”开打，给刚入商业化“佳境”的智谱AI提出了新挑战

奥特曼刚对首席科学家伊利亚的离职表示感谢，马上又有一位OpenAI高管辞职了

谷歌I/O 2024刚刚宣布的所有产品

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉