—
没有GPT-5的Devday,开发者们还有哪些期待?
去年,OpenAI在旧金山举办了一场引发业界轰动的开发者大会(DevDay 2023),推出了一系列新产品和工具,包括支持128K上下文的GPT-4 Turbo,API价格下调,新的Assistants API,具备视觉功能的GPT-4 Turbo,DALL·E 3 API,以及大幅改进的JSON模型,还有命运多舛的GPTs和类App Store平台GPT Store。CEO Sam Altman信心满满的说:“我们希望你明年还能来,相较于我们正在精心打造的新成果,今天发布的东西会显得非常过时”,再次拉高外界预期。在刚刚经历新一轮高管团队离职风波之后,OpenAI年度盛事DevDay 2024即将到来,所有人心中都有一个疑问:接下来会发生什么?然而,今年OpenAI的DevDay却悄然改变了调性。先是宣布了大会的举办形式进行了调整,从大型活动转变为一系列路演式的开发者互动环节。更令人意外的是,根据官方的剧透,OpenAI在DevDay期间不会发布其下一代主要旗舰模型,而是将重点放在API和开发者服务的更新上。简而言之:下一代模型还在炉子里烤着呢,所以干脆只字不提。DevDay不再是模型大会,这次真的是“开发者”大会了。没有GPT-5的Devday,开发者们还有哪些期待?尽管OpenAI宣布今年的DevDay不会发布新一代旗舰模型,但业界对此次开发者大会仍抱有诸多期待。根据猜测,OpenAI可能会重点推出长期推理和函数调用等新API能力,同时增强模型的代理能力,为开发者提供更多自主权和与其他API集成的可能性。
4o语音模式的API也备受期待
硅星人也与几位开发者进行了交流,了解他们对API的真实需求,多模态和性能成为关注的焦点。
Talkme是一款面向海外市场的语言学习ToC产品,CEO贾子健告诉硅星人,对于出海的AI开发者,通常都会选择OpenAI的API,少量会用Gemini和Claude。Talkeme使用的主力API是OpenAI,加上Gemini辅助。
“GPT-3.5 Turbo基本已经淘汰,大家都会转成4o-mini或者4o去完善业务逻辑。更复杂的tob类SaaS产品,可能会考虑GPT-4,能力更强,相对也更贵。”o1目前也在Talkme的考虑范围内,但由于成本较高,目前仅限于实验性功能的预研,无法投入到ToC应用正式生产当中。“o1的能力的确很强,但从工程的角度来说,一部分用o1、一部分用4o、一部分用4omini,基本上就可以覆盖开发场景。”对于OpenAI API的期待,贾子健表示主要有三点:第二是低延时下的多模态能力,“我们的多模态能力目前一部分在用4o,一部分在用Gemini”。第三点是更稳定的JSON输出。“OpenAI的公众化还没有那么严谨,更多可能是科学家算法主导,导致OpenAI输出的JSON不是很稳定,很多场景反而不如自己写正则,去解析输出的文本内容。在这个维度上,谷歌比OpenAI做的好,如果能有稳定的JSON输出,对于开发者是比较受益的。”Cocos引擎运营总监、老菜喵主理人晨阳从国内AI产品的角度进行了分析。他告诉硅星人,从目前能力和响应速度来看,OpenAI仍然是最强,另一方面,国内的开发者考虑的更多是合规性和使用的ROI,而国内的Qwen,豆包,MiniMax,文心等模型也都在追赶,部分产品优惠后的性价比不弱于OpenAI。他表示,“未来需求一定是多模态的,传统的HTTP Post请求会被逐渐淘汰,国内的豆包已经率先用上了WebRTC,网传OpenAI WebRTC即将开放。所以未来市场除了模型的质量,要考虑综合的效果,ASR,TTS,WebRTC等结合,从这个角度考虑,国内的产品在整合上优势更大,价格战有机会取得优势。”语核科技面向企业场景应用,技术合伙人池光耀希望OpenAI API的更新能够提供两方面的改进:内置一些工程化能力来减少或检测幻觉;对于o1,提供更灵活的使用选项,允许用户指定是否在本次请求中使用复杂推理功能。DevDay的焦点转变与OpenAI近期在生成式AI发展中采取更多渐进步骤的战略相契合。公司目前正在优化其旗舰模型GPT-4o和GPT-4o mini,在生成式AI的竞赛中面临保持技术领先的挑战。根据某些基准测试,OpenAI似乎已经失去了绝对的技术领先地位。其中一个原因是获取高质量训练数据的困难,据Originality.AI的数据,全球排名前1000的网站中,已有超过35%封禁了OpenAI的网络爬虫。麻省理工学院数据溯源计划的一项研究发现,约25%来自“高质量”来源的数据,已经被限制使用在训练AI模型中。为了应对这些数据获取的挑战,OpenAI已经与出版商和数据经纪商签订了一系列高额授权协议。压力的另一方面来自运营公司的成本,据路透社报道,OpenAI预计今年营收将达到37亿美元,同时将亏损50亿美元,主要用于支付运营服务成本、员工薪资和办公室租金等,这还不包含员工股权激励等其他大额支出。为了解决资金问题,OpenAI正在推进新一轮的融资,9月初,融资消息传出,OpenAI可能以1500亿美元的估值获得65亿美元的投资。据消息人士透露,这一估值取决于OpenAI能否将其公司结构转变为与其竞争对手Anthropic和xAI类似的盈利模式。不过最新的消息是,最新一轮65亿美元的融资,苹果已经决定不参与。此外,上周首席技术官、首席研究官和研究副总裁先后离职,也为OpenAI增添了不确定性。尽管OpenAI首席财务官Sarah Friar于9月27日向投资者透露,本轮融资已超额认购并计划在月底前结束,但融资谈判仍未最终敲定,参与者和具体金额仍可能有所变动。专注于API,或许与OpenAI在财务上面临的压力相关。根据FutureSearch公布的研究报告和相关数据,OpenAI年收入为34亿美元,其中76%的营收来自ChatGPT付费用户(ChatGPT Plus、ChatGPT Enterprise和ChatGPT Team订阅),API接口服务贡献了公司15%的收入,约5.1亿美元。API驱动的服务模式曾经帮助AWS这样的平台迅速成长,随着越来越多的企业利用亚马逊的API开发新产品或服务,从而产生网络效应,其生态系统的价值不断增长。虽然OpenAI目前API带来的直接收入占比不高,但是在ChatGPT增速放缓、OpenAI更多地采取了渐进式的步骤来发展生成式AI的背景下,通过提供更好的API或许可以为公司开辟新的市场机会,并促进与其他企业的合作。没有GPT-5,高管出走,向营利公司转型,这一系列的事件都预示着商业化已经成为Sam Altman迫切需要解决的问题,OpenAI将更多考虑利润,而不是实现AGI。很长一段时间以来,Sam Altman用高超的技巧,一边操纵公众情绪,一边经营自己的事业,堪称科技界CEO中的翘楚。但如果你在旧金山的OpenAI DevDay上听到他谈论关于OpenAI计划转向“盈利模式”的讨论,请不要感到意外。