OpenAI,这个名字几乎等同于当前的AI革命。ChatGPT的横空出世,让生成式AI走进了大众视野,也让OpenAI坐上了AI界的头把交椅。
然而,AI大模型赛道不是只有OpenAI,2022年7月以来,前哨关注的科技企业中一直有Anthropic的大名。
2024年,生成式AI领域的融资标的进一步集中,Anthropic成为最后的三大玩家之一,除了融资外它在企业市场也正在迅速赶上OpenAI的脚步。
王煜全在周四的年度AI产业扫描中分享了详细的数据,也给出了融资最多、流量最大、赚钱最多的AI产品排行,如果你想了解详情欢迎点击文首入口加入。
今天,我们来继续了解一下Anthropic,这家OpenAI“叛军”组成的公司,为什么让OpenAI的管理层感到前所未有的压力,它和OpenAI的比拼究竟到了什么层次。
1.OpenAI的焦虑从何而来?
The information报道,今年秋季OpenAI开展了一次内部基准测试。
测试结果在OpenAI内部炸开了锅:Anthropic的AI编程模型Claude,竟然在关键指标上超越了OpenAI自家的模型!这对于OpenAI来说是无疑是一个噩耗。
因为,代码自动生成能力一直是OpenAI引以为傲的优势,也是ChatGPT吸引百万付费用户的核心功能之一。如今,这块“自留地”被Claude入侵,OpenAI管理层的焦虑可想而知。
更加雪上加霜的是,OpenAI去年投资的初创公司Cursor,在今年7月做出决定:将Anthropic的Claude模型设为其AI代码助手的默认选项,取代了OpenAI的位置。
Cursor 的联合创始人 Aman Sanger 在 10 月一档播客中分享了原因:Claude 3.5 Sonnet 是 “目前最适合” 代码编写的模型,因为它能更好地理解客户的需求。
Claude的反超不是停留在纸面的测评数据,已经体现在实实在在的商业影响力上。
Anthropic负责增长和收入的主管Kate Jensen透露,过去三个月,公司来自AI编程客户的年化收入增长了惊人的10倍,这和周四直播中我们分享的数据调查形成印证。
Airtable、LexisNexis、Intercom等知名企业纷纷选择Claude作为其AI解决方案,并对其在处理复杂任务、提高效率和准确性方面的卓越表现赞不绝口。
Airtable的CEO Howie Liu表示,Claude更大的上下文窗口允许员工上传冗长的销售电话记录,从而更好地突出对话的细节。LexisNexis的首席技术官Jeff Reihl则透露,该公司大约60%的AI功能都使用了Claude,主要用于起草或分析法律文件,而Claude的超长上下文窗口在这方面表现出色。
2.Anthropic的叛逆基因
Claude背后的公司是Anthropic,它的七位联合创始人全部来自OpenAI,CEO Dario Amodei 曾担任 OpenAI 的研究副总裁。
Dario 领导了 GPT-2 和 GPT-3 模型的开发工作,并合著关于人类反馈强化学习的开创性论文,可以说是最早一批见证Scaling Law的研究者。
据前员工透露,2020年Amodei 兄妹曾与 OpenAI 的 CEO Sam Altman 和总裁 Greg Brockman 在项目领导权和AI安全问题上发生冲突,这导致了他们与 OpenAI 的分裂。
正是这个原因,Anthropic在2022年夏天就开发出了一款AI聊天机器人,但并没有急于公开发布,而是选择继续进行安全测试,前哨当时关注到他们时公司的远景还是专注于研究具有可解释性的AI技术。
1年过去,ChatGPT成为先发领军者,Anthropic在热潮中才缓慢加入竞争,Claude最初的几个版本无论性能、价格都远不如ChatGPT,直到OpenAI内乱、在SORA视频领域分散资源,Anthropic凭借更长的上下文、通过人类反馈带来更好的AI理解能力,逐渐在市场中站稳脚跟。
技术竞赛没有停步的空间,一旦放慢脚步对手就会直追而上。
如今的 Anthropic 在技术上已经不弱于OpenAI。SemiAnalysis上周发布了一篇深度分析,Anthropic已经完成下一代AI大模型 Claude 3.5 Opus 的训练,展现出了强大的性能。
出于成本考虑,他们没有发布 Opus,而是用它作为教练优化3.5 Sonnet模型,用Opus生成的合成数据,通过强化学习与AI反馈(RLAIF)进行奖励建模提升3.5 Sonnet 的性能。
这种策略有效地利用了 Opus 的能力,也展现了他们更强的“内功”,专注解决AI训练中的大问题:数据稀缺。
合成数据:指的是使用 AI 模型生成的数据,用于训练其他 AI 模型。Anthropic 通过 Claude Opus 生成高质量的合成数据,并利用这些数据来提升 Claude 3.5 Sonnet 的性能,从而摆脱对传统数据集的依赖,加速了模型迭代。而 OpenAI 仍然更多依赖于人工标注的数据。
RLAIF (Reinforcement Learning with AI Feedback):与依赖人类反馈的 RLHF (Reinforcement Learning with Human Feedback) 不同,RLAIF 使用 AI 模型对模型的输出进行评估和反馈。这不仅降低了成本,也加快了模型训练的速度。Anthropic 在其 Constitutional AI 中就使用了 RLAIF 的方法。
3.AI军备竞赛走向新的方向
随着推理计算成为AI的新发展方向,OpenAI正在率先探索并行运行多个推理流,并选择出现频率最高的答案来提高准确性,利用起搜索这个AI进步的重要因素。
技术的竞赛远未到头,商业的考验接踵而来,两家公司都拿下投资人40亿美元融资,新一轮的军备竞赛才刚刚开始,这一次不只是技术路线的比拼,更是商业模式和生态构建的综合较量。
随着多模态扩展、开源模型逼近,AI产业格局还有变天的可能。
你想知道AI竞争的最新格局,想要了解2025年AI产业的发展趋势吗?
王煜全周四直播中已经分享最新解读,欢迎长按下方二维码,加入前哨科技特训营获取。
↓点击加入,学会用AI为你工作(iOS用户请在电脑端打开)
↓¥399,掌握王煜全AI产业预测精华(iOS用户请在电脑端打开)
↓全球消费电子展,王煜全与你现场看未来(扫码加入)
此外,我们还为您准备了一份清单
“近期市场相关刺激政策一览表”