Anthropic的新模型蓄势待发!
Claude 3.5 Opus是不是快要来了?
虽然坊间传言不断,但Anthropic一如既往地保持神秘。这家公司可不像某些以open 之名行close 之事的同行,动不动就放出"大招"。
他们更像是在下一盘大棋,只有真正准备好了,才会亮出王牌。
Anthropic的慢工出细活
Haider. (@slow_developer) 对Anthropic的做事风格做出了精辟总结:
Anthropic不像OpenAI那样,别人一出新模型就急着跟进。他们会等到模型完全准备好、测试充分后才会发布。
这种稳扎稳打的态度,让人不禁想起那句老话:"欲速则不达",Anthropic选择了一条不同寻常的路。
Chubby♨️(@kimmonismus) 对Opus 3.5的发布抱有很高期待:
如果Opus 3.5最终在今天或明天发布,那将是一个转折点。我们可能会有第一个真正的o1竞争对手。
由于Sonnet 3.5在过去6个月里一直是最好的LLM之一,而且到目前为止还没有一个真正超越Sonnet,我很兴奋能看到Opus 3.5会带来什么。
他还大胆预测Opus 3.5可能会具备以下特点:
与o1相似的推理能力(可能还包括思维链)
在几乎所有基准测试中可能都优于GPT-4o和其他模型
运气好的话,可能会首次展现代理能力
3.5版本的时间线
回顾一下Anthropic的产品路线,我们似乎能窥见一丝端倪。Haider补充道:
如果我没记错的话,当3.5 Sonnet发布时,他们提到3.5版本的Opus和Haiku会在年底前推出。
这个信息让我们对Anthropic的计划有了一个大致的时间框架。年底,这个时间点既不远也不近,给了公司足够的时间打磨产品,同时也给了市场一个期待的目标。
发布时间成谜
关于Opus 3.5的具体发布时间,众说纷纭。Greg Kara(@GregKara6) 猜测:
它将在11月2日发布。那天有Anthropic黑客马拉松。如果我是他们,我会选择那天发布。
但Chubby♨️(@kimmonismus) 却不太认同这个想法:
我不知道,Opus3.5值得拥有自己的发布日,而不是与其他活动一起...
多模态能力:Anthropic的短板?
Opus 3.5的文本处理能力被普遍看好,但在多模态方面,似乎并不被看好。
ρ:𝗀eσn(@pigeon__s) 指出:
opus 3.5可能会在推理文本基准测试中占据主导地位,甚至可能击败o1,但我认为anthropic并不太重视多模态。它肯定不会有音频或视频输入之类的功能,这很可惜,即使它在文本方面更聪明。
市场压力VS产品质量
然而,AI行业的竞争异常激烈。nlitn.AI (@nlitnai) 提醒我们:
Anthropic也不可能完全免疫市场和投资者的压力。
这也是当下AI公司们面临的现实困境。技术追求和商业压力之间的平衡,考验着每一家公司的智慧。
David Tech Sánchez (@PredictDS869) 则表达了对Anthropic方法的赞赏:
我很欣赏Anthropic对模型发布的谨慎态度。他们注重全面测试的做法让我对他们的产品充满信心。让我们继续关注3.5版Opus/Haiku的年底时间线吧。
对Opus 3.5除了充满期待,但也有一些担忧。KecksbeLit(@kecksbe) 表达了对使用限制的担忧:
我希望漫长的等待时间被用来降低opus的成本。如果我们像o1一样每天只能发10条消息,我就不会使用它,因为我宁愿整天使用sonnet。
👇
👇
👇
👇
本文同步自知识星球《AGI Hunt》
星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。
每天约监控6000 条消息,可节省约800+ 小时的阅读成本;
每天挖掘出10+ 热门的/新的 github 开源 AI 项目;
每天转译、点评 10+ 热门 arxiv AI 前沿论文。
星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)
一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;
二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。
欢迎你的加入!