Claude昨夜王炸!新模型暴打o1,还能玩电脑~

学术   2024-10-23 10:15   湖北  

Anthropic昨晚3连击,2个版本模型更新 + 一个新的交互式API

  1. Claude 3.5 Sonnet更新

新款 3.5 版 Sonnet 在整体的智力和各个能力上都有所提升。

新版的 Sonnet 3.5 以无需复杂技巧,就可以在SWE-bench上达到SOTA的成绩,得分高达 49%,击败了包括 OpenAI o1 preview 模型和 为Agentic coding 设计的专用模型在内的所有模型。

  1. Claude 3.5 Haiku

小杯模型推出,又快又便宜

它在编码任务上优于许多最先进的模型,甚至包括原始的 Claude 3.5 Sonnet 和 GPT-4o。

  1. Computer use API

一个新API,让 claude 能够感知并与计算机界面进行交互。

例如 :你向 Claude 输入一个屏幕截图,Claude 会回复下一个要在电脑上采取的行动(例如移动鼠标、点击、输入文本等)。

我们正在尝试一些全新的东西。不是为claude完成个别任务而开发的特定工具,而是教它一般的计算机技能,让它能够使用一系列为人工设计的标准工具和软件程序。


NLP前沿
一手ai news分享 \x26amp; 热点paper解读
 最新文章