Anthropic 近日宣布推出升级版的 Claude 3.5 Sonnet 和全新模型 Claude 3.5 Haiku。
Claude 3.5 Sonnet 在多个方面超越了其前代产品,在代码编写能力上尤为突出。
而 Claude 3.5 Haiku 则在性能上与 Claude 3 Opus 持平,保持了相似的成本与速度。
与此同时,Anthropic 推出了一个突破性的新功能——计算机使用(computer use)。
通过这一功能,开发者可以指导 Claude 如同人类一样使用计算机——查看屏幕、移动光标、点击按钮以及输入文本。
Claude 3.5 Sonnet 是首个提供公共测试版计算机使用的前沿 AI 模型。
目前该功能仍处于实验阶段,有时会显得笨拙且容易出错。
Anthropic 表示他们正在积极收集开发者反馈,并期望这一功能能够迅速改善。
Claude 的计算机使用功能基于一种新的 API,允许模型感知并交互计算机界面。
开发者可以集成此 API,使 Claude 能够将指令转化为计算机命令。
例如,“使用我的电脑和在线数据填写表格”,Claude 可以检查电子表格,移动光标打开浏览器,导航到相关网页,并用数据填写表格。
Claude 在评估 AI 模型如何像人类一样使用计算机的 OSWorld 测试中表现优异,尤其是在截图仅有的情况下得分达到了 14.9%,显著高于次佳 AI 系统的 7.8%。
当给予更多步骤完成任务时,Claude 的得分更是提高到了 22.0%。
Anthropic 意识到计算机使用可能带来诸如垃圾邮件、错误信息或欺诈等新威胁,并采取了主动措施以促进其安全部署。
他们开发了新的分类器来识别何时使用计算机功能,并判断是否发生了危害行为。
此外,Anthropic 强调了数据隐私的重要性,默认情况下不会将用户提交的数据用于训练其生成式 AI 模型。
除了计算机使用功能外,Claude 还引入了一个分析工具,允许模型编写并运行 JavaScript 代码。
这意味着 Claude 可以处理数据、进行分析并生成实时洞察。
分析工具作为一个内置代码沙盒,让 Claude 能够进行复杂数学计算、数据分析,并在分享答案前反复迭代不同想法。
分析工具支持各种类型的分析任务,使得答案不仅有理有据,而且数学上精确可重复。
Claude 的分析工具在多个团队中都能扩展其能力。
市场营销人员可以上传客户在整个漏斗中的互动记录,Claude 将揭示提高转化率的机会;
销售团队可以上传全球销售数据,Claude 将提供特定国家的业绩分析;
产品经理可以上传客户参与度数据,Claude 将帮助制定冲刺计划和发展优先级;
工程师可以上传来自不同服务器的性能日志,Claude 将确定更好的资源利用领域;
财务团队可以上传每月财务数据,Claude 将创建财务仪表板以传达关键趋势并为决策提供依据。
尽管这些功能带来了许多潜在的好处,但 Anthropic 也认识到它们可能带来的风险,包括恶意指令注入攻击和其他滥用情况。
因此,Anthropic 正在持续监控并改进这些安全措施,确保 Claude 的新功能与其负责任使用之间取得平衡。
同时,Claude 的分析工具功能预览现已向所有用户开放。
用户只需登录后点击左下角的名字来管理所有功能预览即可开启分析工具。
直达链接:https://claude.ai
关注我们:即可加入【AI交流群】,免费领取【AI大礼包】