刚刚,Claude 3.5学会用电脑了!

旅行   2024-10-23 00:05   北京  

这次,Claude 学会用电脑了!

Anthropic最新发布的Claude 3.5系列模型不仅智能大幅提升,还学会了一项全新技能:使用电脑

这下,AI终于可以像人类一样操作各种软件和工具了!

电脑小白变身"电脑高手"

Anthropic推出了一项名为"computer use API"的新功能。简单来说,就是让Claude看电脑屏幕截图,然后告诉你下一步该怎么操作,比如移动鼠标、点击按钮或输入文字。

这听起来似乎很简单,但其实一点也不容易!😀

以前我们需要为每个任务开发专门的工具,现在只要教会Claude基本的电脑操作,它就能自然而然地使用各种软件了。

想象一下,你的AI助手不仅能和你聊天,还能帮你操作电脑。这听起来是不是很酷?

Anthropic正在将这个想象变为现实。他们开发了一个API,让Claude能够感知和交互计算机界面。简单来说,Claude现在可以看屏幕、移动鼠标、点击按钮,甚至输入文字了!

这项技术的潜力是巨大的。开发者们可以利用它来自动化重复性任务、进行测试和质量保证,甚至执行开放式研究

不过,Claude目前还是个"电脑小白"。它有时候会搞不清楚怎么滚动页面、拖拽文件或放大缩小。但Anthropic表示,这项功能会在未来几个月内迅速提升

有趣的"熊孩子"时刻


就像所有学习新技能的过程一样,Claude在学习使用电脑的过程中也闹出了不少笑话。

比如,在录制演示视频时,Claude不小心停止了一个长时间运行的屏幕录制,导致所有录像都丢失了。以及有趣的是,在一次编码演示中,Claude竟然开小差去浏览黄石国家公园的照片了!

这小插曲也让我们看到,AI不仅在变得越来越强大,也在变得越来越"人性化"。

3.5模型更新超越o1-preview


除了会玩电脑,Claude 还迎来了新的更新:最新版的Claude 3.5 Sonnet 和Claude 3.5 Haiku。

编程能力大跃进

除了学会用电脑,新版Claude 3.5 Sonnet的整体智能水平也有了全面提升。其中最显著的进步是在编程方面。

在SWE-bench Verified测试中,Claude 3.5 Sonnet以49%的成绩创下了新的记录,超越了包括OpenAI o1-preview在内的所有公开模型。这个成绩是在不使用复杂辅助框架的情况下取得的,更显示出它强大的编程能力。

更快更便宜的Haiku

Anthropic还推出了一个新模型:Claude 3.5 Haiku。这是他们最快速、最经济的模型,将取代之前的3.0 Haiku版本。

虽然速度快、成本低,但Claude 3.5 Haiku的表现却一点也不含糊。在编程任务上,它甚至超越了许多顶尖模型,包括原版Claude 3.0 Haiku和 4o-mini。

安全性和未来展望

Anthropic非常重视AI的安全性。他们与美国和英国的AI安全研究所合作,对新模型进行了预部署测试。同时,他们也评估了可能存在的灾难性风险,确保模型符合他们的"负责任扩展政策"。

对于"computer use"这项新功能,Anthropic也采取了积极的安全措施。他们开发了新的分类器,可以识别何时使用了这项功能,以及是否发生了潜在的滥用行为

Anthropic表示,这些新技术仍处于早期阶段,他们期待通过初步部署来更好地理解其潜力和影响。他们也欢迎开发者们提供反馈,共同探索Claude的新可能性。

看来,AI离真正成为真正的"数字生命"又近了一步。

不过……这是好事还是坏事呢?


👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

  • 每天约监控6000 条消息,可节省约800+ 小时的阅读成本;

  • 每天挖掘出10+ 热门的/新的 github 开源 AI 项目;

  • 每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)

  • 一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;

  • 二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。

欢迎你的加入!

AGI Hunt
关注AGI 的沿途风景!
 最新文章