Anthropic新功能“操控电脑”:你是成熟的电脑,该自己工作了

科技   2024-10-23 15:22   广东  

Claude会“用电脑”了?


Anthropic的最新AI模型Claude 3.5 Sonnet最近推出了一个非常酷炫的新功能:能够像人类一样使用电脑。这个功能名为“计算机使用”,目前已经进入公开测试,开发者们可以通过API让Claude直接操作电脑。

想象一下,Claude不仅能看屏幕,还能移动鼠标、点击按钮、输入文字……是不是有点像科幻片中的场景?

在一段展示视频里,Claude在Mac上操作得如鱼得水,几乎看不出和真人操作有什么区别。

AI这会直接“动手”了

我们之前已经见识过微软的Copilot Vision功能和OpenAI为ChatGPT推出的桌面应用,它们都能通过“看”屏幕来提供一些帮助。而Google的Gemini也能在Android手机上处理类似的任务。尽管这些AI工具已经展示了强大的视觉分析能力,但还没有迈出真正“动手操作”的那一步。而Anthropic的这次发布,可以说是AI工具向“动手”发展的一个重要里程碑。

甚至Rabbit公司也曾扬言要推出类似的功能,不过现在看来,Anthropic已经率先行动了。

不过,别以为这功能已经完美无缺。Anthropic也表示,Claude的“计算机使用”功能目前还是处于早期阶段,操作起来可能有点笨拙,甚至有些错误频发。公司解释说:“我们提前发布这项功能,是为了让开发者们给我们反馈,接下来我们会不断改进。”

Claude的“视力”目前还有些局限,它不像人类那样拥有流畅的视频视角,而是通过不断截取屏幕截图,将这些截图拼凑在一起。这种“拼图式”的观看方式,可能会让Claude错过某些弹窗或者瞬时的通知。

技术不断进化,Claude正在变得更强大

除了能够“用电脑”之外,Claude 3.5 Sonnet模型本身也有了许多提升。Anthropic表示,这款模型在多个行业基准测试中都表现出色,特别是在编程和工具使用方面的能力更是大幅提高。举个例子,Claude在SWE-bench Verified(一个编程测试)中的得分从33.4%直接提升到了49.0%,超过了市面上所有公开的模型,甚至比一些专门用于编程任务的系统还要强。

在TAU-bench测试中,Claude在零售领域的表现也从62.6%上升到了69.2%,而在更具挑战性的航空领域,它的得分从36.0%跃升到了46.0%。这些数字背后,意味着Claude的逻辑推理和执行任务的能力正在迅速提高。

AI未来能完全替代人类吗?

虽然Claude 3.5的表现让人充满期待,但目前它的“用电脑”功能还是有不少问题。操作繁琐、容易出错,这些小毛病不可避免。不过,我们也不需要太过担心,毕竟这是技术发展的必经之路。也许未来某一天,AI真的可以替代我们完成日常电脑工作——不管是打字、设计,还是更复杂的任务——但现在,我们还需要给Claude一些时间去“成长”。

正如Anthropic所说,这项功能未来的改进潜力是巨大的。Claude 3.5的推出,意味着AI不再是简单的工具,而是迈向了“虚拟劳动力”的第一步。或许不久的将来,我们只需要动动嘴,AI就能帮我们搞定所有电脑操作——从打报告到处理复杂的数据分析,甚至是帮你整理那堆积如山的邮件。

AI远航指南
在AIGC时代,「AI远航指南」引领您在AI浪潮中远航!
 最新文章