Claude会“用电脑”了?
Anthropic的最新AI模型Claude 3.5 Sonnet最近推出了一个非常酷炫的新功能:能够像人类一样使用电脑。这个功能名为“计算机使用”,目前已经进入公开测试,开发者们可以通过API让Claude直接操作电脑。
想象一下,Claude不仅能看屏幕,还能移动鼠标、点击按钮、输入文字……是不是有点像科幻片中的场景?
在一段展示视频里,Claude在Mac上操作得如鱼得水,几乎看不出和真人操作有什么区别。
AI这会直接“动手”了
我们之前已经见识过微软的Copilot Vision功能和OpenAI为ChatGPT推出的桌面应用,它们都能通过“看”屏幕来提供一些帮助。而Google的Gemini也能在Android手机上处理类似的任务。尽管这些AI工具已经展示了强大的视觉分析能力,但还没有迈出真正“动手操作”的那一步。而Anthropic的这次发布,可以说是AI工具向“动手”发展的一个重要里程碑。
甚至Rabbit公司也曾扬言要推出类似的功能,不过现在看来,Anthropic已经率先行动了。
Claude的“视力”目前还有些局限,它不像人类那样拥有流畅的视频视角,而是通过不断截取屏幕截图,将这些截图拼凑在一起。这种“拼图式”的观看方式,可能会让Claude错过某些弹窗或者瞬时的通知。
技术不断进化,Claude正在变得更强大
除了能够“用电脑”之外,Claude 3.5 Sonnet模型本身也有了许多提升。Anthropic表示,这款模型在多个行业基准测试中都表现出色,特别是在编程和工具使用方面的能力更是大幅提高。举个例子,Claude在SWE-bench Verified(一个编程测试)中的得分从33.4%直接提升到了49.0%,超过了市面上所有公开的模型,甚至比一些专门用于编程任务的系统还要强。
AI未来能完全替代人类吗?
虽然Claude 3.5的表现让人充满期待,但目前它的“用电脑”功能还是有不少问题。操作繁琐、容易出错,这些小毛病不可避免。不过,我们也不需要太过担心,毕竟这是技术发展的必经之路。也许未来某一天,AI真的可以替代我们完成日常电脑工作——不管是打字、设计,还是更复杂的任务——但现在,我们还需要给Claude一些时间去“成长”。
正如Anthropic所说,这项功能未来的改进潜力是巨大的。Claude 3.5的推出,意味着AI不再是简单的工具,而是迈向了“虚拟劳动力”的第一步。或许不久的将来,我们只需要动动嘴,AI就能帮我们搞定所有电脑操作——从打报告到处理复杂的数据分析,甚至是帮你整理那堆积如山的邮件。