首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

Anthropic杀疯了！Claude居然学会操控电脑了！

科技 2024-10-23 00:00 福建

大半夜的，Anthropic 直接放了个大招，Claude 竟然学会玩电脑了？！

null

最新版的 Claude 3.5 Sonnet，在合适的软件设置下，可以根据用户的指令，在电脑屏幕上移动光标、点击相关位置，并通过虚拟键盘输入信息，就像真人操作电脑一样。

这简直是 AI 发展史上的一个重大突破！

为什么 AI 要学会用电脑？

现代人的工作大量依赖电脑完成。如果 AI 能像人一样直接与计算机软件交互，就能解锁大量现有 AI 助手无法实现的应用。

近年来，AI 发展取得了许多重要里程碑，例如逻辑推理能力、图像识别和理解能力。

而 AI 用电脑，则是下一个前沿领域。AI 模型不再依赖定制工具，而是可以按照指示使用任何软件。

null

Claude 是如何学会用电脑的？

Anthropic 之前的工具使用和多模态研究，为 Claude 的新技能奠定了基础。

操作电脑需要 图像识别和理解能力，还需要根据屏幕上的内容，进行推理并执行特定操作。

研究人员将这些能力结合起来，训练 Claude 解读屏幕上的内容，并使用可用的软件工具执行任务。

具体来说，当开发者要求 Claude 使用某个软件，并授予其访问权限时，Claude 会查看屏幕截图，计算光标需要垂直或水平移动多少像素才能点击到正确位置。

精确计算像素 对 Claude 至关重要。

如果 Claude 无法做到这一点，就难以发出鼠标指令，就像很多模型难以回答“‘banana’中有多少个‘A’”这种看似简单的问题一样。

令人惊讶的是，Claude 仅在少量简单软件（如计算器和文本编辑器）上进行了训练，就能快速泛化到其他软件。

但为了安全起见，训练期间 Claude 无法访问互联网。

Claude 的其他技能与这种训练相结合，使其能够将用户的书面提示转化为一系列逻辑步骤，并在计算机上执行操作。

研究人员甚至观察到，Claude 在遇到障碍时，会自我纠正并重试任务。

虽然 Claude 的进步神速，但 Anthropic 的研究人员也经历了大量的试错，才取得了最终的突破。、

Claude 的电脑使用技能有多强？

目前，Claude 在以人类的方式使用电脑方面，处于最先进的水平。

在一个名为 OSWorld 的开发者测试中，Claude 的得分是 14.9%。虽然远不及人类水平（通常为 70-75%），但较高于排名第二的 AI 模型（7.7%）。

如何确保 AI 安全地使用电脑？

AI 的每一次进步，都伴随着新的安全挑战。

操控的脑降低了 AI 系统应用现有认知技能的门槛，但并没有从根本上提高这些技能。

因此，Anthropic 主要关注的是当前的危害，而不是未来的危害。

Anthropic 的信任与安全团队对 Claude 的电脑使用模型进行了广泛的分析，以识别潜在的漏洞。

其中一个问题是 “提示注入”，这是一种网络攻击，恶意指令被输入 AI 模型，导致模型覆盖之前的指令，或执行用户预期之外的操作。

由于 Claude 可以解读连接到互联网的电脑的屏幕截图，因此可能会接触到包含提示注入攻击的内容。

在公开测试版中使用 Claude 的电脑使用版本的用户，应采取相关预防措施，最大程度地降低此类风险。

与任何 AI 功能一样，用户的恶意使用也是一个潜在问题。

Anthropic 的团队开发了分类器和其他方法，用于标记和缓解此类滥用行为。

鉴于即将到来的大选，Anthropic 对可能被视为破坏公众对选举进程信任的滥用行为高度警惕。

Anthropic 将持续评估和迭代这些安全措施，以平衡 Claude 的能力和负责任的使用。

电脑使用：AI 发展的全新路径

电脑使用是一种完全不同的 AI 开发方法。

到目前为止，LLM 开发者一直在 使工具适应模型，创建 AI 使用专门设计的工具来完成各种任务的定制环境。

现在，Anthropic 可以使模型适应工具，也就说 Claude 可以融入我们日常使用的计算机环境。

Anthropic 的目标是让 Claude 像人一样使用现有的计算机软件。

当然，Claude 的电脑使用能力仍有很大的改进空间。例如：

• 速度慢
• 容易出错
• 无法执行人类的许多日常操作（拖动、缩放等）
• 屏幕视图的“翻页”特性导致 Claude 可能错过短暂的操作或通知

Anthropic 预计，Claude 的电脑使用能力将迅速提高，变得更快、更可靠，并能够更好地完成用户所需的任务。

在每一个阶段，Anthropic 的研究人员都将与安全团队密切合作，确保 Claude 的新功能得到适当的安全措施保障。

AI 操控电脑，是 AI 发展的一条全新路径。

未来，AI 将如何改变我们的工作和生活？让我们拭目以待！

http://mp.weixin.qq.com/s?__biz=Mzg5OTg3NDExMQ==&mid=2247486775&idx=1&sn=58f694f73c125af3845dd6f4548869fd

夙愿的AI实验室

最懂AI工作流的00后，研究AI工作流全面赋能我的工作，加V：bevan2022，领取《3w字保姆级AI工作流搭建 SOP》

最新文章

17岁天才高中生开发神级Prompt，一键激活满血Claude，Github狂揽5.1k星！

写了近2年提示词，我总结出了一套完整的优化方法｜深度干货

别再说不会写提示词了！这款神器帮你一键生成专业级Prompt！

AI工作流：3秒搞定公众号排版，这个工具太吊了

月入过万了，还是很焦虑？

太离谱了，我真的把AI调教了贾维斯...

只要会说话就会写作！人人都能用AI“说”出爆款文章

失眠、拖延、注意力涣散...你的人生正被这件事毁掉！

Anthropic杀疯了！Claude居然学会操控电脑了！

1分钟生成高逼格PPT，这个AI工具我吹爆！（打工人必备）

线下见一面，多赚一百万。

用AI重塑学习流程，省下一半无效学习时间

最近做过的一些傻X行为

千万不要用这个「大神级提示词」，效果真的牛炸了！

得到出品的这个AI助手，太绝了！！！

这才是AI赚钱的最正确姿势！

99%的人不知道，这个AI能帮你做出这么棒的海报

Kimi探索版，国产o1？别闹了，就是个比较莽的Perplexity!

别再用kimi了！ChatGPT o1模型能力惊人！你必须学会用o1提升自己！

这款AI写标题太逆天，自媒体人狂喜！

这个双非00后，竟然活成了爽文男主！

夙愿学长的个人说明书（3.0）

650人 | AI 工具十倍提效群

再见Claude！ChatGPT Canvas重磅更新，这才是AI写作的终极形态！

一键生成「万字长文」，这款AI工具彻底颠覆我的写作方式！

【100%成功】Claude保姆级注册教程：再也不怕被封号！

后悔没早点做直播，赢麻了！

1个神级提示词，让AI帮你写出10w+爆款吸金文案

3步打造你的AI直播教练，效果堪比1.98w的直播私教

AI时代下一个风口：做自己的「数字生命」?

从0到5w：AI助力我的公众号变现之路

用AI写公众号，四个月赚了5w

阅读量不到100，公众号做不下去了...

8亿人的工作岗位即将消失，99%的家长还没意识到这个「教育危机」

当我开始用AI写公众号，阅读量暴涨了10倍！

这10个提示词技巧太强了，用过的人都说真香！

只需5天，我用AI赚了4000块

一个不怕任何事的顶级思维

从刚接触AI工作流到用它月入5位数，我只用了2个月

我需要的不是智能体，而是工作流

630人 | AI 工具十倍提效群

顶级机密曝光，Claude的「内置提示词」竟然公开了！透露了这2个重要信息

你的智能体，就是垃圾

别再用秘塔了，这款AI搜索引擎太强悍了，连小红薯封闭内容都能搜到！

功能大升级！Claude网页版新功能实测：这些场景用起来超实用！

差点做了个血亏2万的「灾难决策」，还好我用AI查到了令人震惊的真相

1小时录完一个视频，我只用了这3个AI工具

AI 工作流：用Kimi十分钟搞定写作选题，这招太香了

AI都会写了，你还学什么写作？

AI工作流：3分钟搞定公众号排版，这招太狠了

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉