人工智能正在接管我们的电脑桌面!
Anthropic最新发布的Claude Sonnet 3.5 API,能让AI模型像人类一样操控电脑应用程序。
这听起来很酷,但请小心使用,因为这项技术还处于试验阶段。
先来看看,这个新API到底有什么神奇之处呢?
如何让AI成为你的「电脑小助手」?
Claude Sonnet 3.5现在可以通过API调用三个新工具:Computer、Text Editor和Bash。
这意味着它可以:
定义电脑屏幕分辨率
访问键盘、鼠标和应用程序
在文本编辑器中编写Python脚本
在Bash终端中运行命令行程序
将输出存储在电子表格中
最厉害的是,Claude会通过截图来跟踪电脑的状态。
它能看到电子表格的内容,甚至能察觉到新邮件的到来。通过分析像素位置,它可以精准地移动光标、点击和输入文本。
这个AI助手还具有「自我纠错」能力。它会不断执行操作、观察结果,并根据需要调整自己的行为,直到完成任务为止。
实验性技术,谨慎使用!
虽然这项技术听起来很酷,但Anthropic也坦言目前还存在诸多限制。并强烈建议只在沙盒环境中使用这些命令,比如Docker容器,并限制对硬盘和网络的访问,以保护敏感数据和核心系统文件。
目前,Anthropic还禁止Claude创建在线账户或在社交媒体上发帖(不过他们表示未来可能会解除这一限制)。
AI桌面控制大战一触即发?
Claude并不是唯一一个想要「接管」你桌面的AI。多家科技巨头都在这个领域展开激烈竞争:
微软研究院最近发布了OmniParser,这是一个基于GPT-4V的工具,可以识别屏幕截图中的用户界面元素。
亚马逊从Adept这家专注于训练AI操作计算机应用程序的初创公司挖来了大批人才。
Open Interpreter是一个开源项目,同样使用大语言模型来控制本地应用程序。
是助手还是潜在威胁?
让AI控制我们的电脑,这听起来既让人激动又有点可怕。
它可能帮我们自动化更多任务,提高工作效率;但如果控制不当,也可能带来安全风险。
随着这项技术的发展,未来的AI助手会不会变得越来越「人性化」?
它们会不会也有情绪、有个性,甚至会耍小脾气?
让AI控制我们的电脑是福是祸?你认为呢?
👇
👇
👇
👇
本文同步自知识星球《AGI Hunt》
星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。
每天约监控6000 条消息,可节省约800+ 小时的阅读成本;
每天挖掘出10+ 热门的/新的 github 开源 AI 项目;
每天转译、点评 10+ 热门 arxiv AI 前沿论文。
星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)
一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;
二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。
欢迎你的加入!