Claude接管人类电脑编程，程序员沸腾！OpenAI反击，智能体大战一触即发

文摘 2024-10-25 17:17 江苏

新智元报道

编辑：桃子好困

AI像人一样操作电脑，已然成为下一个前沿。

两天前，Anthropic进化版Claude 3.5 Sonnet首次实现自主操控电脑屏幕、移动光标、完成任务，惊艳了所有人。

当时，Anthropic开发者关系负责人称，「『计算机使用』是万能的API，它代表着全新人机交互范式的第一步」。

拿到测试资格的网友们，疯狂体验了这项「超能力」。

甚至，就连初创公司CEO对此赞不绝口，AI智能体已经来临，你现在可以建立AI军队为你工作。

在Anthropic加速布局智能体未来同时，OpenAI似乎也感受到了紧迫感。外媒最新爆料称，OpenAI内部正开发新品来自动化复杂的软件编程任务。

恰在昨天，OpenAI研究科学家、德扑之父在TED活动中表示，「自己对构建o1失去信心，正在OpenAI组建多智能体团队」。

这意味着，一场全新的竞赛即将开始，AI不再仅仅是对话生成，而应该去执行和操作。

Claude接管人类电脑，科研求职编码一键通

那些上手Claude计算机使用能力的开发者们，根本停不下来创作。

从复杂的编码任务到深入研究，再到收集「零散」的信息，许多令人惊叹的典型案例诞生了。

毕竟是自家首发的，Anthropic开发者关系负责人Alex Albert先了打个样。

他先用Claude计算机和bash工具，在线下载一个随机数据集，然后安装sklearn，在数据集上训练一个简单的分类器。

最后，在网页上就得到了分类器结果。

这些过程，不到5分钟的时间就完成了。

其中用到的提示，他也贡献出来了：

Go to https://data.gov, find an interesting recent dataset, and download it. Install sklearn with bash tool write a .py file to split the data into train and test and make a classifier for it. (you may need to inspect the data and/or iterate if this goes poorly at first, but don't get discouraged!). Come up with some way to visualize the results of your classifier in the browser.

一位开发者已经开始让Claude帮自己自主做科研了。

验证「你是不是人」，Claude可以代劳了。

想要Claude控制你的电脑，只需要：


pip install open-interpreterinterpreter --os

搜索YouTube视频，并跳过广告。

Claude一顿操作猛如虎，以后视频内置广告，通通交给它了。

打工人求职申请表填写，Claude也能胜任。这不，下面这位开发者小哥已经让AI自动申请Anthropic职位了。

进化版（左）和旧版（右）Claude 3.5 Sonnet在「我的世界」中构建的样子，令人印象深刻。

新升级后的Claude 3.5 Sonnet将如何影响「多智能体社会」的进步？

智能体研究初创公司Altera Al给出了答案，新模型是对长时间自主性的最大升级。我们的25个智能体在「我的世界」中合作，在20分钟内收集了超过40%的不同物品。

分析工具

顺便提一句，Claude今天还重磅推出了可以编写和运行代码「分析工具」，为1024开发者们送上大福利。

目前，这一功能已在Claude中上线。

假设让Claude绘制销售渠道进展的直观图，它能自主分析数据写代码，并给出要求的可视化图。

然后，你可以在Artifacts中，可以详细查看细分项的数据。

AI智能体竞赛打响，Anthropic抢跑

虽然计算机使用工具并不完美，但它代表了Anthropic在AI中的一种愿景：

让Claude像人一样，看懂屏幕自主操作现有软件，完成各种复杂的任务。

这项能力背后的工作原理是：Claude先对屏幕截图，确定需要采取的行动，然后执行这些行行动。然后，再次截图决定下一步应该做什么。

畅想一下，如果智能体能够直接查看屏幕内容而无需依赖辅助功能，或查看底层代码的AI软件，可能会开启大量新机遇。

比如，当你搭建网站时，如果按钮中的文字意外超出按钮边界，AI智能直接看到后修复了这个问题，就省去了查看底层代码倒推步骤。

再举个栗子，当前网站制作者，已经非常巧妙地隐藏网站上广告的HTML代码。

这使得基于AI的广告拦截软件更难分析代码，并确定需要删除什么来去除广告。

但是，能够直接看到广告本身的「计算机使用智能体」会发现这项任务容易得多。

不过，这项技术带来弊端首先是「截图操作」成本太高，而且AI往往会假设它的操作已经成功执行。

「当它获取新的截图时，它已经不知道自己在操作流程中处于哪个阶段了」

另一方面，就是隐私问题了。

此前，已经有公司禁止员工使用ChatGPT、GitHub Copilot等编程工具，害怕不小心向模型开发商泄露专有信息或代码。

OpenAI急了，加码AI年底上新

在劲敌Anthropic连连发布重压下，OpenAI其实早已开启了新的布局。

还记得几天前，Sam Altman突然冒泡，「下个月是ChatGPT的第二个生日，我们应该送它什么生日礼物呢」？

当时，一大波网友写下自己的愿望清单。

就在刚刚，有一条被传疯了的报道称，OpenAI计划在12月，解禁新一代大模型，代号为Orion。

根据爆料，Orion将使用o1合成的数据进行训练，并会在ChatGPT两周年前后发布。

但与GPT-4o和o1不同的是，它最初不会通过ChatGPT上线，而是先授予与OpenAI密切合作的公司访问权限（比如微软），方便他们构建自己的产品和功能。

不过，网友们的「美梦」还没做多久，Altman就站出来辟谣了：通通都是fake news！

在软件开发上，OpenAI目前正在开发多个产品和功能：

一部分简化在Microsoft Visual Studio Code等主流代码编辑器中使用OpenAI的AI进行开发的流程；
另一部分则着眼于处理更复杂的软件开发任务。

知情人士透露，OpenAI这款产品能够处理原本需要人类耗时数小时乃至数天的软件工程任务，还能据客户的指令自动编写和执行复杂应用程序的代码。

不过，具体发布时间还未确定。

毕竟，代码开发是OpenAI大语言模型的早期应用场景之一，主要是因为AI生成的代码可以快速验证其可用性。

2021年开始，微软GitHub团队利用OpenAI大模型推出AI Copilot，为程序员提供实时代码建议。

紧接着，ChatGPT在22年年底面世，提供一个更加易用、免费的替代方案，迅速走红。

随后，OpenAI成功说服数百万程序员付费使用「升级版」ChatGPT。

他们可以比GitHub Copilot更早体验升级版LLM，并能通过对话式指令处理各类开发任务。正因此，报道称这些功能让OpenAI相关订阅产品的年收入有望达到约30亿美金。

在智能体布局方面，OpenAI内部正组建一支多智能体团队，下一步可能倾向于智能体领域。

前段时间，他们发布的多智能体框架Swarm，也是引发了AI社区的关注。

内部研究助手

据透露，OpenAI已经开发出了一款能够帮助提升工作效率的「内部研究助手」，并且获得了研究人员的一致好评。

其中的功能，就包括为AI模型相关的实验生成代码。

这款内部工具似乎是朝着开发能够自主进行AI研究的系统迈出的一步——这种能力不但需要编程技能，而且还需要具备为新实验提出想法和脑洞等能力。

OpenAI的领导层已公开表示，这一目标可能会在未来几年内实现。

另外，知情人士透露，OpenAI正在考虑开发升级版Canvas，这是一款对标Anthropic Artifacts的工具。

它能够实现和ChatGPT对话同时，在新的画布中协作，不论是编程还是创作，皆可互动。

就代码方面，在Canvas中用户能够让AI一键审查代码、修改bug等，帮助理解现有的代码基础和项目类型。

不过，他们还需要进行将代码复制粘贴到chatbot中，这一繁琐操作。

OpenAI所希望的是，能够推出更通用的AI智能体，类似于Anthropic发布「计算机使用智能体」，可以接管人类电脑处理代码以外更广泛的任务。

目前，OpenAI已在内部展示了一个AI智能体的初步版本，能够通过用户的计算机完成在线订餐等任务。

其实，Claude已经实现了在线点餐的能力

当遇到编程或应用开发难题时，这个AI智能体还能够自动查询网络资源寻求解决方案。

如今在AI编程领域，OpenAI已处于守势，曾经独占鳌头的局势正在改变。

现在，面对这个最危险的竞争对手Anthropic，它确实该做点什么了...

参考资料：

https://x.com/JeremyDanielFox/status/1849471327075270707

https://x.com/AnthropicAI/status/1849466471556038752

https://venturebeat.com/ai/anthropics-agentic-computer-use-is-giving-people-superpowers/

https://www.theverge.com/2024/10/24/24278999/openai-plans-orion-ai-model-release-december

https://www.thariq.io/blog/claudecomputer/

http://mp.weixin.qq.com/s?__biz=MzkwNjcwMDk5NQ==&mid=2247492258&idx=1&sn=562b3ab975d717e49481950552c2a314

AI破局圈

AI前沿技术介绍、AI热点资讯追踪、AI实用工具分享，AI破局圈和大家一起迎接人工智能时代的到来！

最新文章

微信、支付宝宣布下架这项服务！六省用户受影响

今天面试了一个字节女生，当场想给她offer！

史诗级加强！微信 Windows 版上新

微信最新功能上线！网友：手机内存有救了

为什么很多人进了自己心心念念的大厂，最后又从大厂离职了？

大厂裁员超14万！怎么感觉IT就业一下子就崩溃了

Win 11史诗升级，终于能完美兼容安卓生态

刚跳槽就被新同事打听薪资，保守说了8K，居然被碎碎念：老板给新人比我们还多？

Grok 3证明黎曼猜想，训练遭灾难性事件？数学家称不夸张，两年内AI将解出千禧年难题

4年前被砍掉的微信功能，回归了！还有更多人用上Callkit

为什么感觉中国人月薪过万很普遍了？

即将突破14亿人！微信界面又双叒调整了

中国程序员最大的悲哀！（1100W+阅读）

百度世界2024落幕：100多个AI 应用，真是大开眼界！

双十一当天 “支付宝崩了”！官方最新回应

Windows Arm 重大更新

川普赢了，AI 圈炸了！

运维一觉睡醒“天塌了”！

英特尔真要倒闭了：瞎搞啊这是

15 岁山东少年当 CTO：码龄 7 年，靠“玩”出来的开源项目已赚取数百万元！

微软正式宣布：将终止服务！

谷歌Agent首次发现真实世界代码漏洞！抢救全球数亿设备，或挽回数十亿美元损失？

俄开发者遭Linux封杀？11人被无故除名，俄罗斯扬言：那我们自建社区！

AI「长脑子」了？LLM惊现「人类脑叶」结构并有数学代码分区，MIT大牛新作震惊学界！

安卓旗舰将彻底淘汰这类手机，要涨价了

苹果AI上线，ChatGPT免费用！首款M4 Mac诞生，库克：这是全世界最佳AI一体机

放大招！百度复旦视觉生成模型Hallo2或将落地数字人等场景

美14岁少年深恋AI自杀震惊全球，母亲状告前谷歌初创！首例AI致死命案敲响警钟

Claude接管人类电脑编程，程序员沸腾！OpenAI反击，智能体大战一触即发

Claude接管人类电脑12小时：学会摸鱼，敲着敲着代码看风景去了

鸿蒙操作系统正式发布，功能全解析！

等了13年的微信功能要来了，但这个条件刷掉大批人

把AI放进《我的世界》服务器：GPT-4o杀牛宰羊，Claude3.5把家拆了｜开源

突发！外企巨头被曝大中华区裁员近2000人，Meta员工惨遭裁员竟因「滥用25美元餐补」？

搞笑了！Intel、AMD宣布在一起了

38岁老Mac“复工”，被改造上网！仅400B/s的速度，能和ChatGPT聊天、用Claude编码

Adobe神级AI视频媲美Sora！拖拽一键秒生大片，最强PS震撼设计圈

停机后仍被扣费，大学生怒告运营商，结局亮了...

苹果14年来最严重产品泄漏！M4版MacBook还没发，开箱视频满天飞

等了三年 Win12 未至，Win11 大更新先让用户“集体崩溃”：蓝屏死机、鼠标光标没了，9GB 缓存还删不掉！

IT工程师在工作电脑存储64G色情内容，公司发现后将其开除；员工辩称：我存了，但没看！赔我41万

特斯拉首款无人驾驶出租问世，马斯克掀翻全场！无方向盘、无踏板，3万美元26年量产

微信鸿蒙原生版官宣，界面清爽，网友求推广

解密诺贝尔物理学奖为啥颁给AI？Hinton和Ilya 12年前对话，竟引发物理诺奖AI风暴！

微信鸿蒙原生版今日开始内测邀请

一点暂停广告马上占据全屏，主流视频平台被吐槽“吃相太难看”

微软正式确认：放弃圆角设计！

写出屎山代码的 12 个技巧，一定得会！

腾讯与小米击了个掌！

Pika 1.5重磅升级！万物皆可爆炸，搞笑特效全网病毒式疯传

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉