首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

OpenAI劲敌甩大招！Claude 3.5升级，能力反超GPT-4o，训练AI自己操控电脑

楼市 2024-10-23 15:36 北京

作者 | 郑松毅

运营编辑 | 李阳

OpenAI的劲敌，甩了“大招”！

就在几个小时前，Anthropic AI发布了升级版模型Claude 3.5 Sonnet，以及新模型Claude 3.5 Haiku。

但最吸引人的是，Anthropic AI这次推出了一项处于测试阶段的新功能——AI操作计算机能力（Computer Use）。

网友直呼，“像魔术，AI Agent真的来了。”

AI自己“玩”电脑

这项能力的亮相，似乎又把AI大模型“卷”到了新高度。

之前各大厂商为了提升模型逻辑推理能力，可谓是下了不少功夫。但在“执行”和“操作”能力方面，一直还是饱受吐槽的点，也因此很多人认为大模型距离成为真正的“智能体”还有很大差距。

但现在，可以像人类一样使用计算机的AI，来了。

在Anthropic的演示中，AI可以根据人类指令查看屏幕、移动光标、点击操作、搜索和键入信息。

与此前常见的AI功能不同，用户只需要给定一个任务目标，AI可以一气呵成完成所有操作，全程不再需要任何的人类参与。

比如现在你需要填写一张供应商表格信息，所需数据需要从一份有数千行数据的Excel表格中一一对应查找，先不说要花上多长时间，最可怕的是，找了半天表里还没有你想要的数据。

现在，你只需要跟AI说一声，它就会从查看屏幕开始，从表里查找匹配的信息并填入相应的目标栏中。如果不幸手中的表里没有目标数据，它会自己上网浏览查询，自动点击切换页面，最终把目标信息填入。

同样，编写代码对它来说也是不在话下。

当你跟它说想做一个“90年代设计风格”的网站后，它会很快完成代码编写任务。

值得一提的是，你还可以让它把代码文件下载到本地并运行，如果发现你在本地未安装配置Python（代码运行软件），它会自动下载修复报错，省去手动安装的麻烦。

虽然听起来让人充满期待，但现实是，目前该功能测试漏洞百出，Anthropic正在尽力查缺补漏。

一名内部测试人员介绍，“在一次编码测试中，Claude在中途停了下来，打开了黄石国家公园的图片，接着展开了一系列迷之操作。”

Anthropic表示，为了给用户提供更好的使用体验，目前该功能仅支持开发者通过API配置和调用，想用的小伙伴们还需耐心等一等。

Claude模型升级

数学能力反超OpenAI

看完新功能展示，再来看看本次Claude 3.5系列模型升级变化。

从官方给出的测试数据来看，对比上一代Claude 3.5 Sonnet，升级版模型在逻辑、编程、数学等方面都有明显能力提升。

特别是在数学方面，原本落后于劲敌OpenAI的模型GPT-4o，但这次升级后实现了反超。现在可以说，Claude 3.5 Sonnet是全面“吊打”GPT-4o了。

全新模型Claude 3.5 Haiku主打的是性价比和响应速度，在与Claude 3 Haiku相似成本的情况下，新模型在每项技能上都有了进一步提升。

另外，Haiku模型的使用价格仅为Sonnet模型的是十二分之一，想必会成为不少开发者的性价比之选。

Anthropic表示，升级版Claude 3.5 Sonnet已经面向用户开放，而Claude 3.5 Haiku将在本月底，通过API等形式开放（先开放纯文本模型）。

http://mp.weixin.qq.com/s?__biz=MzAwOTcwMTEzMw==&mid=2650272022&idx=1&sn=7212e798550cc9a511232859adce8c2f

搜狐科技旗下AI账号——AI见闻，独家、深度、专业感受AI地心的前沿脉动

最新文章

设计AI的人，也要被AI替代了？

被裁设计师转行AI创作，为赚钱200元代写作业的活儿也接

百万年薪大厂人35岁被裁：AI创业3个项目赚3万，为还房贷重返职场

AI见闻｜“六巨头”财报公布，Meta与亚马逊最烧钱，黑神话入围2024金摇杆，xAI面向开发者推出API

商汤科技大裁员，押注 AI 已亏528亿

AI见闻｜华为前三季度利润下滑，OpenAI硬刚谷歌，ChatGPT增加搜索功能

AI见闻｜谷歌被俄罗斯罚款25位数，超全球GDP，谷歌25%新代码由AI生成，掌握提示词工程成关键钥匙

贾扬清今年第二次回国，我们和他聊了聊中美AI都在忙着找的答案

AI见闻｜马斯克称2040年人型机器人数量超过人类，英伟达构建全球最大AI超级计算机

硅谷来信：诺奖“盖戳”认证，AI成科研“最强大脑”？

马斯克：脑机接口植入物可拆卸，手术10分钟完成，价格相当于一部手机

对话金蝶赵燕锡：AI将重塑企业管理体验、流程和决策，但大模型不能解决一切

对话梅宏院士：现在的大语言模型技术路径不可能通往AGI，天花板是能预测到的

AI见闻｜字节跳动预设立欧洲 AI研发中心，谷歌“贾维斯”问世，AI自主操控电脑指日可待

ARM计划“断供”高通，昔日伙伴为何“反目成仇”？

黄仁勋最新演讲，称Blackwell四季度有望量产，英伟达算力将增长20倍

给AI打工的人｜大龄、转行、AI设计师，我该待在舒适区，还是去往AI风口？

科大讯飞星火4.0 turbo发布，能力超越GPT-4 turbo！刘庆峰：AI应用已进入落地深水区

OpenAI劲敌甩大招！Claude 3.5升级，能力反超GPT-4o，训练AI自己操控电脑

AI见闻｜华为纯血鸿蒙登场，nova13全系支持北斗卫星图片消息，微软打造全套AI工具，开启AI代理时代

对话智源研究院院长王仲远｜纯语言模型无法实现AGI，多模态将是必经之路

图灵奖得主杨立昆：我们需要人类水平的AI，尽管现在的系统做不到（内附演讲PPT）

AI见闻｜库克&陈漫同游北京/机器狗泰山测试，解决景区垃圾运输难题/视频生成模型遇冷，李彦宏称“百度不会去做”

AI见闻｜华强北iPhone 16破发，黄牛边抢边赔/x平台允许第三方使用内容训练AI/英伟达力挺特斯拉人形机器人

自动驾驶能做到绝对安全吗？蘑菇车联CEO朱磊给出答案

“AI教父”怒批：现在的人工智能还不如猫聪明！

AI见闻｜OpenAI纳新、Meta裁员，ChatGPT看人下菜碟，区别对待“小帅”和“小美”

文末福利｜搜索引擎被淘汰？实测Kimi、智谱、360的最新AI搜索功能，谁的表现最强

黄仁勋谈AI改变工作方式，生产力提升不意味需要裁员

黄仁勋每天用ChatGPT，称其推理能力会越来越强

AI见闻｜首个 AI Kaggle 大师诞生，OpenAI 夺 7 金封王，vivo发布“蓝心智能”AI战略

特斯拉无人驾驶出租车登场！马斯克：最早2026年推广，车辆成本低于3万美元

AI见闻｜特斯拉“Robotaxi ”亮相，马斯克亲自试驾，英伟达竞品AMD“全线猛攻，“史上最长双十一”，电商战役已敲响

OpenAI重组谋生！既能赚钱又兼顾公益，还能防止被微软恶意收购

对话清华刘嘉：诺奖颁给AI是物理学的自我革命，AI必须纳入物理体系

刚刚！诺贝尔化学奖也给了AI

杰弗里·辛顿：不懂AI的物理学家不是好诺奖得主

AI见闻｜诺贝尔化学奖揭晓，再次花落AI/英伟达5连涨重燃AI热，相关概念股一度涨20%/“纯血鸿蒙”公测，华为用户扎堆体验

获66亿美元融资、估值1570亿美元，OpenAI“抛弃”技术理想，加速商业化

AI见闻 | OpenAI拿下今年最大融资，苹果或取消一年一更新，Meta推出号称最先进的媒体基础模型

滞留太空114天，马斯克拯救宇航员布奇和苏尼

AI见闻｜智谱开放平台国庆月打折，最低每月19元，华为三折叠特别版最高定价10万元

AI见闻 | 苹果退出OpenAI融资谈判，中国完成首个全国产化万卡万参大模型训练，开源TeleChat2-115B

AI见闻｜导演卡梅隆加入Stability AI董事会，奥特曼否认得到OpenAI“巨额股权”，欧盟《AI公约》Meta未签署

对话西湖大学仇旻：AR眼镜还要3-5年进入大众市场，未来还很难替代手机

Meta年会小扎开箱！头显售价不到苹果1/17，全息AR眼镜，黄仁勋点赞

一出好戏！“ChatGPT之母”离职，OpenAI 转向营利性组织只差奥特曼临门一脚

大模型是泡沫？刘韵洁院士：GPT已2亿用户，行业大模型是中国的出路

豆包视频生成模型交作业，火山引擎谭待：大模型要从卷价格走向卷性能

AI见闻｜字节跳动进军AI视频生成，TikTok Music将于11月关闭，中东正在成为硅谷AI投资领域的关键力量

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉