首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

OpenAI劲敌甩大招！Claude 3.5升级，能力反超GPT-4o，训练AI自己操控电脑

科技 2024-10-23 18:33 北京

出品 | 搜狐科技

作者 | 郑松毅

运营编辑 | 孟莎莎

OpenAI的劲敌，甩了“大招”！

就在今日凌晨，Anthropic AI发布了升级版模型Claude 3.5 Sonnet，以及新模型Claude 3.5 Haiku。

但最吸引人的是，Anthropic AI这次推出了一项处于测试阶段的新功能——AI操作计算机能力（Computer Use）。

网友直呼，“像魔术，AI Agent真的来了。”

AI自己“玩”电脑

这项能力的亮相，似乎又把AI大模型“卷”到了新高度。

之前各大厂商为了提升模型逻辑推理能力，可谓是下了不少功夫。但在“执行”和“操作”能力方面，一直还是饱受吐槽的点，也因此很多人认为大模型距离成为真正的“智能体”还有很大差距。

但现在，可以像人类一样使用计算机的AI，来了。

在Anthropic的演示中，AI可以根据人类指令查看屏幕、移动光标、点击操作、搜索和键入信息。

与此前常见的AI功能不同，用户只需要给定一个任务目标，AI可以一气呵成完成所有操作，全程不再需要任何的人类参与。

比如现在你需要填写一张供应商表格信息，所需数据需要从一份有数千行数据的Excel表格中一一对应查找，先不说要花上多长时间，最可怕的是，找了半天表里还没有你想要的数据。

现在，你只需要跟AI说一声，它就会从查看屏幕开始，从表里查找匹配的信息并填入相应的目标栏中。如果不幸手中的表里没有目标数据，它会自己上网浏览查询，自动点击切换页面，最终把目标信息填入。

同样，编写代码对它来说也是不在话下。

当你跟它说想做一个“90年代设计风格”的网站后，它会很快完成代码编写任务。

值得一提的是，你还可以让它把代码文件下载到本地并运行，如果发现你在本地未安装配置Python（代码运行软件），它会自动下载修复报错，省去手动安装的麻烦。

虽然听起来让人充满期待，但现实是，目前该功能测试漏洞百出，Anthropic正在尽力查缺补漏。

一名内部测试人员介绍，“在一次编码测试中，Claude在中途停了下来，打开了黄石国家公园的图片，接着展开了一系列迷之操作。”

Anthropic表示，为了给用户提供更好的使用体验，目前该功能仅支持开发者通过API配置和调用，想用的小伙伴们还需耐心等一等。

Claude模型升级

数学能力反超OpenAI

看完新功能展示，再来看看本次Claude 3.5系列模型升级变化。

从官方给出的测试数据来看，对比上一代Claude 3.5 Sonnet，升级版模型在逻辑、编程、数学等方面都有明显能力提升。

特别是在数学方面，原本落后于劲敌OpenAI的模型GPT-4o，但这次升级后实现了反超。现在可以说，Claude 3.5 Sonnet是全面“吊打”GPT-4o了。

全新模型Claude 3.5 Haiku主打的是性价比和响应速度，在与Claude 3 Haiku相似成本的情况下，新模型在每项技能上都有了进一步提升。

另外，Haiku模型的使用价格仅为Sonnet模型的是十二分之一，想必会成为不少开发者的性价比之选。

Anthropic表示，升级版Claude 3.5 Sonnet已经面向用户开放，而Claude 3.5 Haiku将在本月底，通过API等形式开放（先开放纯文本模型）。

http://mp.weixin.qq.com/s?__biz=MzU2OTgzMDg3Mg==&mid=2247511633&idx=2&sn=12c077fc63de4f5eece703b293d5a030

搜狐科技聚焦前沿科学与科技产业报道，深度跟踪基础科学、人工智能、互联网、通信等领域重大事件，洞察科技趋势与商业逻辑。

最新文章

谁扶听泉凌云志？

对话PandaX实验刘江来：暗物质有“隐身术”，会穿墙，甚至能穿越整个宇宙来到地球

营收首超特斯拉，比亚迪用1600亿构筑技术护城河

每日优鲜们烧了几百亿都没成的市场，被“00后”救活了？

被裁设计师转行AI创作，为赚钱200元代写作业的活儿也接

频繁使用GPS丧失方向感？清华大学陈霓虹：影响或可逆，可通过学习训练提升

疯狂小杨哥，换“马甲”复播？

百万年薪大厂人35岁被裁：AI创业3个项目赚3万，为还房贷重返职场

商汤十周年陷裁员风暴：员工不知裁员标准，押注AI六年半亏528亿元

舆论场和直播间，两个不同的董宇辉

苹果第四财季净利润下滑36％，大中华区收入仍在下滑

任正非最新讲话：美国科技非常发达，源于它的开放包容；华为要向美国学习

把上海孩子逼得可能停课的“康妮”，到底是什么来头？

联想为什么在国外起诉中兴？

双十一破财买清净？阿里巴巴主动赔给股东30亿，但并非所有股东都能拿到

ARM计划“断供”高通，昔日伙伴为何“反目成仇”？

对话梅宏院士：现在的大语言模型技术路径不可能通往AGI，天花板是能预测到的

VIP会员只支持1台设备！爱奇艺，心太急

为何会海水倒灌？海大江文胜：风暴潮叠加天文大潮等多种因素造成，小概率事件

“大龄”转行AI设计师：早先会AI是加分，现在是必备；想让自己留在“牌桌”上

“纯血鸿蒙”的AI，摁着苹果Apple Intelligence打？

OpenAI劲敌甩大招！Claude 3.5升级，能力反超GPT-4o，训练AI自己操控电脑

华为原生鸿蒙操作系统发布！余承东宣布：我们用一年走过了外国人十几年的路

对话智源研究院院长王仲远：纯语言模型无法实现AGI，多模态将是必经之路

小马智行冲刺美股IPO：Robotaxi何时赚钱，两年半亏损23亿，IPO前估值600亿

当AI遇上美国大选：你猜大模型们觉得谁能赢？

盒马换帅200天，阿里新零售没有新故事

揭秘团播生意经：有中腰部主播月薪五万，爱豆“下海”团播；“卷”是行业共识

纯血鸿蒙公测版体验如何？有用户4天反馈40个BUG，想用微信要靠“抢”

搜索引擎真要被替代了？实测Kimi、智谱、360最新AI搜索功能，它的表现最强

撒哈拉沙漠发洪水？兰州大学王澄海：危害比内陆大，会威胁动植物，传播疾病

“AI教父”否定AI？！无论再堆多少GPU，现在的AI也实现不了AGI！

黄仁勋谈AI改变工作方式，生产力提升不意味需要裁员

警惕短剧收割老年人！大妈天天熬夜刷短剧，半年花了1.3万

见证历史！SpaceX星舰第五次发射：“筷子”成功夹住超大型火箭，完成回收任务

AI手机进化一年，厂商们不再一心求“大”

特斯拉的Robotaxi，和百度萝卜快跑有什么不同？

特斯拉Robotaxi亮相！除了没有踏板和方向盘，还有哪些意外惊喜?

对话清华刘嘉：诺奖颁给AI是物理学的自我革命，AI必须纳入物理体系

县城贵妇，买爆山姆

获66亿美元融资、估值1570亿美元，OpenAI“抛弃”技术理想，加速商业化

2024诺贝尔物理学奖颁给了“AI 教父”，物理学真的不存在了？

钢铁侠大战奥特曼！旧金山不容二虎的AI商战，你站谁？

霸道总裁为什么偏偏爱上绝经的我

滞留太空114天，马斯克拯救宇航员布奇和苏尼

余承东最新发言：三折叠手机春节前至少生产100多万台，大家都说我疯了

氢能是21世纪“终极能源”还是“大骗局”？

山姆·奥特曼，寡王当立

不怕OpenAI抢风头！谷歌发布Gemini 1.5升级模型，综合能力提升，价格减半

华为终端业务再发力：智界R7亮相，余承东自曝卖一台亏3万；纯血鸿蒙下月商用

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉