首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

刚刚，Claude 3.5学会用电脑了！

旅行 2024-10-23 00:05 北京

这次，Claude 学会用电脑了！

Anthropic最新发布的Claude 3.5系列模型不仅智能大幅提升，还学会了一项全新技能：使用电脑。

这下，AI终于可以像人类一样操作各种软件和工具了！

电脑小白变身"电脑高手"

Anthropic推出了一项名为"computer use API"的新功能。简单来说，就是让Claude看电脑屏幕截图，然后告诉你下一步该怎么操作，比如移动鼠标、点击按钮或输入文字。

这听起来似乎很简单，但其实一点也不容易！😀

以前我们需要为每个任务开发专门的工具，现在只要教会Claude基本的电脑操作，它就能自然而然地使用各种软件了。

想象一下，你的AI助手不仅能和你聊天，还能帮你操作电脑。这听起来是不是很酷？

Anthropic正在将这个想象变为现实。他们开发了一个API，让Claude能够感知和交互计算机界面。简单来说，Claude现在可以看屏幕、移动鼠标、点击按钮，甚至输入文字了！

这项技术的潜力是巨大的。开发者们可以利用它来自动化重复性任务、进行测试和质量保证，甚至执行开放式研究。

不过，Claude目前还是个"电脑小白"。它有时候会搞不清楚怎么滚动页面、拖拽文件或放大缩小。但Anthropic表示，这项功能会在未来几个月内迅速提升。

有趣的"熊孩子"时刻

就像所有学习新技能的过程一样，Claude在学习使用电脑的过程中也闹出了不少笑话。

比如，在录制演示视频时，Claude不小心停止了一个长时间运行的屏幕录制，导致所有录像都丢失了。以及有趣的是，在一次编码演示中，Claude竟然开小差去浏览黄石国家公园的照片了！

这小插曲也让我们看到，AI不仅在变得越来越强大，也在变得越来越"人性化"。

3.5模型更新超越o1-preview

除了会玩电脑，Claude 还迎来了新的更新：最新版的Claude 3.5 Sonnet 和Claude 3.5 Haiku。

编程能力大跃进

除了学会用电脑，新版Claude 3.5 Sonnet的整体智能水平也有了全面提升。其中最显著的进步是在编程方面。

在SWE-bench Verified测试中，Claude 3.5 Sonnet以49%的成绩创下了新的记录，超越了包括OpenAI o1-preview在内的所有公开模型。这个成绩是在不使用复杂辅助框架的情况下取得的，更显示出它强大的编程能力。

更快更便宜的Haiku

Anthropic还推出了一个新模型：Claude 3.5 Haiku。这是他们最快速、最经济的模型，将取代之前的3.0 Haiku版本。

虽然速度快、成本低，但Claude 3.5 Haiku的表现却一点也不含糊。在编程任务上，它甚至超越了许多顶尖模型，包括原版Claude 3.0 Haiku和 4o-mini。

安全性和未来展望

Anthropic非常重视AI的安全性。他们与美国和英国的AI安全研究所合作，对新模型进行了预部署测试。同时，他们也评估了可能存在的灾难性风险，确保模型符合他们的"负责任扩展政策"。

对于"computer use"这项新功能，Anthropic也采取了积极的安全措施。他们开发了新的分类器，可以识别何时使用了这项功能，以及是否发生了潜在的滥用行为。

Anthropic表示，这些新技术仍处于早期阶段，他们期待通过初步部署来更好地理解其潜力和影响。他们也欢迎开发者们提供反馈，共同探索Claude的新可能性。

看来，AI离真正成为真正的"数字生命"又近了一步。

不过……这是好事还是坏事呢？

👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本；
每天挖掘出10+ 热门的/新的 github 开源 AI 项目；
每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

http://mp.weixin.qq.com/s?__biz=MzA4NzgzMjA4MQ==&mid=2453453588&idx=1&sn=326b1f68999117768c1ec70a019bf000

关注AGI 的沿途风景！

最新文章

刚刚，Claude 3.5学会用电脑了！

核能大潮袭来！人工智能巨头押注电力

MLX-VLM：让你的Mac秒变AI视觉大师！

生物界的GPT来了？Basecamp Research获6000万美元融资打造「生物版ChatGPT」

MAID：多文件一键生成ChatGPT提示词的神器！

惊人突破：ChatGPT诊断癌症达96%准确率

Perplexity计划筹资5亿美元，估值将达80亿美元

我如何在两周内全面学习LLMs？【实习求职必读】

重磅！OpenAI前CTO Mira Murati筹资一亿美元创办新公司

Sage：开源版GitHub Copilot，代码库也能聊天了！

特斯拉无线充电机器人，惊艳亮相！

重磅！微软开源1比特推理框架，CPU跑千亿模型，速度起飞

Yann LeCun：驴爬楼梯说明了什么？

SQL+LLM：让数据分析变得更加智能

Anthropic的财务分析师：用AI洞悉数据，一键生成可视化报告

Anthropic新研究揭示模型潜在的「破坏」能力

Omni ocr：「糟糕」PDF一键转结构化数据

重磅！OpenAI 或用「AGI已实现」漏洞与微软决裂

Greg Brockman将于下个月回归OpenAI，但，公司已物是人非！

英特尔联手AMD，x86联盟反击ARM霸权！

OpenAI大门敞开：不懂AI也能加入，只要你敢想敢干！

NotebookLM最新大升级：定制音频概览、后台播放，并推出企业版

Anthropic 的 CEO 认为 AI 将带来乌托邦 —— 但他首先需要数十亿美元

"X is All You Need"的论文标题是怎么爆发的？

为什么Yann LeCun与Sam Altman对AGI 的预测如此不同？

Meta推出CoTracker3：重新定义视频点追踪

Suno 推出新功能：让照片和视频秒变专属歌曲

英伟达深夜偷袭，微调llama3.1直接击败GPT-4o和Claude3.5

刚刚，Mistral发布端侧模型，占据边缘计算之王！

OpenAI Swarm多代理框架 vs CrewAI 和 AutoGen

Andrej Karpathy：1B参数模型足矣！

AI能理解颜色吗？——将色彩进行嵌入的研究

OpenAI「重磅」新研究：你的名字可能影响ChatGPT的回答！

马斯克机器人梦碎？LeCun：Optimus不过是一具华而不实的躯壳

Gladia获1600万美元融资，推实时语音AI引擎

惊人发现！去学习法未能让AI真正「忘记」，它只是学会了「隐藏」

重磅！Anthropic发布超级智能时代的AI安全政策

Google计划用核能前往AGI

AI不如猫？斯坦福AI主任驳LeCun：你太悲观了！

OpenAI O1：正用AI加速AI的研发

普林斯顿大学：限制AI访问将带来负面影响。LeCun：开源终将胜利！

OpenAI的新威胁：前CTO Mira Murati 正挖角内部员工以创办新公司

AlphaCodium突破o1瓶颈：让AI代码生成更接近人类思维

LLM不会推理——1万美金悬赏下，o1在内所有模型均无法反转二叉树？！

谢赛宁：重要的话说三次，表征对齐很重要！！！

Sam Altman的完美花园：OpenAI的未来蓝图？

Cursor 最强对手？AI编程独角兽Poolside获eBay、英伟达融资5亿美元！

OpenAI将推出新模型对抗Anthropic！不是GPT-5

Glean：从OpenAI禁投黑名单到46亿美元估值

PyTorch版AlphaFold 3来了！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉