首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

革命序章：Claude 3.5 新 API，可操作电脑

科技 2024-10-22 23:59 广东

长话短说

Claude 又发新货

【新】3.5 Sonnet

比老版本更强，还能操作电脑

3.5 Haiku

比 gpt-4o-mini 强

官方新闻

https://www.anthropic.com/news/3-5-models-and-computer-use

当然

也可以看我下面整理的

先说说 3.5 Sonnet

我认为，这是一场革命

可以操作电脑了！！！

通过最新的 3.5 Sonnet API，允许 AI 像人一样使用操作电脑，包括不仅限于查看屏幕、移动光标、点击按钮和输入文本。

相关的文档，可以在此处找到：

https://docs.anthropic.com/en/docs/build-with-claude/computer-use

下面这是一段示例调用：

原理大概是这样：

第一步：明确工具和任务

在 API 请求中添加由 Anthropic 定义的计算机工具，并附上可能需要用到这些工具的提示词。例如：“把一张猫的图片保存到我的桌面。”

第二步：Claude 选择使用工具

Claude 会读取已存储的计算机工具定义，判断是否有适合的工具能帮助解决用户的问题。如果有，Claude 会生成一个正确格式的工具使用请求。API 的响应中会显示 stop_reason: tool_use，表示 Claude 决定使用工具。

第三步：提取工具信息，运行工具并返回结果

从 Claude 的请求中提取工具名称和输入内容。然后，在虚拟机或容器环境中运行这个工具。继续与用户对话时，要包含一个带有 tool_result 结果的消息。

第四步：继续使用工具直到完成任务

Claude 会分析工具的结果，判断是否需要继续使用更多工具。如果需要，Claude 会再次发送一个 stop_reason: tool_use，然后你需要重复第 3 步。如果任务已完成，Claude 会生成一条文字回复给用户。

参数与价格

在正常使用的情况下（Batch 半价）：

输入: $3 / 100万 token
输出：$15 / 100万 token

如果命中缓存

输入: $3.75 / 100万 token
输出：$0.30 / 100万 token

Claude 3.5 Sonnet 已经正式上线于网页和 App，并支持通过 Anthropic API、Amazon Bedrock 和 Google Cloud 进行调用。

再说说 3.5 Haiku

常规更新，性能比 GPT-4o-mini 强

参数与价格

在正常使用的情况下（Batch 半价）：

输入: $0.25 / 100万 token
输出：$1.25 / 100万 token

如果命中缓存

输入: $0.3 / 100万 token
输出：$0.03 / 100万 token

目前只是发布，还没正式上线（Comming Soon)

最后

OpenAI，看看人家！

以及 OpenAI 的操作电脑功能，啥时候发布

独家信息：ChatGPT 的 2 个待发布功能

http://mp.weixin.qq.com/s?__biz=MzkzNDQxOTU2MQ==&mid=2247492235&idx=1&sn=64c6f3866f2b9f242e55935d4347fc7d

拜AI古佛，修赛博禅心

最新文章

原理解析：17岁高中生「神级 Prompt，把 Claude 强化成满血 o1」

从百度 iRAG，看 AI 分野

我在公众号里，实现了一键特效

赛博精酿｜智能体专场：月底请大家喝一杯

招人｜中国信通院：大模型数据工程研究员

零代码：一键部署 3D 模型，守护最好的坤坤

腾讯开源：3D素材生成模型、最大 MoE 模型，兼容 OpenAI SDK 方式调用

我开发了一款排版器：20秒，完成公众号排版

OpenAI 在「问啥都行」上的一些回复

10月盘点：AI 行业大事记

我开发了一款新的 AI 搜索：批量搜

深度理解提示词：人人能学会，无需硬背

革命序章：Claude 3.5 新 API，可操作电脑

细说实现：大模型是如何被投毒的

“最强”小模型：Ministral 3B/8B 发布

175 份实战手册，来自 OpenAI

AI 模型战局渐定，下一波红利在哪？

特斯拉「We, Robot」发布会总结

拆解：智谱的「深度推理/多步搜索」

搞 AI 的，包揽诺贝尔物理、化学奖

独家信息：关于 o1 的 20 个真相

像用实习生一样用 AI 辅助你编程

ChatGPT上线全新功能Canvas - 我消灭你，与你无关。

扣子最佳实践：雅思口语专家

OpenAI 凌晨发布：Realtime 实时多模态 API，及其他

PIKA1.5正式上线，他们走上了另一条全新的"整活"之路。

AIPO：校园 AI 创投活动，开放报名！

9月：AI 圈的乌龙、趣事与新闻

智谱 API ：1折

OpenAI CTO 离职，Sora 前景不明

Llama-3.2 发布：多模态，禁欧洲

字节全新发布豆包AI视频模型 - 再见了Sora，你的时代过去了。

提示工程：反复崛起，反复被死亡

Claude Prompt：方法论

智谱开源：图生视频模型 & 视频标注模型

Qwen 2.5 开源，API 打一折

参加完 OpenAI 的活动，我看到了「草莓」的隐患

o1 能带我们走进 AGI 吗？

150 行代码，复刻「草莓」，青春版支持联网

「草莓」实测：可能只是工程 Trick，且有扣费陷阱！

原理解析：李继刚老师的「汉语新解」

iPhone 16 发布，全面解读「苹果2024发布会」

小红书式爆款文案正在剿杀语文。

拒绝谣言：OpenAI 没说新模型提价

插播：Qwen 404，但不必担心

最后一天：OpenAI 开发者日，将截止确认

近乎免费的 Gemini Flash，有了结构化输出

突发！Runway HF 已删库跑路

智谱 GLM-4-Plus 发布，独家附送免费 API，和我整的新活

OpenAI「草莓」今秋发布，随后是「猎户座」

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉