近日,Anthropic发布了改进版的 Claude 3.5 Sonnet,这一增强版在多种任务中表现优异,尤其是编程能力方面获得显著提升。
同时,Anthropic 还推出了快速高效的新一代模型Claude 3.5 Haiku 。
改进版 Claude 3.5 Sonnet:性能增强,专为编程和工具使用优化
新的 Sonnet 在软件工程和工具使用等领域的基准测试中显示出惊人的进步。
Claude 3.5 Sonnet在 SWE-bench 编程测试中从原来的 33.4% 提升至 49%,在零售领域的工具使用测试中达到 69.2%,航空领域的测试成绩也上升至 46%。
Claude 3.5 Sonnet 的升级版保持了原有版本的速度和价格,为用户提供更高效、更智能的 AI 支持。
其在推理能力和处理复杂任务方面表现更为出色,这为开发者和企业在自动化和编程任务中提供了更优的选择。
相比此前的版本,Claude 3.5 Sonnet 在多步任务中显示出更强的理解力,能够更流畅地完成从编码到复杂系统管理的工作,助力企业提高工作效率。
Claude 3.5 Haiku:速度与效能兼备,成本更具优势
与 Sonnet 相比,Claude 3.5 Haiku 更加注重速度和执行效率,在保持高性能的同时控制了成本。
Claude 3.5 Haiku 具备低延迟特性,其在 SWE-bench 测试中的成绩达到了 40.6%,超过了诸多同类先进模型,如 Claude 3.5 Sonnet 和 GPT-4o。
这使得 Haiku 非常适用于需要快速响应的用户界面任务,能够满足个性化体验和数据处理需求,例如库存管理和价格分析等。
Claude 3.5 Haiku 的设计旨在提供较低成本的高性能 AI 体验,为各类开发者和企业提供更便捷的人工智能解决方案。
该模型不仅能准确跟随指令,还能在复杂数据处理中表现出色。
Anthropic 希望 Haiku 能成为多种实时应用的核心驱动力,包括电商、服务和客户支持领域,为企业带来更灵活的人工智能应用场景。
新增「computer use」功能:实现 AI 操控电脑
除了模型本身的性能升级外,Anthropic 还为 Claude 3.5 引入了一个突破性的功能:「computer use」,允许 Claude 模仿人类的方式进行电脑操作。
这个新功能旨在赋予 Claude 类似于人类的「界面导航」能力,可以自主执行点击、输入、拖动等操作,用户无需编写额外代码即可通过 Claude 3.5 实现复杂的多步骤任务。
通过这一功能,开发者能够自动化许多需要人类手动操作的流程,比如填写在线表格、查询数据、提交报告等复杂操作。
该功能目前仍处于公共测试阶段,已有公司如 Replit 和 Browser Company 进行了探索,早期测试结果表明 Claude 在计算机模拟操作方面表现稳定,有望减少重复性操作的人工成本,提升企业的工作效率。
安全性与未来展望
Anthropic 在引入「computer use」的同时,也积极推动 AI 的安全使用,特别是这种涉及电脑操作的功能,可能会带来一些新挑战。
Anthropic 已对其 AI 模型添加了安全检测措施,以确保在复杂任务中不会引发潜在风险。
公司特别鼓励开发者在低风险任务中优先测试 Claude 的新功能,以安全、负责任的方式推动技术应用。
对此,各位读者有什么想说的?
欢迎留言,一起交流你的观点与看法!
诚邀投稿:
欢迎各位粉丝、朋友们提供稿件(前沿科技进展、科技产品动态、经典文献解读、技术原理科普、行业市场分析、科研生活感悟、社会民生观察等)。联系微信号:133 9674 1340,并请注明详细联系信息,对入选推送稿件者,我们会及时联系您,以微信红包形式给予报酬。
对前沿科技感兴趣的朋友,可以点击关注公众号,订阅感兴趣的话题专栏!
也可添加下述小编微信!小编邀请您一起加入“前沿科技观察”群聊!
让我们每天下午4点,一起探索全球最前沿的科技资讯!开启你的科技之旅,与志同道合的伙伴一同品味科技发展带来的时代红利,创新型的未来!
编辑|前沿科技观察
供稿|科创产业观察
审核|前沿科技观察