人工智能公司Anthropic在前几天发布了下一代Claude 3模型系列,该系列模型在认知能力方面树立了新的行业标杆。
Claude 3模型系列在各种任务中均取得了优异成绩,超过了OpenAI的GPT-4模型。在自然语言理解、代码生成、生物学知识、网络安全知识和自主性方面,Claude 3模型系列均取得了最先进的成果。
该系列包含三个按能力递增排列的最新模型:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。每个后续模型都提供更强大的性能,使用户能够根据其特定应用选择最佳的智能、速度和成本平衡。Sonnet目前可以在159 个国家/地区全面开放。Haiku 将很快可用。
为了确保模型输出的高精度和可扩展性,Anthropic 使用了一组复杂的问题来测试 Claude 3 模型。与之前的版本相比,Opus 在这些具有挑战性的开放式问题上的准确性提高了两倍,错误答案也减少了。此外,未来的 Claude 3 模型将包含引用功能,允许用户通过引用特定来源来验证答案,从而增强模型的可信度。
Claude 3系列模型在发布时将提供20万令牌的上下文窗口,但所有三个模型都能够接受超过100万令牌的输入,并且可能会向需要增强处理能力的特定客户开放此功能。
Claude 3 系列模型在设计时既注重能力也注重可信度。Anthropic 拥有专门的团队跟踪和减轻各种风险,例如错误信息、生物武器滥用、选举干预和自主复制能力。Anthropic通过“限制人工智能”等方法来提高模型的安全性 和透明度,并调整模型以减轻新模态可能引发的隐私问题。
Claude 3在减少模型偏见同样有重大进展,根据“问答偏见基准测试”(BBQ),Claude 3的偏见比之前的模型更少。Anthropic改进技术以减少偏见并促进模型的更大中立性,确保它们不会偏向任何特定的立场。
尽管Claude 系列模型在生物知识、网络安全知识和自主性方面取得了重大进步,但根据 Anthropic的 “负责任扩展政策”,其AI安全级别仍然为2级 (ASL-2)。Anthropic评估认为,目前这些模型造成灾难性风险的可能性可以忽略不计。
Claude 3系列模型更擅长遵循复杂的多步骤指令,尤其擅长遵守品牌风格和响应指南,以及开发用户可信赖的面向客户的体验。此外,Claude 3 系列模型更擅长生成流行的结构化输出,例如JSON 格式,这使Claude用于自然语言分类和情感分析等用例变得更加简单。
Opus是目前Claude 3系列中最智能的模型,在高度复杂的任务上拥有市场领先的性能,可以流畅而人性化地理解开放式提示和从未见过的场景,Opus向我们展示了生成式AI的可能性极限。
虽然Claude 3在企业级市场上将给我们带来新的AI商业模式,但关于AI的安全性和隐私保护仍然还需要时间验证,考虑到人工智能专家一直警告用户不用上传不想公开的任何信息给AI,大家是想要效率呢还是要隐私呢?