Anthropic 的 ChatGPT 竞争对手 Claude-2 刚刚发布,令人难以置信。它更便宜、更强大、更快,可以处理 PDF,并支持更长的对话。
Claude 2不只是简单的增量提升。以响应时间更长、性能更高、每次提示处理Token高达100K的强大能力,Claude 2成为了颠覆游戏规则的力量的期待。
就学术实力而言,Claude 2的表现相当不错。在GRE阅读和写作考试中胜出了90%的研究生申请者,展现了其强大的自然语言处理能力。
不止于此,在律师资格考试的多项选择题中,它斩获了高达76.5%的出色成绩,这一前所未有的成就再次彰显了Claude 2的出色推理能力。
Claude 2的技术在编程语言和推理能力也得到了验证。在Python编码测试Codex HumanEval中的71.2%的高分得分就是最好的证明。此外,Claude 2在小学数学综合题GSM8k中以88.0%的成绩,展现出其在数学计算上的威力。
具体如下:
1. Claude 比 GPT-4 便宜 5 倍。
2.有更新的数据。网站、第三方许可数据集以及 2023 年初以来自愿提供的用户数据的组合。
3. 它在 GRE 写作和 HumanEval 编码基准上优于 GPT4。
3. 它具有 100,000 个Token的上下文窗口,是所有商用模型中最大的。
4. 可以分析大约75,000个单词,大约是《了不起的盖茨比》的长度。
5. 其10% 的训练数据是非英语的。
使用示例
访问网站:http://claude.ai ,强烈推荐大家测试,敬请注意:光哥使用的是美国节点。目前只支持"美国"和"英国",曾有朋友曾因地域问题被禁止使用。
1.通用邮箱注册
2.使用介绍
除了可以直接输入文本,还可以直接上传10M以内的PDF,CSV等文件,最多可以支持同时上传5个文件,这个功能非常好用,可以做多个文档的对比啦,点击“曲别针”按钮上传文件...
正在上传文件中....
3.单文件效果测试
测试文件是《Are Emergent Abilities of Large Language Models a Mirage?》
看一下结果,总体来说,分析的质量还算不错
4.多文件上传测试
我把《Emergent Abilities of Large Language Models》这篇论文也加了进来,让Claude-2对《Are Emergent Abilities of Large Language Models a Mirage?》之间进行比较。
从结果来看,中文翻译还是不如GPT4,把Emergent Abilities翻译成了“新兴能力”,实际上正确翻译应该是“涌现能力”。这时Prompt Engineering可以派上用场啦Few Shot它一下就好啦。
用户体验还不错
不论怎么样,Claude 2 证明了大模型领域正在不断取得的进步,作为使用者我们就用起来就好啦。