ChatGPT最强对手发布Claude-2,长文、多PDF处理更快更强,示例奉上

文摘   科技   2023-07-12 17:33   广东  

Anthropic 的 ChatGPT 竞争对手 Claude-2 刚刚发布,令人难以置信。它更便宜、更强大、更快,可以处理 PDF,并支持更长的对话。
Claude 2不只是简单的增量提升。以响应时间更长、性能更高、每次提示处理Token高达100K的强大能力,Claude 2成为了颠覆游戏规则的力量的期待。

就学术实力而言,Claude 2的表现相当不错。在GRE阅读和写作考试中胜出了90%的研究生申请者,展现了其强大的自然语言处理能力。

不止于此,在律师资格考试的多项选择题中,它斩获了高达76.5%的出色成绩,这一前所未有的成就再次彰显了Claude 2的出色推理能力。

Claude 2的技术在编程语言和推理能力也得到了验证。在Python编码测试Codex HumanEval中的71.2%的高分得分就是最好的证明。此外,Claude 2在小学数学综合题GSM8k中以88.0%的成绩,展现出其在数学计算上的威力。

具体如下:

1. Claude 比 GPT-4 便宜 5 倍。

2.有更新的数据。网站、第三方许可数据集以及 2023 年初以来自愿提供的用户数据的组合。

3. 它在 GRE 写作和 HumanEval 编码基准上优于 GPT4。

3. 它具有 100,000 个Token的上下文窗口,是所有商用模型中最大的。

4. 可以分析大约75,000个单词,大约是《了不起的盖茨比》的长度。

5 其10% 的训练数据是非英语的。

使用示例

访问网站:http://claude.ai ,强烈推荐大家测试,敬请注意:光哥使用的是美国节点。目前只支持"美国"和"英国",曾有朋友曾因地域问题被禁止使用。

1.通用邮箱注册

2.使用介绍

除了可以直接输入文本,还可以直接上传10M以内的PDF,CSV等文件,最多可以支持同时上传5个文件,这个功能非常好用,可以做多个文档的对比啦,点击“曲别针”按钮上传文件...

正在上传文件中....

3.单文件效果测试

测试文件是《Are Emergent Abilities of Large Language Models a Mirage?》

看一下结果,总体来说,分析的质量还算不错

4.多文件上传测试

我把《Emergent Abilities of Large Language Models》这篇论文也加了进来,让Claude-2对《Are Emergent Abilities of Large Language Models a Mirage?》之间进行比较。

从结果来看,中文翻译还是不如GPT4,把Emergent Abilities翻译成了“新兴能力”,实际上正确翻译应该是“涌现能力”。这时Prompt Engineering可以派上用场啦Few Shot它一下就好啦。

用户体验还不错

不论怎么样,Claude 2 证明了大模型领域正在不断取得的进步,作为使用者我们就用起来就好啦。

光哥说AI
站在数字化战略与工程实践交汇路口的探索者
 最新文章