Claude和ChatGPT到底选择谁？用真实数据对比

文摘 2024-11-18 21:03 广东

关于“Claude和ChatGPT到底选择谁的问题”，如果是放到2个月前，我或许会毫不犹豫选择ChatGPT，不过最近Claude的一顿更新，让我一下子难以做出选择。有人说ChatGPT是理科生，在数学，逻辑推理能力更强，而说Claude是文科生，在写作方面表现更强。

可事实真的如此吗？

下面我将对Claude 和ChatGPT 两个模型的会员版进行深层次全面的对比，如果大家还没有订阅，可以看我之前的文章，里面详细的介绍了ChatGPT和Claude的注册订阅教程。

如何注册Claude，并通过支付宝升级Claude Pro？

如何用支付宝升级ChatGPT，详细教程

作为一个Claude和ChatGPT都在使用的深度用户。在使用ChatGPT时，我特别喜欢它的Canvas功能，而在使用Claude时，我则更喜欢Artifacts功能。因此除了从模型的基础能力，我们还要看它们俩具体有哪些功能，从普通人视角，来进行比较。

Claude和ChatGPT的主要功能比较

ChatGPT的功能

Canvas: ChatGPT的Canvas功能使用户能够与AI合作完成写作和编码项目，提供了内联编辑、代码调试和文档版本控制等工具。这一功能特别适合需要团队协作的环境，如共同开发软件或撰写技术文档。
GPTs: 该功能允许用户创建定制的AI助理，执行网页搜索、图像制作或数据分析等任务，无需编程技能。这一功能适合客户服务、数据分析和内容创作等需要定制化AI助理的场景。
AI搜索功能: ChatGPT新增的搜索功能可以结合网络搜索结果提供答案，支持网页版以及手机和桌面应用。这使得用户可以快速获得最新的学术论文和研究成果，加速研究过程。
DALL·E功能: ChatGPT集成了DALL·E功能，可以根据自然语言描述来创建图像，非常适合广告设计、产品原型制作或社交媒体内容创作。
高级语音：ChatGPT的高级语音功能能够让用户和ChatGPT进行语音对话，而且就目前市面上，ChatGPT的高级语言功能最为逼真，所以不少人会拿它练英语口语等。

Claude的功能

Artifacts: Claude的Artifacts功能让用户可以在对话中创建和引用如代码片段、文本文档和网站设计等大量独立的内容，同时支持实时查看、编辑和构建内容。
数据可视化: Claude的数据分析功能支持用户编写并直接运行JavaScript代码，进行复杂的数据处理和实时分析，非常适用于需要进行数据分析和可视化的场景，如市场分析、财务报告或科学研究。
可视化PDF: Claude能够查看和分析PDF中的图像、图表和图形，适用于处理少于100页的PDF文件。这一功能适合技术文档审阅、学术论文分析或法律文件审查。
Computer use: 通过Claude的API，用户可以控制电脑执行搜索、数据分析和文档处理等任务，类似于一个智能个人助理，适用于自动化计算机操作的场景。
LaTeX渲染: Claude能够一致地呈现数学方程式，适用于处理数学公式和科学文献，如学术论文撰写、技术报告或教育教学。

ChatGPT 和 Claude 都是功能强大的AI模型，但各有专长。ChatGPT以其多功能全面著称，它就像一个多面手，应用场景特别广泛，包括写作协作、自定义AI助手、网络搜索、图像生成和语音对话。

而Claude则专注于编码和专业写作，提供代码片段管理、数据可视化、PDF分析等功能，特别适合技术和学术领域。

如果是你，你会为了它们俩的哪个功能订阅它们呢？

基础能力对比，看谁更强

首先，我们看一下Claude和ChatGPT在国内基准数据集的得分。

由于 Claude 和 ChatGPT 等模型在评估基本能力时，通常使用国外的基准数据集。然而，中文和英文在语言结构和表达方式上存在显著差异。为更准确地评估模型在中文语境下的表现，我选择了国内权威的模型测试机构——CLUE（中文语言理解测评基准）。

时间拉回最新版Claude 3.5 sonnet发布时，CLUE中文语言理解测评基准第一时间进行了评测，评测结果如下：

中文代码：

o1-preview＞Claude 3.5 Sonnet＞GPT-4o

Claude 3.5 Sonnet(1022)在中文代码能力（SC-Code3）上表现不俗，总分达到84.85分，较GPT-4o-0513高1.52分，较o1-preview低4.54分。其中，在高级代码任务上表现惊艳，得分69.23分，与o1-preview打平。

复杂任务高阶推理能力：

o1-preview＞GPT-4o＞Claude 3.5 Sonnet

Claude 3.5 Sonnet(1022)在中文高阶推理任务上取得74.54分，接近ChatGPT-4o-latest，相较o1-preview还有较大差距（-10.73分）。其中，多步推理能力相对突出，超过了ChatGPT-4o-latest。

同时，我还准备了最新LMSYS竞技场的数据。

LMSYS竞技场

LMSYS竞技场是：由加州大学伯克利分校 SkyLab 和 LMSYS 的研究人员开发。该平台拥有超过 1,000,000 张用户投票，使用 Bradley-Terry 模型生成实时排行榜，对最佳 LLM 和 AI 聊天机器人进行排名。

刚刚截了最新关于LMSYS竞技场的数据，显示最新版的Claude 3.5 sonnet要落后于GPT 4o和o1-preview模型。

所以从数据层面表明，ChatGPT的o1模型还是要远远强于最新版的Claude 3.5 sonnet，如果你追求哪个模型强，那基本可以无脑冲ChatGPT了。

Claude国内注册使用方法，用Claude写代码太爽了

Wildcard使用教程，解决绝大多数普通人的海外支付难题

⁠‍‌‌⁠‌‍‌⁠‌⁠⁠‍‍‍⁠‌后台回复：提示词

将获得【超实用】AI提示词大合集（持续更新）

AI工具导航站

AI使用小能手，AI使用教程、工具盘点与资讯大集合，做不被AI淘汰的人类。

最新文章

如何看待 OpenAI 最新发布的 o3 模型？有多强大？

现在大学生用chatgpt多吗？

如何购买 chatgpt ？最新国内使用ChatGPT的4种方法

为什么这么多家长开始使用ChatGPT来辅导孩子学习？附国内最新使用ChatGPT的方法

【最新】国内订阅ChatGPT方法，不用魔法也能使用ChatGPT

Genimi2.0国内怎么用？国内免费使用方法！

ChatGPT充值订阅指南，支付宝可用（附国内使用方法）

Claude国内注册使用及Pro订阅攻略（超详细）

虚拟卡是什么？如何办理一张虚拟卡？如何使用虚拟卡订阅ChatGPT

为什么Chatgpt最近傻了？附上4种解决GPT降智的方法

国内正式版OpenAI o1使用方法，三种方法教你如何使用正式版 o1模型

反击开始，谷歌正式推出Gemini 2，超越满血版o1（附最新Gemini 2订阅方法）

新版的Claude-3.5 sonnet到底如何？这篇文章会给你想要的答案（附4种国内使用方法）

OpenAI最大期货Sora正式发布，附国内Sora使用方法

如何开通GPT会员，如何在国内注册使用ChatGPT

OpenAI直播第一弹，满血版o1上线，国内可用！

OpenAI 12天直播，原来是要发布这些东西

chatgpt 20美金订阅到底贵不贵？这样用就不贵

ChatGPT降智怎么办（附具体解决方法）

chatgpt国内无限制使用的方法

为什么Claude-3.5-Sonnet比GPT-4o好用这么多?（附五种最新使用方法）

在国内如何顺利使用 ChatGPT? （附5个最新国内使用ChatGPT方法）

GPT-4o真有很多人在用吗？【附2024年12月最新订阅教程】

国内如何使用Claude?五种方法，任你选择

ChatGPT桌面版怎么安装（Windows和Mac详细教程）

最新ChatGPT 学生写作指南发布，来跟OpenAI学写提示词

20条ChatGPT论文指令，从选题到论文降重，你想要的这里都有

adobe正版多少钱一年？如何在国内购买正版adobe？

Claude和ChatGPT到底选择谁？用真实数据对比

如何获取OpenAI api key【2024干货】

被Claude封号烦恼？一个被封了8次的老用户告诉你解决方案

详解Cursor和Copilot的区别：一个用了一年的程序员的深度分析

为什么要使用Claude？因为能秒变数据分析高手

一天写好论文？来看Claude写论文的使用秘籍！

最新推特twitter X下载注册教程：安卓手机如何下载？

telegram下载、注册、充值保姆级指南，国内手机号就可以！

如何注册Claude，并通过支付宝升级Claude Pro？

OpenAI API /Claude API 充值支付方法(2024.11月最新教程）

如何用支付宝升级ChatGPT，详细教程

Claude 3.5 Haiku来了，价格翻四倍（附api充值方法）

ChatGPT手机上怎么用：苹果手机ChatGPT使用方法

美区 Apple ID注册，手把手教学，操作简单

ChatGPT手机上怎么用：安卓手机ChatGPT使用方法

安卓手机如何下载Google Play谷歌商店【保姆级教程】

Claude国内如何使用：从注册到升级详细指南

科研党福音！Cluade推出的数据分析工具有多好用？

声音也可以通过提示词去设计，很牛，但是也很可怕

Claude全面升级，我们试了一下，确实碾压OpenAI o1

海螺AI在海外太火了！对比可灵、Sora，效果真不错！

解锁Claude五大能力，带你使用更加强大的Claude

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉