首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

Claude全面升级，我们试了一下，确实碾压OpenAI o1

文摘 2024-10-24 11:51 美国

Claude又一次深夜狂炸，推出全新的Claude 3.5Sonnet 和Claude 3.5 Haiku。

下面我会给大家介绍一下基本信息，后续将对全新版本的Claude 3.5 Sonnet进行测评。

注：Claude 3.5 Haiku由于还未发布，暂不做评测。

据官方给出的测评结果我们不难看出此次Claude 3.5 Sonnet的性能进行了全面升级。

在数学、研究生水平的推理能力整体超越GPT-4o。

而且在编程方面，升级过后的 Claude 3.5 Sonnet超越ChatGPT的o1模型。

可事实真的是这样吗？以下是我们对Claude 3.5 Sonnet的测评。

我们将用最新的Claude 3.5 Sonnet和o1-pr模型在编程、数学、写作、经典问题上进行PK，看谁的效果更好一点。

对了，如果对o1模型和Claude注册充值有需要的朋友可以看这篇网站——>海外软件充值方法

编程题对比

首先，我们出一道经典的C语言编程难题。

不出意外，两者都答对了，而且答案极其的标准。

面对目前两个顶级的编程助手，常规的编程题肯定是难不倒它们，于是我们自制了一道博士级别的编程难题。

o1模型：

Claude：

是不是看起来一头雾水。的确，里面的知识已经不是我们所能接触到的了。

不过我们通过第三方知名教授的确认，他认为Claude生成的效果更加好。

给出的原因是：Claude的方案通过面向对象的设计提升了代码的可读性和维护性，并使用优先队列来优化调度，处理了量子计算中的关键挑战，并提供参数调整的灵活性，尽管在某些实现细节需要进一步验证，但它提供了有效解决复杂问题的路径。

所以这一局Claude胜。不愧是Claude，效果杠杠的！

数学题对比：

我们此次选择的是2024年阿里达摩院的比赛真题，看谁在数学领域上能领先一步。

首先来一个简单的单选题。

o1模型：

不过在第一局开头，o1模型就生成错误的答案！o1模型给出的答案是4。

Claude：

反观升级过后的Claude 3.5 seneet轻轻松松就生成了准确的答案！

我还准备了第二道题目，同样也是阿里达摩院的数学竞赛题，不过，这次两者都回答准确了！

选择题可能过于简单，下面我们来测试一下它们对证明题的能力。

同样，依旧是自达摩院的数学竞赛题，不过是此次的压轴题，我们可以看一下那个模型能回答出来！

o1模型：

Claude：

通过上述证明比较，会发现o1模型的效果更好，不仅证明结构更加系统化，同时，关键步骤更加的详细。更重要的是还引入了数学公式支持论证。所以这一局，o1模型胜！

经典问题

9.18比9.9谁大。对于这个问题，它们俩都回答出来了。

不过面对另外一个经典问题：草莓这个单词有多少个r？o1模型却翻车了。

写作能力上

此次写作能力的测试会比较简单，只需模仿某一个人的写作风格进行写作即可。要求是不仅风格相似、语句通顺、而且要像人类写作一样！

首先，我们收集五篇“数字生命卡兹克”的文章，然后分别喂给ChatGPT和Claude，并让他们学习和模仿其写作风格。

最后会让ChatGPT和Claude在同一组提示词下写一篇公众号文章，看谁的效果更好。

o1模型：

Claude：

我只能说，Claude在写作方面完胜o1模型，大家可以清楚的看出，无论是写作风格，还是行文结构，效果都要远远超越o1模型。

我最后只想说，最新版的Claude 3.5 Sonnet太强了！

对了，如果想要上车ChatGPT或Claude的朋友，可以看我往期的文章！

ChatGPT充值订阅教程，支付宝可用（附国内使用方法）

Claude国内注册使用方法，用Claude写代码太爽了

⁠‍‌‌⁠‌‍‌⁠‌⁠⁠‍‍‍⁠‌后台回复：提示词

将获得【超实用】AI提示词大合集（持续更新）

AI工具导航站

AI使用小能手，AI使用教程、工具盘点与资讯大集合，做不被AI淘汰的人类。

最新文章

如何看待 OpenAI 最新发布的 o3 模型？有多强大？

现在大学生用chatgpt多吗？

如何购买 chatgpt ？最新国内使用ChatGPT的4种方法

为什么这么多家长开始使用ChatGPT来辅导孩子学习？附国内最新使用ChatGPT的方法

【最新】国内订阅ChatGPT方法，不用魔法也能使用ChatGPT

Genimi2.0国内怎么用？国内免费使用方法！

ChatGPT充值订阅指南，支付宝可用（附国内使用方法）

Claude国内注册使用及Pro订阅攻略（超详细）

虚拟卡是什么？如何办理一张虚拟卡？如何使用虚拟卡订阅ChatGPT

为什么Chatgpt最近傻了？附上4种解决GPT降智的方法

国内正式版OpenAI o1使用方法，三种方法教你如何使用正式版 o1模型

反击开始，谷歌正式推出Gemini 2，超越满血版o1（附最新Gemini 2订阅方法）

新版的Claude-3.5 sonnet到底如何？这篇文章会给你想要的答案（附4种国内使用方法）

OpenAI最大期货Sora正式发布，附国内Sora使用方法

如何开通GPT会员，如何在国内注册使用ChatGPT

OpenAI直播第一弹，满血版o1上线，国内可用！

OpenAI 12天直播，原来是要发布这些东西

chatgpt 20美金订阅到底贵不贵？这样用就不贵

ChatGPT降智怎么办（附具体解决方法）

chatgpt国内无限制使用的方法

为什么Claude-3.5-Sonnet比GPT-4o好用这么多?（附五种最新使用方法）

在国内如何顺利使用 ChatGPT? （附5个最新国内使用ChatGPT方法）

GPT-4o真有很多人在用吗？【附2024年12月最新订阅教程】

国内如何使用Claude?五种方法，任你选择

ChatGPT桌面版怎么安装（Windows和Mac详细教程）

最新ChatGPT 学生写作指南发布，来跟OpenAI学写提示词

20条ChatGPT论文指令，从选题到论文降重，你想要的这里都有

adobe正版多少钱一年？如何在国内购买正版adobe？

Claude和ChatGPT到底选择谁？用真实数据对比

如何获取OpenAI api key【2024干货】

被Claude封号烦恼？一个被封了8次的老用户告诉你解决方案

详解Cursor和Copilot的区别：一个用了一年的程序员的深度分析

为什么要使用Claude？因为能秒变数据分析高手

一天写好论文？来看Claude写论文的使用秘籍！

最新推特twitter X下载注册教程：安卓手机如何下载？

telegram下载、注册、充值保姆级指南，国内手机号就可以！

如何注册Claude，并通过支付宝升级Claude Pro？

OpenAI API /Claude API 充值支付方法(2024.11月最新教程）

如何用支付宝升级ChatGPT，详细教程

Claude 3.5 Haiku来了，价格翻四倍（附api充值方法）

ChatGPT手机上怎么用：苹果手机ChatGPT使用方法

美区 Apple ID注册，手把手教学，操作简单

ChatGPT手机上怎么用：安卓手机ChatGPT使用方法

安卓手机如何下载Google Play谷歌商店【保姆级教程】

Claude国内如何使用：从注册到升级详细指南

科研党福音！Cluade推出的数据分析工具有多好用？

声音也可以通过提示词去设计，很牛，但是也很可怕

Claude全面升级，我们试了一下，确实碾压OpenAI o1

海螺AI在海外太火了！对比可灵、Sora，效果真不错！

解锁Claude五大能力，带你使用更加强大的Claude

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉