ChatGPT 4评测：更智能的AI聊天机器人，但需要付费

科技 2025-01-07 10:30 北京

将「芯果」设为“星标⭐”，第一时间收获最新推送

ChatGPT 4.0

优点

- 更全面的答案

- 能更有效地解析数据

- 能以令人满意的答案回答复杂和困难的问题

缺点

- 生成答案可能需要一些时间

- 成本

- 仍然会犯错误

基本信息

- 价格：每月20美元

- 可用性：网络或移动应用

- 功能：语音识别；记忆保持；可选择多个GPT版本

- 图像生成：是

考虑到微软Copilot是免费的，也使用了OpenAI更快、更高效的GPT-4 Turbo模型，ChatGPT 4是否真的值得20美元的升级。结果发现，仅仅因为两家公司使用了类似的GPT-4版本，并不意味着他们以相同的方式使用它。

ChatGPT 4是OpenAI最先进的公开可用模型，与免费的ChatGPT 3.5有几个不同之处。OpenAI表示，它有更好的理解能力，并且可以创建更细致的答案，偏见更少。经过测试，我感觉4.0提高了认知能力，将答案从机械总结提升到学术水平的熟练程度。答案确实需要更长的时间来生成，但输出值得等待。它处理复杂主题并吐出深思熟虑的答案的能力，使其领先于免费Copilot版本使用的GPT-4 Turbo模型，后者优先考虑速度和效率。

但正如ChatGPT 4令人印象深刻一样，它仍然遇到了与3.5相同的问题：没有互联网连接。虽然训练数据更新到2023年8月，而不是2021年9月，但仍然无法回答当天最紧迫和热门的问题。因此，对于像最新的三星和苹果手机之间的购物建议，ChatGPT 4只能预测哪款手机更胜一筹。

即使有这个限制，ChatGPT 4显然比免费版本更智能。对于那些追求准确性并提出需要更大计算灵活性的问题的人来说，这是一个值得升级的选择。

CNET如何测试AI聊天机器人

CNET在评测AI聊天机器人时采取了实用的方法。通过用真实世界的场景提示AI聊天机器人，比如寻找和修改食谱、研究旅行和写电子邮件，我的同事们和我旨在模拟普通人可能使用它们的方式。目标不是用奇怪的谜题或逻辑问题来破坏AI聊天机器人。相反，我们想看看真实问题是否能够引发有用和准确的答案。然而，随着更先进的模型发布，将需要更高级的问题来看看AI聊天机器人如何处理复杂和多层次的主题。更多关于我们如何测试AI的信息，请访问我们的AI测试页面。

使用ChatGPT时，请记住，该服务会自动收集您输入系统的信息，因此请小心不要提供任何个人信息。更多信息，请参见OpenAI的隐私政策。

## 购物

如果ChatGPT 4有数据，它将提供出色的购物建议。然而，对于2023年8月后发布的产品，如iPhone 15和三星Galaxy S24，ChatGPT将使用“可能”和“应该”等非承诺性语言。数据差距不幸地降低了它作为购物指南的整体有效性。

当我要求它比较LG OLED的G3和G4时，ChatGPT 4说了一些像“G4可能具有增强的处理能力”和“如果G4有升级的扬声器或音频处理能力，它可能提供更好的听觉体验”。如果产品尚未正式发布，这种预测是有意义的。但G4电视现在已经在市场上了。

至少对于不太及时的查询，ChatGPT在综合多个数据点并给出准确可靠的答案方面表现出色。例如，当我试图为我的游戏PC或电视设置寻找合适的不间断电源时，ChatGPT 4能够交叉引用我的电子设备的功率要求，并推荐适当的电源。它甚至解释了为什么购买正弦波电源会有好处，因为我将使用敏感的电子设备。

作为一个购物工具，总的来说，最好参考那些直接连接到互联网的AI聊天机器人，如微软Copilot、谷歌Gemini和Perplexity。但作为一个通用的产品研究工具，只要您参考的产品是在2023年8月之前，ChatGPT真的感觉就像你在和一个知识渊博的商店销售代表交谈。

## 食谱

任何AI聊天机器人都可以吐出一个食谱。这不难。但很少有能真正做出好食谱的，ChatGPT 4也不例外。像谷歌Gemini和Claude一样，当我要求ChatGPT 4给出一个鸡肉提卡马萨拉腌料时，它只触及了基础。它没有包括更多异国情调的食材，如卡苏里梅蒂（干茴香）、查特马萨拉和阿姆查（干芒果粉）。虽然这些食材不是必需的，但至少应该列为一个选项。

当涉及到制作更独特的融合食谱时，比如一个泰式风味的tres leches蛋糕，带有辣味，ChatGPT 4完全理解了任务。它创造了一个融合了椰奶和柠檬草风味的蛋糕，并结合了一些泰国辣椒。所以当涉及到创建一个更正宗的食谱时，ChatGPT 4可以说是泄了气的舒芙蕾。但对于任何需要将世界各地的食物融合在一起的东西，ChatGPT 4表现出色。

## 总结文章

免费提供的AI聊天机器人在文章总结方面一直表现不佳。大多数人只能做到基本的要点，但未能抓住文章的主要论点或核心。

我要求ChatGPT 4总结我今年早些时候写的一篇关于AI主导CES 2024的文章。像Gemini和Claude这样的聊天机器人只提到了展会上AI的普及程度以及有多少产品具有AI集成，但没有一个很好地考虑到我采访的专家以及他们提出的一些质疑。然而，ChatGPT 4做到了。

它能够超越AI热潮表面的光鲜，看到公司如何过快地推出AI产品，其中一些可能只是几年前“智能”技术的重新包装。

而且，与ChatGPT 3.5不同，当我将文章粘贴到聊天机器人时，我没有遇到字符限制。

虽然免费的聊天机器人可以给你一些基本的谈话要点，但ChatGPT 4给你的是整个分析。

## 旅行

在旅行建议方面，ChatGPT 4大部分时间都是正确的。在一些免费的聊天机器人出现幻觉或难以给出不同的建议时，ChatGPT始终给出了可靠的提示和值得一看的景点，所有这些都确实存在。

这并不意味着ChatGPT 4总是正确的。当要求它为纽约布什威克社区制定旅行行程时，ChatGPT 4推荐了格林波因特社区的咖啡馆。虽然格林波因特只有30分钟的火车车程，但它不被认为是一个步行可达的目的地。

## 超级综合

对于付费AI聊天机器人，我们更加重视信息综合。鉴于您每月支付20美元，高级AI聊天机器人必须超越食谱和餐厅建议。这意味着要解析人性的复杂性，以回答生命的难题。

在这个测试中，我们想到了一个晦涩的哲学问题，并要求ChatGPT 4考虑不同时期不同哲学家的理论，然后将其实现在当今的问题上。问题的措辞也是不必要的密集，旨在模拟哲学学生可能被问到的问题。

鉴于问题的一般密度和晦涩性，ChatGPT 4的表现非常出色。它能够承认问题的多维性，逐点分解，类似于导师的方式。它首先定义了不同哲学的存在，以建立一个基线，然后试图回答每个元素，最后将所有信息综合为一个最终答案。

与ChatGPT 3.5相比，ChatGPT 4飞得更高、更远。信息处理确实模仿了人们如何思考问题，展示了参数增加如何帮助AI聊天机器人以更大的认知能力执行任务。

## 结论

像ChatGPT这样的AI聊天机器人是一切机器，所以在没有参考编码、建筑或其他任何高技能领域的专家的情况下，很难完全评估它们。

即便如此，很明显ChatGPT 4比其他AI聊天机器人更智能。它的答案是更有思想的，并且能够综合复杂的信息片段，产生有用的句子，即使需要一些时间来处理。它也不太可能产生幻觉。

欢迎关注

--- 关于我们 ---

芯果SemiGuo起步于2023年12月，是科技成果转化、科技产业投资投行服务的专业媒体平台。芯果团队是一群朝气蓬勃的超级小伙伴，依托国内外著名高校的教育背景，包括清华大学、北京大学、中国传媒大学、北京交通大学、河北大学等深厚的科研学术、科技产业积淀，以及管理团队过往在产业、资本领域积累的丰富资本市场案例经验，聚焦科技投资投行领域，重点关注人工智能AI、半导体及集成电路、新能源、智能汽车等各类创新。

转载、合作、加入粉丝群请联系小助理

（微信号：globalfinance007）

随手点赞👍，戳个在看

芯果

匠芯注入！链接科技成果与产业发展的有趣灵魂。

最新文章

2024年美国出口管制措施盘点：“小院高墙”策略收效甚微？

资讯速递！2024年1—11月我国集成电路产量同比增长23.1%

资讯速递！微软计划2025年投资800亿美元，打造AI智算中心

ChatGPT 4评测：更智能的AI聊天机器人，但需要付费

新年芯资讯！AI前沿新闻速递

资讯速递！天津市首只AIC股权投资基金完成注册，目标投资规模10亿元

AI标签：2025年的AI图像鉴伪发展趋势

智驭未来：人工智能在这些领域掀起新浪潮！

2025增长70%？什么投资细分领域？

资讯速递！黄仁勋透露GB200生产顺利；基于新型SiC复合衬底的低成本MOSFET取得重要进展！

芯闻早知晓！新型芯片研制成功，最新动态速递

资讯速递！“人工智能+”深度融合，加速未来产业培育

资讯速递！中央经济工作会议点题 “人工智能+”与未来产业

热度攀升！超20家A股上市公司披露并购重组最新公告

科技芯片领域风云变幻：巨头动态、争端升级与市场新趋势

73%的iPhone用户对苹果AI智能说“不，谢谢”

顶配的人工智能：谷歌和三星的下一代安卓XR耳机和眼镜

资讯速递！A股IPO撤单潮下何去何从？内部整改、寻求融资、并购重组或重启上市

智能感知集成系统沙龙第37期 | 芯果Online

OpenAI首席执行官：我们将看到类人式AI比我们想象的要快

台积电市占率将超66%！2025年半导体8大趋势解析

政策频出，并购潮涌，千帆竞发的投资机构如何上手操作？

12.20见！芯果联合梧桐荟 “产·投·研”沙龙第6期：芯片级散热技术发展应用与投资机会

活动预告 | 芯果SemiGuo联合梧桐荟 “产·投·研”沙龙第6期：芯片级散热技术发展应用与投资机会

AI算力比拼：五大科技巨头储备了多少GPU？

资讯速递！2024年Q3全球晶圆代工行业收入同比增长27%

为什么苹果的未来可能取决于Siri——苹果的虚拟助手可能是连接其未来产品的纽带

“芯”动能，新发展：“再造一个晋江”如今进度如何了？

芯闻早班车！多行业协会发声慎购美芯片，苹果选用亚马逊AI芯片提升效率

谁是2024年最佳AI图像生成软件？

埃隆·马斯克的xAI据报即将推出消费者应用！资讯转载你想知道的这里都有！

任期内股价下跌60%，英特尔Intel执行长下台：一张图看半导体巨人28年市值变化

资讯速递！北京发布促专精特新企业高质量发展新政，集成电路首流片被划重点

SK海力士宣布固定股息上调25%，公布股东回报新政策和价值提升计划

张忠谋：台湾改变了我的后半生，14天创造产生“晶圆代工”模式！

OpenAI Dall-E 3评测：生成性AI，用于异想天开、有趣的插画

Apple Intelligence 早期评测：不要期待你的 iPhone 会有彻底的不同

人工智能动态前沿：埃隆·马斯克对特朗普的影响力可能带来更严格的人工智能规则

资讯转载！英伟达：Blackwell芯片仍供不应求，增产过程将持续至2026财年

谷歌的人工智能发展使气候目标岌岌可危。它本可以做得更好

让AI来帮助你做旅行规划！与AI同行

资讯速递！三星推动自主研发Exynos 2600，计划为高通和英伟达提供2nm/3nm工艺

iOS 18.2 第二个测试版：为 iPhone 带来更多 AI 功能和其他新特性

资讯速递！三星将扩大HBM生产计划新工厂2027年完工

探索AI情感伴侣Ebb：在Headspace中找到新的自我关怀方式

芯片领域近期热点追踪：并购、申购与行业盛会

资讯速递！百度推出AI智能眼镜将于2025年上市

全球首个！我国新能源汽车年产量首次突破了1000万辆

资讯转载！美方据报要求台积电对某些复杂芯片实施出口限制商务部回应

资讯转载：全球半导体产业风云变幻——国产替代加速与技术创新并进

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉