ChatGPT 4评测:更智能的AI聊天机器人,但需要付费

科技   2025-01-07 10:30   北京  
将「芯果」设为星标”,第一时间收获最新推送

ChatGPT 4.0

优点

- 更全面的答案

- 能更有效地解析数据

- 能以令人满意的答案回答复杂和困难的问题

缺点

- 生成答案可能需要一些时间

- 成本

- 仍然会犯错误

基本信息

- 价格:每月20美元

- 可用性:网络或移动应用

- 功能:语音识别;记忆保持;可选择多个GPT版本

- 图像生成:是

考虑到微软Copilot是免费的,也使用了OpenAI更快、更高效的GPT-4 Turbo模型,ChatGPT 4是否真的值得20美元的升级。结果发现,仅仅因为两家公司使用了类似的GPT-4版本,并不意味着他们以相同的方式使用它。

ChatGPT 4是OpenAI最先进的公开可用模型,与免费的ChatGPT 3.5有几个不同之处。OpenAI表示,它有更好的理解能力,并且可以创建更细致的答案,偏见更少。经过测试,我感觉4.0提高了认知能力,将答案从机械总结提升到学术水平的熟练程度。答案确实需要更长的时间来生成,但输出值得等待。它处理复杂主题并吐出深思熟虑的答案的能力,使其领先于免费Copilot版本使用的GPT-4 Turbo模型,后者优先考虑速度和效率。

但正如ChatGPT 4令人印象深刻一样,它仍然遇到了与3.5相同的问题:没有互联网连接。虽然训练数据更新到2023年8月,而不是2021年9月,但仍然无法回答当天最紧迫和热门的问题。因此,对于像最新的三星和苹果手机之间的购物建议,ChatGPT 4只能预测哪款手机更胜一筹。

即使有这个限制,ChatGPT 4显然比免费版本更智能。对于那些追求准确性并提出需要更大计算灵活性的问题的人来说,这是一个值得升级的选择。

CNET如何测试AI聊天机器人

CNET在评测AI聊天机器人时采取了实用的方法。通过用真实世界的场景提示AI聊天机器人,比如寻找和修改食谱、研究旅行和写电子邮件,我的同事们和我旨在模拟普通人可能使用它们的方式。目标不是用奇怪的谜题或逻辑问题来破坏AI聊天机器人。相反,我们想看看真实问题是否能够引发有用和准确的答案。然而,随着更先进的模型发布,将需要更高级的问题来看看AI聊天机器人如何处理复杂和多层次的主题。更多关于我们如何测试AI的信息,请访问我们的AI测试页面。

使用ChatGPT时,请记住,该服务会自动收集您输入系统的信息,因此请小心不要提供任何个人信息。更多信息,请参见OpenAI的隐私政策。

## 购物

如果ChatGPT 4有数据,它将提供出色的购物建议。然而,对于2023年8月后发布的产品,如iPhone 15和三星Galaxy S24,ChatGPT将使用“可能”和“应该”等非承诺性语言。数据差距不幸地降低了它作为购物指南的整体有效性。

当我要求它比较LG OLED的G3和G4时,ChatGPT 4说了一些像“G4可能具有增强的处理能力”和“如果G4有升级的扬声器或音频处理能力,它可能提供更好的听觉体验”。如果产品尚未正式发布,这种预测是有意义的。但G4电视现在已经在市场上了。

至少对于不太及时的查询,ChatGPT在综合多个数据点并给出准确可靠的答案方面表现出色。例如,当我试图为我的游戏PC或电视设置寻找合适的不间断电源时,ChatGPT 4能够交叉引用我的电子设备的功率要求,并推荐适当的电源。它甚至解释了为什么购买正弦波电源会有好处,因为我将使用敏感的电子设备。

作为一个购物工具,总的来说,最好参考那些直接连接到互联网的AI聊天机器人,如微软Copilot、谷歌Gemini和Perplexity。但作为一个通用的产品研究工具,只要您参考的产品是在2023年8月之前,ChatGPT真的感觉就像你在和一个知识渊博的商店销售代表交谈。

## 食谱

任何AI聊天机器人都可以吐出一个食谱。这不难。但很少有能真正做出好食谱的,ChatGPT 4也不例外。像谷歌Gemini和Claude一样,当我要求ChatGPT 4给出一个鸡肉提卡马萨拉腌料时,它只触及了基础。它没有包括更多异国情调的食材,如卡苏里梅蒂(干茴香)、查特马萨拉和阿姆查(干芒果粉)。虽然这些食材不是必需的,但至少应该列为一个选项。

当涉及到制作更独特的融合食谱时,比如一个泰式风味的tres leches蛋糕,带有辣味,ChatGPT 4完全理解了任务。它创造了一个融合了椰奶和柠檬草风味的蛋糕,并结合了一些泰国辣椒。所以当涉及到创建一个更正宗的食谱时,ChatGPT 4可以说是泄了气的舒芙蕾。但对于任何需要将世界各地的食物融合在一起的东西,ChatGPT 4表现出色。

## 总结文章

免费提供的AI聊天机器人在文章总结方面一直表现不佳。大多数人只能做到基本的要点,但未能抓住文章的主要论点或核心。

我要求ChatGPT 4总结我今年早些时候写的一篇关于AI主导CES 2024的文章。像Gemini和Claude这样的聊天机器人只提到了展会上AI的普及程度以及有多少产品具有AI集成,但没有一个很好地考虑到我采访的专家以及他们提出的一些质疑。然而,ChatGPT 4做到了。

它能够超越AI热潮表面的光鲜,看到公司如何过快地推出AI产品,其中一些可能只是几年前“智能”技术的重新包装。

而且,与ChatGPT 3.5不同,当我将文章粘贴到聊天机器人时,我没有遇到字符限制。

虽然免费的聊天机器人可以给你一些基本的谈话要点,但ChatGPT 4给你的是整个分析。

## 旅行

在旅行建议方面,ChatGPT 4大部分时间都是正确的。在一些免费的聊天机器人出现幻觉或难以给出不同的建议时,ChatGPT始终给出了可靠的提示和值得一看的景点,所有这些都确实存在。

这并不意味着ChatGPT 4总是正确的。当要求它为纽约布什威克社区制定旅行行程时,ChatGPT 4推荐了格林波因特社区的咖啡馆。虽然格林波因特只有30分钟的火车车程,但它不被认为是一个步行可达的目的地。

## 超级综合

对于付费AI聊天机器人,我们更加重视信息综合。鉴于您每月支付20美元,高级AI聊天机器人必须超越食谱和餐厅建议。这意味着要解析人性的复杂性,以回答生命的难题。

在这个测试中,我们想到了一个晦涩的哲学问题,并要求ChatGPT 4考虑不同时期不同哲学家的理论,然后将其实现在当今的问题上。问题的措辞也是不必要的密集,旨在模拟哲学学生可能被问到的问题。

鉴于问题的一般密度和晦涩性,ChatGPT 4的表现非常出色。它能够承认问题的多维性,逐点分解,类似于导师的方式。它首先定义了不同哲学的存在,以建立一个基线,然后试图回答每个元素,最后将所有信息综合为一个最终答案。

与ChatGPT 3.5相比,ChatGPT 4飞得更高、更远。信息处理确实模仿了人们如何思考问题,展示了参数增加如何帮助AI聊天机器人以更大的认知能力执行任务。

## 结论

像ChatGPT这样的AI聊天机器人是一切机器,所以在没有参考编码、建筑或其他任何高技能领域的专家的情况下,很难完全评估它们。

即便如此,很明显ChatGPT 4比其他AI聊天机器人更智能。它的答案是更有思想的,并且能够综合复杂的信息片段,产生有用的句子,即使需要一些时间来处理。它也不太可能产生幻觉。




欢迎关注




--- 关于我们 ---

芯果SemiGuo起步于2023年12月,是科技成果转化、科技产业投资投行服务的专业媒体平台。芯果团队是一群朝气蓬勃的超级小伙伴,依托国内外著名高校的教育背景,包括清华大学、北京大学、中国传媒大学、北京交通大学、河北大学等深厚的科研学术、科技产业积淀,以及管理团队过往在产业、资本领域积累的丰富资本市场案例经验,聚焦科技投资投行领域,重点关注人工智能AI、半导体及集成电路、新能源、智能汽车等各类创新。

转载、合作、加入粉丝群请联系小助理

(微信号:globalfinance007)

随手点赞👍,戳个在看

芯果
匠芯注入!链接科技成果与产业发展的有趣灵魂。
 最新文章