ChatGPT最新模型GPT-4o mini 新增图片生成功能,API定价更具性价比

文摘   2024-07-22 19:20   法国  

GPT-4o mini 是 OpenAI 最新的经济高效模型,免费 ChatGPT 将使用这个模型。它旨在在性能和效率方面超越其前代产品。此外,它还具有图像生成功能!

虽然 OpenAI 尚未透露该模型的具体大小,但 GPT-4o mini 与其他小型 AI 模型(如Claude Haiku和Gemini 1.5 Flash)相当。我们将在本文中对它们进行比较,以找出哪一个更好。但首先,让我们了解 GPT-4o mini 提供了哪些更好的功能。

什么是 GPT-4o mini?

GPT-4o mini 是 OpenAI 推出的最新 AI 模型,旨在取代广泛使用的ChatGPT 3.5(免费版 ChatGPT 使用后者)。它提供更高性能、更快响应时间和图像生成等新功能,同时更具成本效益。该模型用途广泛,适用于各种应用,从内容创建和问题解决到复杂的数据分析和代码生成。以下是其改进后的基准:
  • MMLU(大规模多任务语言理解):该模型得分为 82%,反映了其在各个主题上的强大推理能力。
  • MGSM(数学小学合并):GPT-4o mini 得分为 87%,在数学推理方面表现出色,擅长解决逻辑问题和生成代码。
好消息:GPT-4o mini 可以生成图像
GPT-4o mini 可以同时处理文本和图像,而其前身 ChatGPT 3.5 则仅限于文本。这种双重能力可以更全面、更准确地处理信息,使模型能够同时理解和生成来自多个来源的内容。那么,还有什么呢?
GPT-4o mini 可在 10 秒内做出响应,与 ChatGPT 3.5 的 20 秒响应时间相比有显著改善。该模型的平均吞吐率为每秒 202 个令牌,比以前的模型快两倍多,非常适合需要快速响应的应用程序。
该模型一次最多可以处理 128,000 个标记,相当于一本普通书籍的长度。这种大型上下文窗口可确保长时间交互或处理大量文档时的一致性和相关性。

GPT-4o mini API 定价是其强项

GPT-4o mini 最显著的特点之一是它的成本效益:
  • GPT-4o mini API 定价:该模型的定价为每百万输入token 15 美分,每百万输出token 60 美分。这种定价结构比 GPT-3.5 Turbo 便宜 60%,使更广泛的受众能够更容易获得先进的 AI 功能。
运行新 OpenAI 模型的成本降低为各个行业和地区的更广泛采用打开了大门,尤其是让中小企业或预算有限的开发者受益。那么,GPT-4o mini 是否足够强大,尽管具有成本效益?
OpenAI 模型比较:GPT-4 Turbo、GPT-4、GPT-4o、GPT-4o mini、GPT-3.5 Turbo
首先我们来了解一下 GPT-4o mini 在 OpenAI 库中的地位:
人工智能模型的比较显示,GPT-4 Turbo 以最高的整体性能领先,准确率 91%,MMLU 56%,MATH 93.5%,MGSM 79%。GPT-4 紧随其后,在大多数类别中略有落后。GPT-4o mini 虽然不如 GPT-4 和 GPT-4 Turbo 强大,但仍展示了显著的功能,尤其是 82% 的显著准确率和数学任务的强劲表现(MGSM 70.2%,MATH 87.2%)。GPT-4o 的表现也非常出色,尤其是在 GPQA(83.4%)和 DROP(90.5%)方面表现出色。相比之下,GPT-3.5 Turbo 在所有指标上的表现都低得多,突显了后续模型的进步。
GPT-4o mini 对比 Gemini Flash 对比 Claude Haiku
现在,是时候将 GPT-4o mini 与其竞争对手进行比较了:
Gemini Advanced 和 Gemini 在整体表现上领先,Gemini Advanced 在 MMLU(52%)中得分最高,并在 GPQA(82%)、DROP(90%)和 MATH(90%)中取得了优异的成绩。不过,尽管新的 OpenAI 模型与它们很接近,但它们并不是其天然的竞争对手。
当我们查看 Claude Haiku 和 Gemini Flash 时,它们的性能指标较低。Claude Haiku 在 MGSM(40.9%)和 MMMU(46.4%)方面表现尤其糟糕,而 Gemini Flash 的成绩中等,但缺乏 MathVista 分数。
总之,GPT-4o mini 为 GPT-3.5 Turbo 等早期型号以及 Claude Haiku 和 Gemini Flash 等较新的竞争对手提供了一个引人注目的替代方案。虽然不如 GPT-4 Turbo 或 Gemini Advanced 先进,但 GPT-4o mini 以其改进的性能脱颖而出。它具有处理文本和图像的双重能力,再加上大量的上下文窗口和有竞争力的价格,使其成为企业和开发人员多功能且易于使用的选择。尽管 Gemini Advanced 等型号的竞争非常激烈,但新的 OpenAI 模型提供了性能和可负担性的平衡组合,确保了其在不断发展的 AI 领域中的相关性。

资料来源:https://dataconomy.com/2024/07/19/gpt-4o-mini-free-chatgpt/

科技白洞
提供精选的海外科技IT内容,有趣的双语中英知识内容分享,国外最新博客、视频内容教程,带你了解更广阔的世界。