OpenAI 发布 GPT-4o Mini:成本优势明显,性能优于 GPT-3.5 Turbo

文摘   2024-07-22 07:00   北京  

OpenAI 近日宣布推出全新产品—GPT-4o mini,这是一款高性价比的AI小微模型。GPT-4o mini 的推出在通过降低成本,更多开发者能够利用 AI 构建广泛的应用程序。


强大的性能表现


GPT-4o mini 在多个关键基准测试中的表现优异:


文本智能和推理能力:在 MMLU 基准测试中,GPT-4o mini 得分为 82%,超越了 Gemini Flash(77.9%)和 Claude Haiku(73.8%)。

数学和编码能力:在数学推理基准 MGSM 和编程性能评估 HumanEval 中,GPT-4o mini 分别得分 87% 和 87.2%,远超其他小型模型。

多模态推理:在多模态推理评估 MMMU 上,GPT-4o mini 得分 59.4%,优于 Gemini Flash(56.1%)和 Claude Haiku(50.2%)。


低成本、高效能


GPT-4o mini 的定价非常亲民,每百万输入仅需 15 美分,每百万输出 60 美分,比以往的顶尖模型便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。如此低的成本,极大地拓展了 AI 应用的可能性。


广泛的任务支持


GPT-4o mini 支持多种任务,包括链接或并行化多个模型调用、处理大量上下文(如完整的代码库或对话历史记录)、快速实时的文本响应等,适用于客户支持聊天机器人等场景。未来,该模型将支持文本、图像、视频和音频输入输出。


内置安全措施


安全性是 GPT-4o mini 的核心。我们在预训练和后续训练中使用了多种技术来确保模型的安全性,包括过滤不良内容和强化学习。超过 70 位外部专家对 GPT-4o 进行了测试,以确保其安全性和可靠性。GPT-4o mini 还应用了最新的模型指令层次结构技术,提高了模型对越狱、提示注入和系统提示提取的抵抗力。


GPT-4o Mini 成本优势


GPT-4o mini 现在可以通过 Assistants API、Chat Completions API 和 Batch API 以文本和视觉模型的形式使用。开发者每 1M 输入支付 15 美分,每 1M 输出支付 60 美分。我们计划在未来几天内推出 GPT-4o mini 的微调功能。


GPT-4o mini 的定价策略使其成为目前市场上最具成本效益的 AI 模型之一:

输入成本:每百万输入仅需 15 美分。

输出成本:每百万输出仅需 60 美分。


这一定价比 GPT-3.5 Turbo 便宜了 60% 以上,显著降低了开发者使用高级 AI 模型的门槛。


在 ChatGPT 平台上,Free、Plus 和 Team 用户将从今天起可以访问 GPT-4o mini,企业用户也将从下周开始使用这一新模型。这一举措符合 OpenAI 的使命——让人工智能惠及所有人。

自 2022 年推出 text-davinci-003 以来,GPT-4o mini 的成本已下降 99%。我们将继续致力于降低成本并提升模型功能。未来希望 AI 模型能够无缝集成到每个应用程序和网站中,让人工智能更普及、更可靠,成为我们日常数字体验的一部分。


GPT-4o mini 正在为开发者提供更高效、更经济的解决方案,推动 AI 应用的发展。OpenAI 将继续引领潮流,让人工智能的未来变得触手可及。


Agent获客新时代,你的企业上车了吗?

人机共生:大模型时代的工作与生活

传统AI与生成式AI的深度对比

OpenAI的Q计划:“Strawberry"新模型,可自主浏览互联网并自主推理

AI技术与企业数据的深度融合,开辟商业增长新蓝海

未来出行:无人驾驶能否取代网约车司机?

AI Agent:大模型演进的下一站

OpenAI CEO携手Thrive,创办AI健康公司

2024国产AI大模型应用报告

大模型与小模型:AI领域的双轨并行与未来趋势

2024上半年《人工智能现状报告》750名行业领导者、技术人员的意见

三星支持荷兰初创公司Axelera:开发全球最强大的边缘AI芯片

Runway推出GEN3 Alpha模型!

全球首款支持 GPT-4o 的智能眼镜 Solos AirGo Vision 发布

Resona V2A: AI智能解析视频,实现自动配音与配乐

AI文档搜索公司Hebbia融资超1.2亿美元,估值达8亿美元

字节跳动推出“豆包MarsCode”智能编程助手:国内开发者免费使用

每首歌索赔15万美元索尼、环球音乐、华纳起诉 Suno 和 Udio

OpenAI 收购远程协作平台 Multi,在企业解决方案领域发力!

腾讯元宝新版本发布:提升解析能力,支持1000万字超长文处理

RTranslator:全球首个开源实时翻译神器

OpenAI 前首席科学家 Ilya创办新 AI 公司,聚焦超级智能安全

AI Agent进入红海时代,开发者的红利时代来了

2024年美国科技行业裁员潮持续:从巨头到初创企业,60,000名员工面临失业

【AI+考试】30秒出题,1分钟开考,万物皆可考!

GPTZero:人工智能内容检测领域的黑马

PixVerse Magic Brush 上线:7 个示例教你玩转对象移动

LLM推理能力盲区:从《爱丽丝梦游仙境》测试看AI的局限与未来方向

快手发布视频大模型“可灵”:能生成2分钟1080p高质量视频

Qwen2模型家族来了

数名OpenAI、谷歌、DeepMind现任和前任员工,签署公开信警告人工智能风险

SD3 Medium 模型即将开源

AI 服务集体宕机:ChatGPT 领衔,Claude 和 Perplexity 紧随其后

NVIDIA 在 GDC 2024 推出全新数字人技术和 RTX SDK

AI在不同场景下如何提升效率,能否完全取代人类?

我是腾讯元宝,看透繁杂,听懂所需,说享精彩!

OpenAI官宣:已开始训练下一代“前沿AI模型”

马斯克融资60亿美元,计划推出xAI超级计算机

SignLLM:通过文字描述生成手语视频的多语言模型

美国「AI开源大模型」出口管制法案:43 比3通过第一轮

Truecaller:帮你接电话的AI助手来了

使用AI克隆拜登声音,被罚600万美元

大模型价格战升级!阿里、百度、字节跳动争相“降价”,大厂火拼,价格亲民

面壁智能MiniCPM-Llama3-V 2.5实力碾压GPT-4V、Gemini Pro,成为端侧多模态新霸主

FunClip:开源的AI视频自动化视频剪辑工具

国产大模型激战正酣:开源与低价的精彩对决

OpenAl发布GPT-4o全能模型,实时语音和视觉能力,再次刷新业界

探索未来网页设计:Wegic AI对话式建站助手!

月薪8千和月薪3万的区别:有没有熟练使用天工AI!

阿里云发布通义千问2.5:超越GPT-4 Turbo

全国首例“AI外挂”案:游戏世界的黑暗角落

微软为美国情报机构定制 GPT-4 生成式 AI 模型!

Logo Diffusion:打造个性化Logo的AI平台

支付宝智能助理:你生活琐事的“超级管家”

DrEureka:AI让机器狗玩瑜伽球,平衡能力简直绝了!

Copilot Workspace:告别孤独的编码之夜,迎接你的智能副驾

【AI+农业】AI育种大模型“丰登”问世 为粮食安全提供科技支撑

第七代机器人‘凤凰’,接近人类学习速度,24小时内掌握新技能

▲ 滑动查看往期内容

小微模型
一起探索AGI世界,解锁AI实用技能,伴您步入智能生活!
 最新文章