GPT4o OmniModel 对所有用户免费

文摘 2024-05-14 09:25 上海

GPT-4o（“o”代表“omni”）是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入，并生成文本、音频和图像的任意组合输出。它可以在短至 232 毫秒的时间内响应音频输入，平均为 320 毫秒，与人类的响应时间相似在一次谈话中。它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配，在非英语文本上的性能显著提高，同时 API 的速度也更快，成本降低了 50%。与现有模型相比，GPT-4o 在视觉和音频理解方面尤其出色。

模型评估

根据传统基准测试，GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能，同时在多语言、音频和视觉功能上设置了新的高水位线。

文本评估

改进推理 - GPT-4o 在 0-shot COT MMLU（常识问题）上创下了 88.7% 的新高分。所有这些评估都是通过我们新的简单评估收集的图书馆。此外，在传统的5-shot no-CoT MMLU上，GPT-4o创下了87.2%的新高分。（注：Llama3 400b 还在训练中）

音频 ASR

GPT-4o 比 Whisper-v3 显著提高了所有语言的语音识别性能，特别是对于资源匮乏的语言。

音频翻译

GPT-4o 在语音翻译方面树立了新的最先进水平，并且在 MLS 基准测试中优于 Whisper-v3。

M3Exam

M3Exam 基准是多语言和视觉评估，由来自其他国家标准化测试的多项选择题组成，有时包括图形和图表。在所有语言的基准测试中，GPT-4o 都比 GPT-4 更强。

视觉理解

视觉理解评估 - GPT-4o 在视觉感知基准上实现了最先进的性能。所有视觉评估都是 0 次测试，其中 MMMU、MathVista 和 ChartQA 作为 0 次测试 CoT。

模型安全性和局限性

GPT-4o 通过过滤训练数据和通过训练后细化模型行为等技术，在跨模式设计中内置了安全性。OpenAI 还创建了新的安全系统，为语音输出提供防护。

OpenAI 对网络安全、CBRN、说服力和模型自主性的评估表明，GPT-4o 在这些类别中的任何类别中的得分都不高于中等风险。该评估涉及在整个模型训练过程中运行一套自动化和人工评估。使用自定义微调和提示测试了模型的安全缓解前和安全缓解后版本，以更好地激发模型功能。

在接下来的几周和几个月里，OpenAI 将致力于技术基础设施、培训后的可用性以及发布其他模式所需的安全性。例如，在发布时，音频输出将仅限于选择预设的声音，并将遵守现有的安全政策。将在即将发布的系统卡中分享有关 GPT-4o 全部模式的更多详细信息。

可用性

GPT-4o 是 OpenAI 突破深度学习界限的最新举措，这次是朝着实用性的方向发展。

GPT-4o 的文本和图像功能今天开始在 ChatGPT 中推出。免费套餐中已提供 GPT-4o，并向 Plus 用户提供高达 5 倍的消息限制。OpenAI 将在未来几周内在 ChatGPT Plus 中推出新版语音模式 GPT-4o 的 alpha 版。

开发人员现在还可以在 API 中访问 GPT-4o 作为文本和视觉模型。与 GPT-4 Turbo 相比，GPT-4o 速度提高 2 倍，价格降低一半，速率限制提高 5 倍。OpenAI 计划在未来几周内在 API 中向一小部分值得信赖的合作伙伴推出对 GPT-4o 新音频和视频功能的支持。

AI无界，一起探索

👉版权声明：

本平台内容均由 Inevitable AI整理收录，仅供学习和研究使用。如有版权问题，请联系我们进行删除处理。

转载合作请务必得到我们的授权，并注明出处。未经授权擅自转载本网站内容的，我们将保留追究其相关法律责任的权利。

http://mp.weixin.qq.com/s?__biz=MzU3NzAyNTI3OA==&mid=2247493244&idx=1&sn=6642a749dc489ee692e2c20433dde424

必然AI

高手们，准备好迎接新的挑战了吗？

最新文章

Coze 收费了，扣子还会远吗？

GPT4o OmniModel 对所有用户免费

扣子在上海｜一些捏 Bot 的 “旁门左道” 和赛前赛后

目前最好的AI模型：谷歌DeepMind的Gemini已超越GPT-4

AI全面升级：探索前沿技术的“Agents”框架

打造最佳教育未来：AI代理如何颠覆K-12教育？

资讯｜谷歌Bard推出全新功能，助您探索AI世界的无限可能性

创作属于你的音乐神作：Stable Audio助你成就音乐之王！

Rivet｜开源视觉AI编程环境，让编程轻松上手！

跨境电商必备工具！智猫 AI 让您的产品脱颖而出！ | Inevitable AI

AI变脸术｜FaceSwap算法让你的AI图像都看起来一样

Deep Art Effects｜基于AI的图像处理应用，让你的照片焕发出新的生机 | Inevitable AI

想让您的图像更完美吗？试试这些AI修复工具 | Inevitable AI

Leonardo AI： Midjourney的免费和最佳替代方案

疲于低效工作？这些 ChatGPT 插件正是你需要的！

ChatGPT 的 10 年被动收入指南——每月从 0 美元到 4,000 美元

Adobe Firefly｜解锁AI文本到图像生成器的新境界！

AI时代｜它是威胁还是机遇？如何找到生存之道！

AI的冲击｜探索技术最前沿的十年飞跃进步

UX/UI 设计的未来｜如何与AI合作创造更好的设计

释放 Bard AI 的力量：谷歌的革命性杰作

PrivateGPT：一个免费的 ChatGPT 替代方案，让您离线交互文档

分享｜无形接口：未来的用户界面没有屏幕

AI工具｜Wisdolia：无压力学习的记忆杀手锏锏

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉