首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

重磅！OpenAI开放满血o1模型API，成本暴降60%

文摘 2024-12-18 03:22 河北

今天凌晨2点，OpenAI开启了第9天技术分享直播，正式发布了o1模型的API，并且对实时API进行大升级支持WebRTC。

其中，o1模型的API与之前的预览版本相比，思考成本降低了60%，并且附带高级视觉功能；GPT-4o的音频成本降低60%，而mini版本价格更是暴降了10倍。

同时OpenAI还发布了全新的偏好微调方法，通过直接偏好优化算法可以让大模型更好地掌握用户的偏好风格。

o1模型API

今天发布的正式版本o1模型API还集成了很多新功能，包括函数调用、结构化输出、开发者消息以及推理工作量。

函数调用允许模型根据输入数据自动调用相应的后端服务或外部API，实现复杂任务处理能力；结构化输出支持JSON格式的数据返回，确保输出结果符合预期结构，方便后续解析与应用；

开发者消息是一种新型系统消息形式，赋予开发者更大的控制权来指导模型行为；而推理工作量参数用于调整模型思考时间，平衡性能与准确性之间的关系。

在演示环节中，OpenAI展示了一款基于高级视觉功能的应用案例，检测错误表单。通过上传填写有误的文本表格图片，o1模型成功识别出了其中存在的计算错误，并提供了详细的修正建议。

此外，对于某些需要精确执行的任务，o1模型还可以借助内置函数库与后台服务器通信，获取最新税率等信息，确保最终结果的准确性和时效性。

实时API增强、支持WebRTC，极大简化开发流程

WebRTC是一种为互联网构建的实时通信技术，主要应用于会议和低延迟视频流传输等领域。OpenAI在实时API中支持WebRTC，使开发的AI应用能够自动处理互联网变化，例如，调整比特率和回声消除，为实时语音应用带来更好的性能和稳定性。

与之前的 Websockets 集成相比，WebRTC 支持显著简化了代码。使用 Websockets 时，开发者需要处理 200 - 250 行代码来解决反压等问题。而采用 WebRTC，仅需12行代码即可实现相同功能。

例如，在实时语音聊天应用中，WebRTC 的使用使开发者能够更快速地构建功能强大的应用程序，提高开发效率。

在演示环节中，通过简单的 HTML 代码创建对等连接，实现了音频流的发送和接收，展示了 WebRTC 支持下实时语音应用开发的便捷性。开发者只需关注应用逻辑，无需处理复杂的网络通信细节，大大降低了开发难度。

此外，为了进一步方便开发者集成实时 API，OpenAI推出了Python SDK支持，同时大幅度降低价格。

偏好微调

偏好微调与传统的监督式微调有很大的不同，采用成对样本比较学习的方式，使模型能够理解并适应特定应用场景中的细微差异。在实施偏好微调时，开发者首先需要准备一组包含两个不同版本回答的数据集，其中一个被认为是更优的选择。

然后，将这些数据送入模型进行训练，使其学会区分好坏答案之间的差异，并根据用户的反馈不断调整自己的行为准则。

偏好微调特别适合那些对回答格式、语气或者抽象特质（如友好度、创造力）有较高要求的应用场合。例如，在构建金融咨询聊天机器人时，开发团队不仅希望模型能够提供专业且准确的财务建议，还期望它能保持友好和易于理解的沟通方式。

此时就可以利用偏好微调方法，向模型展示多种不同的对话示例，直至找到最理想的表达方式为止。这种方法确实能够显著改善模型的表现，尤其是在涉及主观评价的任务上，客户服务或个性化推荐系统。

另外，偏好微调不仅仅局限于文本生成任务，同样适用于其他类型的输出，如图像生成、代码补全等。通过对大量样例的学习，模型可以逐渐形成一套稳定的行为模式，以更好地满足用户需求。更重要的是，这种微调方式允许持续迭代和改进，随着更多高质量数据的积累，模型的表现也会随之提高。

目前，这些API已经普遍可用，更详细内容可以去OpenAI开发论坛查看。

本文素材来源OpenAI，如有侵权请联系删除

END

AIGC开放社区

专注AIGC领域的专业社区，关注微软OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

最新文章

所有用户无限用Sora，OpenAI放圣诞福利！

极限压缩380倍！比OpenAI的Whisper更高效，开源模型超2000颗星

OpenAI 12天直播大盘点！o3、Sora，一次看完所有新技术

AI工具 | AI商品图工具合集

多模态解锁无限可能！AIGC多模态技术与应用峰会火热报名中~

函子科技CEO蒋耀锴，将出席“ISIG-AIGC多模态技术与应用峰会”

OpenAI甩王炸！发布新模型o3，一夜再次改变世界！

AI——有自由意志会怎样？

AI大模型/AIGC多模态/RPA超级自动化/低代码四大科技峰会来袭！

集思科技销售VP陈曙光，将出席“ISIG-AIGC多模态技术与应用峰会”

讯飞机器人超脑平台总经理刘可为，将出席“ISIG-AI大模型技术与应用发展峰会”

谷歌版o1模型发布：霸榜排名第一，深度展示思维链

ChatGPT重磅功能！支持AI Agent玩法，OpenAI加入智能体了

苹果正与腾讯、字节跳动洽谈，在iPhone集成类ChatGPT

多模态解锁无限可能！AIGC多模态技术与应用峰会火热报名中~

聚力维度创始人&CEO赵天奇，将出席“ISIG-AIGC多模态技术与应用峰会”

AI核心技术，颠覆传统数据整合模式！全球数据管理领导者Denodo技术干货分享来啦~

微软全球黑带技术专家武帅，将出席“ISIG-AI大模型技术与应用发展峰会”

OpenAI整大活！ChatGPT新增电话功能，全民AGI要来了

开个AI局，探索大模型的无限可能！AI大模型技术与应用发展峰会火热报名中~

重磅来袭！HealthAI 2024健康智能挑战赛启动报名

英伟达发布微型大模型计算机，每秒计算67万亿次

达观数据联合创始人张健，将出席“ISIG-AI大模型技术与应用发展峰会”

壹沓科技大模型产品总监王琰元，将出席“ISIG-AI大模型技术与应用发展峰会”

重磅！OpenAI开放满血o1模型API，成本暴降60%

开启智能之旅！RPA超级自动化与流程挖掘峰会火热报名中~

Liquid AI获2.5亿美元融资，创新液态大模型

ChatGPT搜索大更新！实时搜索、高级语音，AI搜索时代来了

AI工具 | AI内容检测合集

AI加速，码力全开！低代码/零代码技术与应用发展峰会火热报名中~

超过Sora！谷歌发布Veo 2，支持4K、逼真到难以分辨

开个AI局，探索大模型的无限可能！AI大模型技术与应用发展峰会火热报名中~

多模态解锁无限可能！AIGC多模态技术与应用峰会火热报名中~

微软发布Phi-4，最强小模型！参数极小、超GPT-4o

IBM推出化学大模型：可精准预测分子性质和行为

突破性功能！OpenAI发布ChatGPT Projects，万能工具箱上线！

AI核心技术，颠覆传统数据整合模式！全球数据管理领导者Denodo技术干货分享来啦~

微软 Azure AI 荣耀登榜，2024最受开发者欢迎的 AI 应用开发平台！

极客说｜深度对比：SFT、ReFT、RHLF、RLAIF、DPO、PPO

AI现身2024国际象棋世界冠军赛！世界棋王丁立人守擂，看AI如何让国际象棋更有趣

重磅！ChatGPT解锁高级视频对话、屏幕共享，实时交互时代

ISIG年度盛会来袭！RPA/低代码/AI大模型/AIGC多模态四大科技峰会共掀数字化创新浪潮

AI Agent成主打！谷歌发布超强多模态大模型—Gemini 2.0

极客说｜多智能体时代

王者降临！苹果全家桶接入ChatGPT，重塑iPhone、iPad 、Siri

多模态解锁无限可能！AIGC多模态技术与应用峰会报名开启~

人人可用，AI Copilot 场景学习资料大放送！

史上最贵！首个AI Agent程序员商业化，比ChatGPT Pro贵2倍

突发！OpenAI发布Canvas，ChatGPT新增史诗级功能

AI应用 | 可口可乐AI广告惹争议

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉