OpenAI又在颠覆世界，最新模型o1，IOI金牌水平！

文摘 2024-09-14 17:38 上海

今天凌晨，OpenAI无预警推出了新一代o1系列模型，开创了人工智能通用复杂推理的新纪元。相比GPT-4o，o1系列在博士水平的物理问题上表现飞跃式提升，GPT-4o还是“不及格”59.5分，o1一跃来到“优秀档”，直接干到92.8分！

没错，OpenAI 传说中的“草莓”（Strawberry），终于与大家见面了！

这次ChatGPT发布包括两个版本：

o1-preview，这是一个深度思考优化模型，

o1-mini，主要面向开发者的更具成本效益的模型。

图源：网络

像人一样思考，o1创多项AI历史记录

除了名字不一样，功能、推理、性能等方面与之前泄漏的内容基本一致，o1的推理模式很特殊，在回答用户问题之前会进入拟人化思考模式，将问题分解成更小的步骤逐一解决，生成一个较长的内部思维链，回答的内容也更加准确。CEO奥特曼将其称作“一种新范式的开始”。

图源：网络

编程、数学、化学、生物、英语、法律、经济……o1在各大领域无一不精,真是全能型选手。

这得益于它采用的全新范式——通用复杂推理。通过强化学习训练,o1具备了惊人的链式思维能力。

面对一个复杂问题,o1会像人类一样,先复述要求理清思路,然后将大目标拆解为几个小步骤,再逐一攻克。思考得越久,成果就越惊艳。这一招,在推理类任务上的威力惊人。相比GPT-4o,o1的表现可以说是全面碾压。在2024年信息学奥赛(IOI)中，o1微调版的表现力压群雄，甚至在特定条件下超越了金牌选手的成绩。而在其他挑战性竞赛中，如美国数学奥林匹克(AIME)和Codeforces编程竞赛，o1系列同样表现卓越，超越大部分人类选手。

图源：网络

无论是在数据分析、数学、编码等推理密集型任务中，o1系列都明显优于此前的GPT-4o。尽管在某些自然语言处理任务上o1表现未必是最优选择，但它在推动AI在推理能力上的边界扩展方面无疑取得了历史性进展。

图源：网络

AI不再只是聊天机器人

o1的出现,意味着AI不再只是聊天机器人,它们有了更高的使命。

图源：网络

此次，OpenAI推出的“草莓”模型o1，被誉为开启AGI（通用人工智能）时代的关键一步。这一模型以其独特的创新架构和卓越的推理能力，展现了前所未有的智能水平，能够快速适应各种复杂任务，为解决现实世界中的棘手问题提供了全新思路！

“我们通往AGI的道路上，已经没有任何阻碍。”

在这个AI技术飞速发展的时代，每一天都充满新的惊喜和可能性。IvyMaker一直站在科创教育的前沿，帮助学生更深入地理解人工智能的未来，掌握最前沿的技术。

立即加入IK的ChatGPT课程，帮助您在通向AGI的道路上领先一步！

想要了解更多项目信息

扫码报名

咨询老师

关于我们

IvyMaker是哈佛和MIT科技企业高管背景校友创立，全方位支持STEM、科技艺术和商科类活动的深度和资质，以技术实力从小学一直带到高中、直到打全国和世界最高规格的科创比赛和商赛，各阶段无缝连接，为同学们打造最前线的国际化科技与商科社区，不断提高兴趣特长方向上的专业优势，以“能带出在专业社区有高影响力的项目”和“能打比赛”、“能出名校”的硬核成绩出名。

IvyMaker is a crew of professional scientists, geeks, hackers, makers, designers, business professionals, and kids-at-heart! With collective passion for inspiring the youth to excel in their creativity via in-depth tech and business understanding, fueled by our curiosity and enthusiasm for the young technovators. We are also many major stem and business competitions' best performance record keeper in China Region.

2024 年度竞赛月历

IK 2024秋季项目启动 ↓

常青藤国际创客

以全球顶尖科技和教学资源，以最开阔的眼界和最优质的内容，倡导开创精神、分享创客技能、激发创新思维、促成跨界合作，支持有创造力天赋的青少年成长为国际一流创客——共创美好未来！

最新文章

竞赛介绍 | BBO 英国生物奥林匹克竞赛

竞赛介绍 | BIO-USACN 美国生物奥林匹克竞赛（原USABO)

竞赛介绍 | UKChO 英国化学竞赛

竞赛介绍 | PUPC 普林斯顿物理竞赛

2025 SKT-CBPA国际竞赛最新赛季时间线有新变化！

竞赛介绍 | IPC&SPC 英国中高级物理思维挑战赛

竞赛介绍 | JPC 英国初级物理思维挑战赛

竞赛介绍 | BPhO 英国中学物理奥林匹克竞赛

竞赛介绍 | 物理碗 Physics Bowl

竞赛介绍 | 世界机器人大赛工程设计挑战赛（原APO）

竞赛介绍 | 澳洲AMC数学竞赛

竞赛介绍 | 蓝桥杯大赛青少组

竞赛介绍 | Kaggle 人工智能竞赛

CTB 报名倒计时‼️ 最后报名机会来啦，内附CTB组队课题

CTB 报名倒计时 13 天！最后报名机会来啦，内附CTB组队课题

竞赛介绍 | HiMCM 数学建模竞赛

竞赛介绍 | AMC 数学竞赛系列

从11月开始备考，可以参加哪些国际竞赛/活动？

福布斯中国Z世代创业项目评比早鸟票倒计时！

竞赛介绍 | 袋鼠数学

竞赛介绍 | FLL机器人挑战赛

竞赛介绍 | Robotex 世界机器人大会

真诚、热爱、探索、创新——美本理工申请“新策略”

喜报 | 2024-25 ASDAN 上海区域挑战成功晋级！

又是AI？历史性时刻，2024 诺贝尔颁奖给了人工智能！

国庆喜报 | Robotex 亚洲总决赛，喜提一等奖！

活动 | “2025年度福布斯中国Z世代创业项目评比”正式启动报名！

IvyMaker 2024 冬季项目启动！

中国队抵达！2024 WRO意大利国际邀请赛盛大启幕！预祝IKer赛出最佳状态！

OpenAI又在颠覆世界，最新模型o1，IOI金牌水平！

【外籍生专属】科创天花板 ISEF 预选赛来啦！

神仙打架！华为VS苹果两大消费电子巨头的人工智能对决

竞赛详解 | OUCC 牛津大学计算挑战赛

喜报 |FTC本季最高分卫冕！FRC第三，唯一单场4RP满分！

竞赛详解 | ACSL 美国计算机科学思维测评

科创集大成: 《黑神话：悟空》

喜报 |2024 ACSL包揽金银铜，拿下冠亚季！

竞赛详解 | USACO 美国计算机奥林匹克竞赛

IKer 奥运梦 | 与其羡慕别人逆风翻盘，不如趁暑假弯道超越

IKer 奥运梦 | 女孩，做不被定义的自己

IKer 奥运梦 | CTB运动康复助力金牌梦

IKer 奥运梦 | 以梦为马，而胜利属于善于规划的人！

当科技遇上体育 | 盘点巴黎奥运会的智能AI吧！

IKer 奥运梦 | 科技+游泳=智能游泳镜

IKer 奥运梦 | 科技+网球=捡球机器人

IvyMaker 2024 秋季项目启动！

竞赛详解 | ASDAN 阿斯丹模拟商业挑战

竞赛详解 | WGHS 沃顿全球高中生投资比赛

竞赛详解 | FBLA 未来商业领袖挑战

喜报 | 2024 FTC广州季后赛我们再夺最高奖！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉