OpenAI又在颠覆世界,最新模型o1,IOI金牌水平!

文摘   2024-09-14 17:38   上海  

今天凌晨,OpenAI无预警推出了新一代o1系列模型,开创了人工智能通用复杂推理的新纪元。相比GPT-4o,o1系列在博士水平的物理问题上表现飞跃式提升,GPT-4o还是“不及格”59.5分,o1一跃来到“优秀档”,直接干到92.8分


没错,OpenAI 传说中的草莓”(Strawberry,终于与大家见面了!


这次ChatGPT发布包括两个版本:

o1-preview,这是一个深度思考优化模型,

o1-mini,主要面向开发者的更具成本效益的模型。


图源:网络


像人一样思考,o1创多项AI历史记录
除了名字不一样,功能、推理、性能等方面与之前泄漏的内容基本一致,o1的推理模式很特殊,在回答用户问题之前会进入拟人化思考模式,将问题分解成更小的步骤逐一解决,生成一个较长的内部思维链,回答的内容也更加准确。CEO奥特曼将其称作“一种新范式的开始”。
图源:网络

编程、数学、化学、生物、英语、法律、经济……o1在各大领域无一不精,真是全能型选手。
这得益于它采用的全新范式——通用复杂推理。通过强化学习训练,o1具备了惊人的链式思维能力。


面对一个复杂问题,o1会像人类一样,先复述要求理清思路,然后将大目标拆解为几个小步骤,再逐一攻克。思考得越久,成果就越惊艳。这一招,在推理类任务上的威力惊人。相比GPT-4o,o1的表现可以说是全面碾压。在2024年信息学奥赛(IOI)中,o1微调版的表现力压群雄,甚至在特定条件下超越了金牌选手的成绩。而在其他挑战性竞赛中,如美国数学奥林匹克(AIME)和Codeforces编程竞赛,o1系列同样表现卓越,超越大部分人类选手。

图源:网络


无论是在数据分析、数学、编码等推理密集型任务中,o1系列都明显优于此前的GPT-4o。尽管在某些自然语言处理任务上o1表现未必是最优选择,但它在推动AI在推理能力上的边界扩展方面无疑取得了历史性进展。

图源:网络



AI不再只是聊天机器人

o1的出现,意味着AI不再只是聊天机器人,它们有了更高的使命。

图源:网络

此次,OpenAI推出的“草莓”模型o1,被誉为开启AGI(通用人工智能)时代的关键一步。这一模型以其独特的创新架构和卓越的推理能力,展现了前所未有的智能水平,能够快速适应各种复杂任务,为解决现实世界中的棘手问题提供了全新思路!


“我们通往AGI的道路上,已经没有任何阻碍。”


在这个AI技术飞速发展的时代,每一天都充满新的惊喜和可能性。IvyMaker一直站在科创教育的前沿,帮助学生更深入地理解人工智能的未来,掌握最前沿的技术。


立即加入IK的ChatGPT课程,帮助您在通向AGI的道路上领先一步!



想要了解更多项目信息

扫码报名
咨询老师



关于我们

IvyMaker是哈佛和MIT科技企业高管背景校友创立,全方位支持STEM、科技艺术和商科类活动的深度和资质,以技术实力从小学一直带到高中、直到打全国和世界最高规格的科创比赛和商赛,各阶段无缝连接,为同学们打造最前线的国际化科技与商科社区,不断提高兴趣特长方向上的专业优势,以“能带出在专业社区有高影响力的项目”和“能打比赛”、“能出名校”的硬核成绩出名。
IvyMaker is a crew of professional scientists, geeks, hackers, makers, designers, business professionals, and kids-at-heart! With collective passion for inspiring the youth to excel in their creativity via in-depth tech and business understanding, fueled by our curiosity and enthusiasm for the young technovators.  We are also many major stem and business competitions' best performance record keeper in China Region.


2024 年度竞赛月历




IK 2024秋季项目启动 ↓

常青藤国际创客
以全球顶尖科技和教学资源,以最开阔的眼界和最优质的内容,倡导开创精神、分享创客技能、激发创新思维、促成跨界合作,支持有创造力天赋的青少年成长为国际一流创客——共创美好未来!
 最新文章