做题家还在刷题?AI秒了

学术   教育   2024-09-13 17:28   上海  

OpenAI最近推出了o1模型,这是一款具有突破性的大型语言模型。o1模型在复杂推理任务上表现出色,能够解决比以往模型更难的问题。

它通过强化学习训练,实现了真正的通用推理能力。在多项基准测试中,o1模型展现了超越人类专家的潜力,尤其在数学和科学领域。

在2024年的AIME考试(数学竞赛)中,GPT-4o模型仅能平均解决12%的问题(即1.8/15),而o1模型的表现则显著提升。在仅有一个样本的情况下,o1模型平均正确率达到了74%(11.1/15);当在64个样本中达成一致时,正确率提升至83%(12.5/15);若使用学习得到的评分函数对1000个样本进行重新排序,正确率更是高达93%(13.9/15)。


这样的成绩足以让o1模型进入全美前500名,并且超过了美国数学奥林匹克竞赛的分数线。


另外,LeetCode刷题更是……


程序员的未来在何方?现在AI的发展已经可以达到86%的成功率了,而这仅仅是个开始……

-----------------------------------

点击下方关注公众号,在后台回复

回复 “”,b站课件、数模资料在群文件

回复“课程”,查看入门级数学建模精品课程(常用模型的原理讲解+例题+matlab编程,附带课件与代码)

数学建模BOOM
北海与你分享数学建模知识和经验
 最新文章