Kaggle赛题解析:第二届 AI数学奥赛挑战赛

学术   2024-10-18 17:33   北京  
  • 赛题名称:AI Mathematical Olympiad - Progress Prize 2
  • 赛题类型:通过大模型完成数学题目的解答
  • 赛题任务:大模型、自然语言处理

https://www.kaggle.com/competitions/ai-mathematical-olympiad-progress-prize-2

unsetunset赛题背景unsetunset

数学推理能力是AI的一个重要里程碑。数学推理是解决许多复杂问题的基础,从工程奇迹到复杂的金融模型。然而,当前AI在这一领域的能力有限。

AI数学奥林匹克(AIMO)奖是一个1000万美元的基金,旨在推动开放开发能够与国际数学奥林匹克(IMO)顶级人类选手表现相当的AI模型。

unsetunset赛题任务unsetunset

在第二届AIMO进步奖比赛中,参赛者的主要任务是开发算法和模型,以解决110道高难度的数学问题。这些问题涵盖了代数、组合数学、几何和数论四个领域,难度相当于国家级奥林匹克水平,并且特别设计为对现有AI技术具有挑战性。

unsetunset赛题数据集unsetunset

本次比赛的数据包含110道数学问题,风格与AIME(美国数学邀请赛)类似。

每个问题的答案是一个介于0到999之间的非负整数。您应通过将问题解决方案取模1000来得到这个数字。例如,如果您认为某个问题的解决方案是2034,您的预测答案应为34。

问题的难度大致相当于国家级奥林匹克水平,尽管有些问题稍简单,有些则稍难。

所有问题均为纯文本格式,数学符号使用LaTeX表示。请参阅“概述”部分中的“语言和符号说明”了解使用的符号约定详情。尽管有些问题可能涉及几何,但任何问题中都不使用图表。

  • 公开测试集:包含50道问题。
  • 私有测试集:包含另外50道不同的问题。
  • 参考数据:提供10道问题作为参考,称为“参考数据”。以下提供了包含这些参考问题完整解决方案的PDF文件。

unsetunset评价指标unsetunset

提交的内容将根据其预测标签与真实标签之间的准确性进行评估。换句话说,提交的内容将按照预测标签与真实标签完全匹配的比例进行排名。

在本比赛中,每个真实标签都是介于0到999(含)之间的整数。

您应通过将问题解决方案取模1000来得到这个数字。例如,如果您认为某个问题的解决方案是65521,则应报告为521;-900应报告为100。明确地说,对于大于1000的正整数,这意味着:报告最后三位数字,丢弃任何前导零。因此,1009应报告为9。

unsetunset赛题时间轴unsetunset

  • 2024年10月17日 - 比赛开始日期。
  • 2025年3月25日 - 报名截止日期。您必须在此日期之前接受比赛规则才能参赛。
  • 2025年3月25日 - 团队合并截止日期。这是参与者可以加入或合并团队的最后一天。
  • 2025年4月1日 - 最终提交截止日期。
快来一起参加Kaggle比赛吧
添加👇微信拉你进群

Coggle数据科学
Coggle全称Communication For Kaggle,专注数据科学领域竞赛相关资讯分享。
 最新文章