人工智能彻底解决数学问题?千万美金比赛正在进行 ,中国娃领先!

文摘   2024-11-19 09:50   北京  

赛事说明   千万美元奖金:让人工智能彻底解决数学问题


AI 数学奥林匹克 (AIMO) 奖是一项 1000 万美元的基金,旨在促进能够与国际数学奥林匹克 (IMO) 的顶级人类参与者一样执行的 AI 模型的开放开发。

大模型已经能写作文,那大模型能否解数学题目呢?


本次比赛的目标是创建可以解决以 LaTeX 格式编写的棘手数学问题的算法和模型。您的参与将有助于提高 AI 模型的数学推理技能并推动前沿知识的发展。

题目说明

赛事说明

注:这是第二届 AIMO 进步奖竞赛。它建立在第一届 AIMO 进步奖竞赛的基础上,该竞赛于 2024 年 7 月由 Project Numina 获胜。第二届比赛的奖池增加了,问题数据集新,参与者的计算量增加,并更新了使用开源 LLM 的规则。

数学推理能力是 AI 的一个重要里程碑。数学推理是解决许多复杂问题的基础,从工程奇迹到复杂的财务模型。然而,目前的 AI 能力在这一领域是有限的。

AI 数学奥林匹克 (AIMO) 奖是一项 1000 万美元的基金,旨在促进能够与国际数学奥林匹克 (IMO) 的顶级人类参与者一样执行的 AI 模型的开放开发。

第二届 AIMO 进步奖竞赛有 110 道代数、组合学、几何和数论方面的数学题。从第一场比赛开始,难度有所增加,现在问题大约在全国奥林匹克水平上。就所需的数学推理而言,这些问题也被设计为“AI 困难”,这已针对当前开放式 LLM 的功能进行了测试。

为了应对列车测试泄漏的挑战,该竞赛使用了由国际问题解决团队创建的新型数学问题。使用这种透明和公平的评估框架,比赛将有助于加强评估 AI 模型数学推理技能的基准,而不会有受到训练数据污染的风险。最新的 AIMO 进步奖竞赛提供了一个令人兴奋的机会,可以推动 AI for Math 领域的创新,同时也促进良性竞争并支持开放科学。

加入我们,努力迈向一个准确、可靠地评估 AI 模型的数学推理技能的未来,从而推动进步和创新。


关于主办方

XTX Markets 是一家领先的算法交易公司,在伦敦、巴黎、纽约、孟买、埃里温和新加坡拥有 200 多名员工。XTX 在股票、外汇、固定收益和大宗商品市场提供流动性,每天跨市场的交易量超过 2500 亿美元。

XTX Markets 庞大的研究集群包含 100000 个内核和 20000 个 A/V100 GPU,并且还在不断增长。它还具有 390 PB 的可用存储和 7.5 PB 的 RAM。除了丰富的数据集和先进的技术基础设施外,我们还处于金融和技术交叉的前沿。

XTX Markets 的慈善事业专注于数学和科学教育与研究,以及其他领域,例如学术庇护所、碳去除和员工匹配计划。自 2017 年以来,XTX Markets 已向慈善机构和公益事业捐赠了超过 100 百万英镑,使其成为英国和全球的主要捐助者。


总奖金1000万美金


进步基金总奖金 2 名:2,117,152 美元

本次比赛第一名的团队奖品:

第一名:262,144 美元

第二名:131,072 美元 第三名:65,536 美元 第四名:32,768 美元 第五名:16,384 美元

总进步奖获得者: 总进步奖获得者应在公共和私人测试集中获得至少 47/50 的分数,排名最高。在颁发了五个排名靠前的团队的任何奖品后,总资金的剩余部分将颁发给总进步奖获得者。

如果一个团队在本次比赛中被评为总进步奖得主,奖金将至少为 1,589,248 美元。如果本次比赛没有团队被提名为总进步奖获得者,则总资金的剩余部分将结转到下一场比赛,届时将适用相同的奖品分配。

早期分享奖:20,000 美元。在比赛初期分享高分公共笔记本将获得额外的 20,000 美元现金奖励,以鼓励参与者尽早分享信息并帮助社区在比赛过程中取得更多进展。


目前已经有很多人提交


2024 年 10 月 17 日 - 开始日期。2025 年 3 月 25 日 - 报名截止日期。您必须在此日期之前接受比赛规则才能参加比赛。2025 年 3 月 25 日 - 团队合并截止日期。这是参与者可以加入或合并团队的最后一天。2025 年 4 月 1 日 - 最终提交截止日期。

已经有很多人提交,目前人气最高的就是中国娃


另外,qianwen  应该是阿里的千问大模型 比较流行


招募队员中……

更多赛事说明

http://www.gitpp.com/pkuteam/ai-mathematical-olympiad


点击 阅读原文 查看更多赛事说明

剑桥评论
剑桥大学评论 全球高端视野
 最新文章