奥运奖牌可以被预测么?来看机器学习的视角!

学术   2024-08-05 12:14   法国  

这是一篇发表在2024年上海体育大学学报的研究论文。岳子做CFD、也做机器学习,这篇文章岳子感觉挺有意思,时值奥运,分享给大家。


奥运奖牌可以被预测么?

石慧敏,章东迎,章永辉

比赛结果的不确定性是竞技体育的魅力之一。然而,一些代表队在某些特定项目上的强大实力保证了其较高的获胜概率,从而使这些项目的胜负具有较高的可预测性。

例如,在乒乓球男子团体项目上我国连续10次获得世界杯赛冠军,展现了我国在乒乓球项目上的强大实力。不同体育竞赛项目的表现在多大程度上可以被预测?

作者们基于之前历届夏季奥运会的分项目成绩大数据,利用机器学习的随机森林模型预测各奥运代表队在各分项目上的表现,在此基础上比较不同奥运会项目表现可预测性的差异。

对奖牌而言,可预测性最强的是乒乓球、羽毛球和游泳,而最弱的是水球、现代五项和排球。

基于可解释机器学习方法挖掘社会经济因素对奥运奖牌的影响发现:

  • 对同一个项目而言,女子项目的可预测准确性普遍高于男子项目;

  • 代表队所在地区的人口规模、人均GDP、是否为主办国等因素对奖牌总数具有一定影响;

  • 在特定项目上,代表队的传统优势(如中国的乒乓球、美国的田径等)对奖牌预测具有较大影响。

随着大数据收集和存储技术的不断进步以及机器学习新算法的涌现,人工智能技术作为专家决策的辅助手段之一,被越来越多地用于体育成绩的预测和竞技体育政策的制定。与传统的计量回归方法相比,机器学习方法具有更强的适应性和灵活性,能够更好地处理大量复杂数据,尤其善于分析数据中的非线性关系和高维问题。

本文发现:

  • 虽然都是基于相同时间尺度数据训练的模型,奥运会各项目的可预测性具有显著差异。对奖牌总数而言,可预测性最高的前十名项目分别是乒乓球、羽毛球、游泳、跳水、马术、击剑、柔道、自行车、摔跤和帆船。

  • 在总体上,一个代表队所在国家或地区的人口越多、人均GDP越高、是该届奥运会的主办国,其获得的奖牌越多。

  • 在特定项目上,若某国或地区具有潜在传统优势,那么该国家或地区的哑变量对该项目奖牌的预测贡献较大。

  • 对项目金牌而言,随机森林模型对女子项目的预测准确性普遍高于男子项目。

  • 经济发展水平不同的代表队,在奥运项目的选择上也存在差异。例如,自行车、马术、现代五项的参与代表队基本为发达经济体,而举重的参与代表队基本为发展中经济体。




本文对国家奥运争光战略和全民健身战略实施的政策意义:

  • 作为一个快速发展的国家,我国应根据经济发展水平调整竞技体育发展战略。

  • 在重点项目上加大投入,促进我国竞技体育的可持续发展。不应只关注金牌、奖牌的数量,而应对那些全球关注度高、参与度高、商业价值高、竞争激烈的项目加大投入。根据经济发展水平,以前瞻性的眼光加大重点项目的人才培养。

  • 我国各个地区发展水平存在较大的差异,应制定差异化竞争的体育发展战略。如在东部沿海地区已有部分城市人均GDP接近发达经济体的水平,在这些区域应优先发展对经济水平依赖度较高的项目。

  • 本文量化了我国各项目代表队的传统优势,该结果有助于制定竞技体育规划,例如选择垄断程度较低的项目作为我国体育发展的突破口。

  • 全民健身是奥运争光的基础,我国是人口大国,全民参与为竞技体育的人才选拔提供了人口基数。我国应加大对重点项目全民参与的宣传和投入,如在足球、篮球等项目上加大对青少年的投入。



文末大家不要跑题,CFD界主要关注CFD,数驱CFD在CFD界作为CFD的一个分支存在。CFD界的关注的机器学习不是图像识别语音翻译玩游戏之类,这一类的CFD界不关注。

CFD界
更多的原创CFD开脑洞算法
 最新文章