如何才能在UTMB站台?基于历史数据分析UTMB

文摘   2024-08-22 10:01   中国香港  
原作者:Ruby Wyles
编译:小V

UTMB ,作为目前全球越野跑赛事中最盛大,也是竞争最激烈的比赛之一,正在获得越来越多的关注。其过往10年+的历史数据,为我们更进一步展现了其迷人之处。马歇尔·伯克博士利用过去比赛当日的结果和分段数据完成了回归分析,提到了4点我们在今年的比赛中可以运用的配速诀窍以及比赛预测。


(文章发表于2023年8月21日,但部分分析结果同样适用于今年的UTMB)


在今年的西部一百开赛之前,斯坦福大学地球系统科学系的副教授,马歇尔·伯克博士使用了历史数据来预测比赛用时。他的预测结果之精准以至于我不知道我们究竟该尊敬他为上帝还是巫师。

马歇尔对男子冠军的预测时间误差只有1.6%, 而对女子冠军的预测误差更是低于1%。更令人惊讶的是,他预测的男子第十名时间仅差不到2%,而女子第十的时间则仅差2.5%。

总体而言,他的预测在每个类别中的误差都在30分钟以内,这着实令人惊叹,尤其是考虑不同的天气可以对西部一百完赛时间有巨大的影响,而结果也会随时间波动。我不是说我们应该把他当作巫师抓起来烧死,但或者我们可以去亚马逊上看看有没有打折的木桩(还是要烧死他……)。

而现在,马歇尔为了UTMB又回来了,我把他从退休生活里拽过来完成这最后一项任务。在他的学术工作中,他正在帮助世界应对气候变化的影响,所以这感觉有点像让超人帮忙打开泡菜罐。但这是UTMB周,我们对那些酸辣的统计数据泡菜充满了期待!

 
马歇尔的任务,如果他选择接受的话, 将是为我们提供有助于2023年参加 UTMB 比赛的跑者们的数据,同时也将为这项赛事的粉丝们带来一些很酷的看点。那他将获得什么呢?被大家奉为巫师?这游戏看起来很公平。

这是一个有趣的项目,而不是为了同行评审,因此这些预测数字可能并不那么准确。但如果出了什么问题,请放心,它只在这个特定的宇宙中是错误的,而在多元宇宙的某些部分,我们一定是对的。

好了,言归正传,是时候根据历史数据来总结 UTMB 的 4 条要点了。如果你真的非常喜欢图表,那么现在是时候开始了。

01

高水平的竞争正在白热化

随着比赛的竞争越来越激烈,你会期望运动员之间的差距随着时间的推移而缩小。这正是我们所看到的。我们假设比赛其他状况是相对稳定的。第一张图显示了自 2008 年以来男子和女子完赛时间的降低情况。

2010 年和 2012 年由于赛道发生了巨大的改变,我们将其从数据中剔除。其他几年(例如 2017 年)的赛道也稍短一些。

对于男子来说,简单的线性关系表明,自 Kilian 2008 年首次获胜以来,男子冠军的完赛时间仅略有下降,但自此之后,第五名和第十名的完赛时间每年都减少了约 12 分钟。

女性跑者这边,获胜时间同样只是略有减少(被罗里·博西奥 (Rory Bosio) 在 2013 年和 2014 年的一些令人难以置信的快速表现所影响)。但第五名和第十名正在大幅进步,每年分别提高大约30与40分钟。

到临近比赛的最后阶段,运动员在训练中犯错的余地会更小。每年,都有越来越多的运动员在自己的日历上贴上 18 个独角兽贴纸,标志着比赛日将会像独角兽的角一样锋利。(人们很少谈论独角兽为什么有角,但这显然是为了杀死或伤害他们的敌人。)

要点:随着这项运动不断地职业化,以及UTMB赛事的逐步出圈,精英跑者们需要做足准备,才有机会跻身前十名。

02

比赛的前半程是为后半程而准备;比赛的后半程才是真正的荣誉之争

马歇尔接下来发了两张我见过的最酷的图。这些数据显示了 在2021 年,最终进入总成绩前 50 名的男性跑者在每个重要补给站的出站排名,这表明了运动员在离开80km处的库马约尔(Courmayeur)时仍可以进步很大,但在 126 公里处经过尚佩湖(Champex-Lac)时,上升空间就要小得多(此处是补给站图表)。

第一张图中的灰线显示了最初进入前 50 名但最终掉出的运动员。

每一行都讲述了胜利和失败的故事。在50km处(Les Chapieux),运动员们还是可以在落后的情况下取得出色的成绩,这从前 50 名运动员在每个补给站的排名中可以看出相关性。
鉴于数据集不是随机样本,并且完赛排名应该与比赛中的排名密切相关,我们原本以为这个相关性会非常强。但在 50 公里处,相关性仅为 0.66,这显然不算高,这表明保守的配速可以带来相当大的回报。即使在 80k 时,相关性也仅为 0.7 左右。

女性跑者的完赛时间也反映了类似的故事。我很想知道西部一百等其他重要赛事是否也有相同的图表,看看相关性是否更高。但我的猜测是,与大多数比赛相比,UTMB 更能奖励上半场的耐心和信任。请记住:在尚佩湖(Champex-Lac)之前,奇迹是会发生的。

让我们用另一种方式来看看这些信息,因为我想把这张令人费解的有趣图表放在我未来儿子卧室的摇篮上方。这张图显示了顶尖选手在每个补给站的排名,这里使用的是 2008-2022 年以来所有比赛的数据。
从历史上看,有很多运动员在 50k 甚至 80k 处都没有进入前 10 名,但却以前5的成绩最终完赛。对于想要拿下前 10排名的跑者来说,前80k的距离中你不必执着于一定要跑进前20的排名,最终仍然可以拥有令人难以置信的成绩。真正的“权力转移”发生在库马约尔和尚佩湖之间(50k-80k)。

03

比赛的后半程才是关键



UTMB是一项如此残酷、艰难的比赛,不论是跑在前面的精英运动员,还是晃在后面的大众跑者,都会掉速。赢家还是输家?取决于一个简单的问题:谁能掉速最少?

下一张图表显示了从霞慕尼(Chamonix)到库马约尔(Courmayeur)(为便于标记,称为“前半程”,尽管不是 1:1 比较)以及从库马约尔(Courmayeur)到霞慕尼(Chamonix)的时间差异。顶尖跑者的掉速显然要少很多。

04

完赛时间正在变得越来越快,我们也在此做出一些预测


正如前面所讨论的,成绩正在迅速提高,特别是第五名和第十名的女性选手。我给马歇尔布置了一项艰巨的任务:仅使用公共数据库中可用的时间、距离和年份数据,推算出一个回归方程,来计算第一名、第五名和第十名所需的完赛时间。他走到他的飞天扫帚前,考虑了今年比赛距离的差异,给出了这张神奇的图表:


2022 Prediction (hours)

Finish place
Best estimate
Lower bound
Upper bound
Men
1st
20.2
19.1
21.2
5th
21.3
20.1
22.4
10th
22.4
21.6
23.3
Women
1st
24.2
22.1
26.2
5th
24.9
23
26.8
10th
26.4
24.6
28.3


考虑到样本量较小,右侧的下限和上限预测所示的置信区间比较宽(说人话:预测的时间跨度比较广,相对没有那么精确)。但不容置疑,他在数据完整性上简直是个巫师。

一个主要的复杂因素是天气——在高山上很难控制该变量,因此在回归中没有考虑它(与考虑了温度影响的西部一百比赛模型不同)。鉴于今年预计会下雨,时间可能会慢得多。

男子比赛预计将持续 20 多个小时,女子比赛预计将持续 24 多个小时。考特尼·道瓦尔特(Courtney Dauwalter )去年跑出了 22 分 30 秒,这表明就像她打断其他竞争对手的腿一样,打破了统计数据。男子方面,我们预计冠军的成绩将比2021年的冠军,庄主,弗朗索瓦·达哈内 (François D’Haene) 更快。

先慢后快的策略通常都得到回报。但这说起来容易做起来难。

预计男子和女子前 10 名的跑者都会非常快,明显领先于 2021 年的成绩。前 5 名也是如此。换句话说,该模型预测 2022 年将会是一场激烈的竞争,从头一直燃到终点霞慕尼。
出于我的偏见,我认为如果天气不是太糟糕的话,男子组的时间将会更接近上限(也即19.1小时)。我预计吉姆·沃姆斯利 (Jim Walmsley) 和K天王(Kilian Jornet)将在此赛道上破纪录,加上斯科蒂·霍克 (Scotty Hawker) 等曾经的站台选手将比以往任何时候都更加凶猛。

对于女性,我倾向于模型的中间值,因为大姐大(Courtney Dauwalter)是一位非常出色的跑者,今年不会出现在赛场。但或许下一个“大姐大”正在等待的就是这个机会。

就我个人而言,我希望模型的预测失败,而男子/女子赛道记录统统被打破。如果真的出现这样的结果,我不会感到惊讶。如果马歇尔将预测精确到百分之一以内,我也不会感到惊讶,因为他拥有大巫师的能力。
终点线

此文写于2023年UTMB赛前,最终在2023年的对决中,Jim Walmsley以19小时37分43秒,Courtney Dauwalter 以23小时29分14秒成绩夺冠,均在预测的区间范围内。成绩预测只是无聊的游戏而已,关键是得出预测结果背后的科学理论,值得我们一遍遍地细细研读,相信对每一个跑者都会有所启发。如果你想提高自身成绩,无论是大众跑者,或是精英跑者,相信此文都应反复通读,细细琢磨,每个人都会从中有所收获。

越野跑研究所
我们探索,挖掘,探究关于越野跑的一切
 最新文章