体能听书计划《NSCA-CPSS 运动科学》第二十一章

文摘   2024-07-08 17:03   北京  


        (滑动30秒跳过开头。为了播放流畅,文章经过提炼和润色。如需精读原文请从正规渠道购买正版书籍。

        听书是我生活的一部分,但各大平台缺少体能专业相关书籍的播放资源。于是我将利用公众号的“听全文”功能,持续分享体能相关专业的书籍,希望大家可以利用零散时间了解体能知识。




第五部分 数据分析与交付

21 数据交付与报告

本章专注于向竞技体育的受众有效地传递数据信息。虽然该目标看起来可能很简单,但是向其他人传递有用信息的过程,值得像收集、整理以及分析数据那样,被给予大量的思考、关注并提供方法。交流是该过程的重要部分,在整个组织内进行有效交流的方法有很多种。该过程最为重要的方面之一是,定义某人正在尽力回答的问题或者某人正在尽力解决的难题。这不仅会为交流过程设立预期目标,还有助于定义以下内容。

内容1 所需要的数据。

内容2 完成分析所需要的时间。

内容3 可能需要考虑的其他变量。

内容4 应采用的方法,即统计方法、可视化形式以及需要什么背景。

为了有用,问题需要被定义清楚,因为宽泛的问题会导致模棱两可的答案。通过可视化形式和报告的方式传递数据信息的过程基本上都与交流有关。这种交流的质量和效果需要接收者的特征、递送者的能力以及信息的清晰性和精确性三者之间协调一致。主要的目标是,让信息完全按照预想的那样被理解。虽然设计可视化形式的人可能会有偏好和个人风格,但是重要的是要记住,对受众来说清晰易懂和有意义才是首要的。本章的目标是:鼓励科学训练师在设计数据的可视化形式时,以受众即接收者的角度思考重点;找出对于在竞技体育情境中利用数据可视化形式来与他人交流的科学训练师即递送者来说很有用的关键思考技巧和方式;并通过展示和解构与竞技体育相关的实际可视化数据即信息来将这些方式和技巧付诸实践。


1 心系受众的数据可视化设计

当人们想到个体及其所属的团体时,很容易根据个体所在团体的人员情况就对某个人解读可视化数据的能力妄下断论,即利用启发法快速地做出判断。然而,现实是竞技体育项目包括具有各种背景、经验和技巧的人。不可能所有的运动员或者教练员都需要协助才能理解数据可视化设计,或者说接受过科学培训的那些人不需要任何协助或支持就能理解数据可视化设计。因此,重要的是要努力去了解受众中的个体,然后调整方法去为他们提供支持。

良好设计的核心是只考虑设计所针对的用户以及他们会如何与设计互动。在本章中,用户是将要接收和审查数据可视化设计,并与之互动的受众。我们可以从通用的设计框架中得到灵感,根据该框架,设计是对所有年龄段和能力水平的人来说都可能具有最大用途的产品和环境设计。这意味着我们要了解受众,设计时要从他们的能力和特征出发,并且还要仔细考虑偏差、选择和潜在的盲点。通用的设计框架包括7项原则,它们反映了实体空间、产品和服务的通用设计的原始动机,如表21.1所示21.1展示了有关这些原则该如何理解,以及如何最好地加以修改以用于在表现型体育中交流数据信息的建议。

科学训练师的任务并不只是生成报告,还要利用科学来提升个体的运动表现。这适用于他们在提升教练员和其他人员的表现方面所做的工作,正如他们对运动员所做的支撑工作一样。科学训练师生成的每份报告、每份展示以及每份数据可视化设计都可能是一个施教和提升技能的机会。作为在准备数据可视化设计时要包含进去的部分,科学训练师还有机会考虑如何促进受众的学习,尤其是他们一直以来反复交流的受众。支持和提高某个受众的数据识读能力可以在接收信息的人与科学训练师之间创造更加深入交流的机会。反过来,通过寻求反馈,然后根据受众的经验调整自己的做法,这种交流会为科学训练师提供提升自己专业技术水平和能力的机会。科学训练师可以提出具体的问题来收集有用的反馈,以改善自己的数据可视化设计,并按照受众的需要去调整这些可视化设计。不要问模糊的问题,例如你觉得图表怎么样?最好问细节,例如你从图表中注意到了哪些关键信息?你是如何判断出这些信息的?


2 人类视觉感知的基础知识

到底是什么让数据的可视化成了如此有效的交流工具?人类通过进化已经拥有了一种能够根据自己所看到的内容迅速理解周围世界的工具。他们观察物体和表面以及它们的相对位置和运动,并在脑海中形成与这次观察的结果对应的图像久当人们利用视觉感知时,在意识到自己正在看着某物之前,会出现许多迅速、前注意的过程。通过理解前注意感知和视觉认知的基本知识,科学训练师便可以利用恰当的视觉特征,帮助受众快速准确地理解数据可视化设计中的关键信息。


小节2.1 前注意特征

前注意特征是终端用户首先会下意识关注的事情。这些视觉特征会在视觉接触的200毫秒内被处理完毕。合理地利用这些特征将使其成为工具箱中的有力工具,但是不合理的利用会使其误导受众。21.2描述了4种前注意特征,以及它们在可视化设计中的推荐用法。本章提供了不同视觉风格的案例。


小节2.2 格式塔原则

对于当代数据可视化设计的理解和应用来说,20世纪开展的心理学研究所得到的观测结果仍然很有价值。格式塔原则描述了人们是如何做出有关视觉信息的组织方式以及相互关联性的推断的(见表21.3。这些原则非常有用,可作为向视觉形式赋予意义的框架。例如,人们会觉得颜色相同的物体属于同一组。当用颜色区分不同球队运动员的数据时,科学训练师们便可以采用这一原则。

3 数据可视化的类型

有很多选项可以用于可视化数据,有些选项能够比其他选项更好地展示需要被展示的数据。然而,可视化设计和报告最重要的方面之一是联系终端用户。视觉设计应当让用户易于与数据和信息联系在一起。21.1展示了一些最常见的用于报告数据的图表类型,如下所述。

图表类型1 柱状图(见图21.1a。这种图表类型可能是最常见的,并且可以用于各种各样的数据类型。然而,柱状图最好用于展示累积量数据。将柱形条想象成装液体的杯子;当液体被倒进去时,杯子要么被部分装满,要么被完全装满。展示变量的计数和求和也适合使用柱状图。然而,当将柱状图用于展示试验组的平均值时要慎重,因为试验组的平均值代表的是一个值,不是累积量数据。

图表类型2 折线图(见图21.1b。这种图表类型也很常见,并且可以结合其他图表在不同的坐标轴上展示第三种变量,或者展示数据的滚动平均值。折线图通常用于展示时序数据,或感兴趣的某个具体变量随时间的变化情况。采用折线图时,丢失的数据需要加以处理;如果一天或者多天的重要数据丢失了,就必须考虑丢失数据点之间如何连线的问题。通过直接连线,人们可以推断出这些时间点之间存在线性关系,但这可能并不准确,因为数据丢失了。

图表类型3 点图(见图21.1c。点图是另一种经常用于展示时序数据的图表类型,但是它还能用于展示试验组成员之间测量结果上的变异。与前面提到的柱状图相比,所有试验组的点都能够被采用,在描述平均值时更适合采用点图,这会让用户理解数据的变异性。这确实很重要,因为测量值的平均值并不代表团队中的任何人,并且知道哪个运动员处于哪个位置还能提供额外的重要信息。

图表类型4 密度图(见图21.1d。密度图展示的是数据的分布情况,使用这类图表时需要多花一点时间才能完全理解其中的信息。在比较多天的训练效果、运动员或者其他无序变量时,它会极其有用。对于任何数字测量值来说,密度图可以快速地显示大部分数据落在哪个位置,以及被测试验组之间的重叠度。密度图还能用来计算某个值落在特定范围内的概率。这能够提供一些关于此类指标发生频率的相关信息。密度图应当只能用于样本数量多的情况,否则数据将会出现尖峰。

图表类型5 小提琴图(见图21.1e。小提琴图非常适合展示测量结果的范围和密度。小提琴图在给定点的宽度越宽,落在该区域的数据点就越多。这非常适合展示各个标准以及具体一天的训练在整个数据中的具体分布情况。小提琴图的密度还可以提供许多额外的信息。

图表类型6 箱形图(见图21.1f。箱形图与小提琴图类似,因为它们都能显示数据分布范围以及数据分布的中位线。然而,错误理解数据的密度或者大部分数据所处的位置会导致不准确的解读,尤其是当数据偏度较大的时候。

图表类型7 雷达图(见图21.1g。雷达图可能是最具争议的图表类型之一。对于雷达图,一个关键的考虑因素是数据的标度以及所有数据是否具有置于同一张图表上的恰当标度。一般来说,雷达图用来比较一个运动员或者多个运动员的若干项关键表现指标。它可能会反映出运动员比赛时的缺陷或者运动员应该做的事情。与大部分图表一样,它完全联系了终端用户,并且能让他们知道数据说明了什么以及没有说明什么。

图表类型8 热图(见图21.1h。热图的用法有两种,一种用法是比较一个团队的若干个表现指标,另一种用法是比较一个运动员在比赛期间将时间花在了哪些地方。21.1h展示的是前一种用法,并且专注于展示团队成员之间的对比。


4 数据不确定性的可视化

科学训练师力求传递与解决动机问题的见解有关的明确信息。理想的情况是,他们所传递的信息对于重要决策的做出很有用。在顶级竞技体育领域,现实情况是,许多决策将会对个人的愿望、日常工作、健康以及经营产生深远的影响。根据可视化数据做判断越来越多地被纳入顶级竞技体育的重大决策中,所以准确地展示数据至关重要。这样做时,科学训练师需要对所传递的信息中可能存在的各种不确定性进行审慎周详的考虑,例如由近似数据、来自统计模型的估计值、测量误差以及数据不完整所引起的不确定性。

在传递数据时,科学训练师需要清晰地传递数据所表达的内容,并且还要传递数据不表达的内容。科学诚信的原则必须支撑他们身为科学训练师所做的决策,包括他们在制作数据展示方案时所做的设计决策。与本章尤为相关的一个科学诚信的原则是诚实。鲁斯巴尔杰将这一原则描述为:科学家们在计划、执行、记录、解读和发表自己的工作成果时所秉承的一系列价值观,包括诚实、诚信、真实和客观等。为了践行这一原则,科学训练师有责任尽可能准确地展示他们所处理的数据,他们要坦诚地告知自己的测量仪器、方法、分析方法、模型和所传递的信息中存在的不确定性。重要的目标是要避免虚假地传递并不存在的精确性。通过传递信息并如实对待不确定性,科学训练师才能更好地服务于他们的交流对象。通过全面了解可获得的信息,他们可以做出基于可靠数据的决策,这些决策的置信程度与可获得的证据质量相匹配。

当数据可视化设计可以恰当展示不确定性时,挑战之一是,在认识不确定性的过程中,人们需要尽力去应对复杂性,而这有悖于人6两简洁或简易的偏好,尤其是当遇到需要经过一定程度思考与认知的任务时。后来,汉斯·罗斯林教授将其描述为单一视角本能:我们觉得简单的想法非常吸引人。我们享受领悟的瞬间,我们享受我们确实理解或者知道某件事的那种感觉。并且人们很容易陷入滑坡谬论,从一个引人入胜的简单想法,到这种想法完美地解释或者解决了许多其他问题。像这样的考虑会节省许多时间。你可以不用从头去了解一个问题就能得出观点和答案,并且你可以接着执行别的任务。但是如果你想理解世界的话,那么它其实并没有那么有用。

当在数据可视化设计中纳入不确定性时,科学训练师该如何克服这样的障碍呢?在某种程度上,这可能要求科学训练师与其他人员和决策者反复进行讨论,以达成有关不确定性为何重要的共识。因为当存在不确定性时,未能成功地考虑或者认识到它会导致误解和不准确的结论。

当决定如何在数据可视化设计中展示不确定性时,科学训练师还必须考虑决策或问题的性质以及做决策时的背景。对于快速做出的决策,不确定性的可视化可能会导致不想要的延迟或者让受众感到不知所措,所以科学训练师需要考虑精确性和易懂性之间的权衡。当有充足的时间做决策时,包含不确定性的数据可视化设计可能会被受众更好地接受,因为他们有更多的时间来解读不确定性,向科学训练师寻求指导和提问,以及考虑数据对于他们所做的判断意味着什么。在进行数据可视化设计时,科学训练师可以将展示不确定性作为自己图表的一个标准特征,随着时间的推移接收者会熟悉这种特征。此外,科学训练师还要培养可视化推理的技巧并降低在数据可视化设计中解读不确定性的认知负担。

下面是在数据展示中直观展示不确定性的方法。

方法1,绘制展示不确定性区域或者范围的区间:一个例子是箱须图,它利用中位数展示集中趋势,并利用四分位间距和四分位极限以外的上下区间展示不确定性。

方法2,绘制所有的数据点来展示数据的分布情况,而不是只根据单个概括性统计值绘制图表:例如,我们可以利用密度图或者直方图来展示数据分布情况,而不是只根据平均值绘制图表。

方法3,利用点的不透明度来表明确定度:不透明度较高代表确定度较高,不透明度较低代表确定度较低。

方法4,通过整合多种相关的信息源,展示出同一个问,题的多种表现形式:目的在于向受众传达,理解一个复杂的问题时需要考虑多个因素。


5 数据驱动的讲故事方式

利用讲故事的方式来传递数据信息已经引起了广泛的关注,因为它有可能通过在数据和想法、兴趣以及读者的生活之间产生一种有意义的联系来让人感到欣喜和意外,还能够激发创造力。利用数据创作和讲述引人入胜的故事需要一些与叙事结构以及吸引受众和表达意义的要素有关的基础知识。例如,弗赖塔格金字塔是一种著名的叙事弧线结构,它描述了组成叙事弧线的5个主要部分具体如下。

第一: 阐述。

第二: 上升阶段。

第三: 高潮或冲突。

第四: 下降阶段。

第五: 结局。

利用这种结构,克日温斯基和卡伊罗建议数据可视化设计可以通过片段的方式来表现出故事弧线,这样故事的各个部分得以展开,每个故事部分的内容和目的也会变得清晰,并且要忽略不会推动情节的细节"。虽然有关叙事性数据可视化设计的研究目前正处于初级阶段,但是李及其同事提出了可视化数据故事的如下定义,其目的在于聚焦与讲故事和数据可视化相关的研究范围:

可视化数据故事包括一系列的故事片段,即由数据支撑的具体事实。让大部分故事片段可视化的目的是支持一个或者更多预期的信息。可视化包括注解或者解说,以清楚地突出和强调该信息,并避免产生歧义。

为了支持作者的高级沟通目标,故事片段按照有意义的顺序或者它们之间的联系进行展示,从通过解释事实让观看者受到教育或者令他们感到愉悦,到通过发人深省的观点劝说或者劝服观看者。

正如那句格言所总结的,故事可以是强有力的,也可能被误用,永远不要让事实妨碍了一个好故事。当把讲故事的方法用于劝说时,科学工作者有可能会冒险采用断章取义的方法。他们可能会有意或者无意地为可视化数据选择一些事实,因为这正好适合某种特定的叙述,而会去忽略或者贬低其他与该叙述相抵触的相关事实。鉴于这种风险,当将讲故事的方法应用于数据可视化时,科学工作者应当坚守道德规范,这一点很重要。下面是在利用数据可视化设计讲述趣味十足、引人入胜的故事时,科学训练师用以在自己工作中保持正直和诚实的一些方法。

方法1 避免在考察和分析数据之前就确定叙述的内容。

方法2 提防可能需要通过验证性分析来支持一个已经做出的决策的情况。

方法3 接受同行的评议和批判。

方法4 让背后的数据及其分析变得透明、可使用和可复制。

方法5 当单一数据可能存在多种解读时,要在研究内容中承认和概述所有观点。

方法6 明确地识别出局限性以及未知或者开放的问题。为受众提供机会去探索数据、检验自己的想法以及追随自己的探究路线。

方法7 开展一种包容且动态的过程,在该过程中受众的见解和反馈都会被利用和纳入,以随着时间的推移不断地更新数据可视化设计。


6 竞技体育中的具体情境因素

常言道,情境决定一切。在竞技体育中,有许多具体的情境可以被添加到数据中。每天与运动员共事的教练员会在自己的具体情景中查看数据。类似地,运动表现和医疗人员也有独特的见解可以被添加到数据反映的信息中。提供数据可视化设计、分析和报告的目的应当是吸引这些用户,并提取出他们独特的情景知识,以添加到数据全况中。


小节6.1 交付数据见解的时机和格式

对于竞技体育情境中的大部分数据类型来说,从收集到解读的效率非常重要。数据分析需要多快、多精确才能做出基于可靠信息的决定?这是设计过程的一个重要部分:理解数据管道以及数据分析工作流程中的步骤是如何联系在一起的。当确定要集成到环境中的技术时,这些也是重点要考虑的,因为从每个系统中获取测量数据将有各自独特的流程,而这些流程必须与整个工作流程相契合。自动化的处理和报告会提高效率并减少潜在的用户错误。限制所有的复制和粘贴、人工输入以及数据的导入或导出可以为科学训练师和运动表现部门节省大量的时间,并增加用于共同讨论数据见解的可用时间。最终的目标是,只要数据一经收集,它就能为需要它的人所用。虽然这是一个远大的目标,但是考虑过程并早点采取行动去实现该目标会非常有用。自动化的一个经常被忽视的好处是带来的信息与可视化报告的样式具有一贯性。如果某个人每天都手动制作报告,那么信息或可视化报告样式出现变化的可能性就较高。这种一贯性有助于解读报告,并且可以让终端用户更加迅速地检测到团队或者运动员的异常模式。

运动员的日常测量,像健康状况调查、主观疲劳程度或者负荷监控,应当在运动员当天离开之前完成。这类测量数据在确认恢复或营养策略的时候,或者被医疗人员用来在训练后评估运动员的时候会很有用。能够近乎实时地传递这类测量数据是一种策略优势。在最慢的情况下,数据应当在第2天训练之前提供,这样表现团队便能够审查该数据。

周期较长的监控测试应当立即测得结果,并且要结合该运动员纵向的个体区间和个体趋势。开展这些测量的目的是评估运动员对训练的反应情况以及干预是否有必要。如果科学训练师无法即时评估数据并与运动员和表现团队交流结果,那么他们便会失去向运动员展示收集数据的价值的机会。

比赛的生理和表现指标应当立即测得,但是可能不需要那么快地交流。当只在单场比赛样本上开展时,这些测量可能会具有非常多的干扰信息。科学训练师通常最好具有较多可以展示出趋势或者据以做决策的参考框架。


小节6.2 提供反馈时要利用数据

一般来说,运动员与数据有一种独特的关系。这主要取决于运动员对数据的理解,以及这些数据分析结果如何反过来用到运动员身上,过程中可能需要克服一些障碍。对于科学训练师来讲,首要任务应当是确保运动员理解为什么提出问题以及他们的答案将被如何使用。如果运动员永远收不到反馈,或者看不到数据被利用,那么他们便不可能看到或者信任这些过程的价值。经常的情况似乎是,数据被用来打击运动员或者完全没有被使用。科学训练师从运动员身上收集数据时应当始终有一个计划或者目的,并且应当留出专门的时间来与他们一起审查该信息,以获取他们对数据的独特见解。


7 竞技体育中数据可视化示例

利用可视化手段解释和交流有关运动表现的信息的情况已经迅速增多。利用前面所描述的原则,本部分将介绍现竞技体育中的一些常见数据可视化示例。


小节7.1 个体内部的对比

竞技体育中会出现对比。清楚什么时候进行个体内部的对比和个体之间的对比是科学训练师的工作。相关报告应当采用一种让终端用户知道应该对比什么的方式完成。一种常见的技巧是利用参照点来引导对比。


案例1 健康自评量表与个体参照点的对比

健康调查如今被广泛地应用于多个运动项目,它包含有关睡眠、压力、心情以及训练的RPE等的问题。并且它通常会提供一个可以根据时间加以追踪的综合分数,这被用来追踪运动员对训练可能的响应情况。一般而言,健康调查的目的是了解运动员今天的状态如何,找到这一问题的答案需要运动员回答具体的问题。尽管这些问题很重要,但是它们会缺少重要的情境信息,即与什么对比。任何对比都需要一个参照点,这便是试验中对照组,或者干预中基准测试存在的原因。与什么对比提供了一个解读数据的框架。日常值与某个参照点的对比为数据增加了情景——那么我们应当与什么对比呢?21.2展示了一组运动员的健康调查数据。21.2a按照由高到低的顺序展示了每个运动员报告的原始数据。21.2b针对所有运动员采用了该数据的一种换算版本,目的是让运动员将自身的情况与过去进行对比。

那么哪种可视化形式给出的见解更好呢?将运动员与其他运动员对比,还是将运动员自身的情况与过去对比?两种方法都能够回答上述问题,但是哪种答案能够提供有助于做决策的信息呢?在图21.2,原始分数之间存在巨大的差异,并通过换算值添加了一些情境信息。这个例子根据每个运动员的平均值和标准差来换算数据,目的是计算Z值,z=(xμ)/δ,其中x是运动员的日常值,μ是运动员的平均值,δ是运动员的标准差。

采用这种方法,所有的运动员都处在相同的标度上,并且0表示等于平均值,正数表示大于平均值,负数表示小于平均值。将原始数据换算成z值的另一个好处是,数值对应于标准差的数量和一个高于或低于运动员平均值的数值。例如,0.5表示比运动员的正常范围低0.5个标准差。该值仍然处于该运动员的正常范围,但是取值为1.5或者负2的可能性要小得多。短语正常范围参考的是标准正态分布曲线;换言之,这对于该运动员来说是正常的。21.3展示了一个标准正态分布曲线,其中平均值周围±1个标准差代表了68.26%的数据,如果一个值低于负1个标准差,那么它出现的概率大约为15.87%。这类展示可以优化关于这些数字意义的沟通,这样它们并不代表数值本身,而是代表了一种概念:某种响应只有在不到10%的概率内才会出现,因为该响应的偏差是负1.5。收集和分析数据的目的是清晰地解读和传达结果,这样终端用户才能轻松地解读信息。不过,要注意的是,只有当数据服从正态分布,即绘制直方图,它看起来像一条钟形曲线时,这种换算才有效。如果变量向左或者向右偏斜,那么将原始数据换算成z值便不是一种合适的换算方法。


小节7.2 通过数据换算实现运动员与自身正常范围的对比

当一个人采用主观数据时,数据换算就很重要,因为在大部分情况下,主观类问题都是基于离散值,而不是连续值的。以本章作者的经验来看,在一个量表等级内,运动员往往还会有自己偏好的等级范围。有些运动员可能只使用小范围的值,而有些人则可能会使用完整的等级。由图21.2可明显看出,换算后的运动员数据反映的情况与原始数据不同,该图的两部分(图21.2a和图21.2b都是按照总健康分数降序排列的。运动员5具有最高的原始健康分数,但这一结果实际上低于他的平均值。这表明,该运动员通常按照量表等级范围的上限来回答所有的问题,但是略有偏差,而这有悖于对他的规范要求。类似地,原始数据图中间的运动员具有较低的分数,但是这些结果都高于他们的平均值。该信息很重要,因为它有助于我们与运动员开启一段对话和建立信任,并针对给出的问题提供反馈。以诸如你今天感觉如何?你报告的分数低于正常值,你有什么痛处或者困扰你的事情吗?的问题开启一段对话,可以表明他们的感觉得到了重视。

回想一下,健康调查通常由若干个问题组成,并且通常会计算一个综合分数。所以,科学训练师如何才能挖得更深入以及如何才能发现运动员健康的什么方面可能出现了问题?这随即引出了一个问题:他们所有的参数都下降了吗?还是有一个低于正常值的具体方面可以被更加深入地调查?21.4举例说明了身体响应结果如何换算,然后如何直观地展示数据,以快速地表明运动员的现有数据是否低于他们的正常范围、低多少以及他们健康的哪些方面可能出现了问题。此外,从该图中还可能看到,右侧的预警系统会发现哪些运动员回答每个问题时的标准差低于1。这可以用于展示有多少运动员的响应低于他们的正常范围,从而提供更多的背景信息。由于健康总分由多个问题的得分组成,所以该可视化形式还能提供有关运动员在更加细化的层面上的感受信息。有一个组睡得不好吗?或者有一个组有压力吗?这些主观的反应为科学训练师提供了另一个有助于为每个运动员计划训练与恢复策略的层面。该信息应当用来和某个特定的运动员开启一段对话,因为这些响应是主观性的,并且可能更加倾向于存在偏差和误差。

小节7.3 随时间产生的变化

科学训练师所提供的最为常见的研究结果之一是随时间产生的变化。这可以是随着时间序列产生的变化、训练前后循环测试结果的变化,或者团队的关键表现指标是如何随着时间提高的。这些是会影响运动员、教练员和管理人员的重要见解。报告随时间产生变化时,科学训练师必须注意确保所提供的信息是解读清楚的,并且是严谨的。例如,时序数据需要围绕运动员标准的情景。在没有情境的前提下展示运动员一周的训练和比赛数据,并不会提供做决策所需的信息。运动员训练得太多了吗?太少了吗?所提供的情景应当有助于阐明信息,并且几乎不需要再进一步解读。另外需要清晰展示的是,随着训练周期的推进,度量指标的变化。这对应的问题通常是从训练前后的测试结果来看,运动员变得更有力、更迅速、更强大了吗?下面是报告训练前后测试结果变化时要遵循的准则。

准则1 展示所有运动员的测试结果及其变化情况,不要只展示团队、某个位置或者赛事的平均值。有的运动员会进步,而有的运动员可能会原地踏步或者退步。该信息很重要,因为它可以被用来按照专门针对个体的方式调整训练。

准则2 提供一些有关效应或者变化程度的信息。变化是否有意义,或者是否超过了测量装置的测量误差范围?

准则3 报告变化时要采用原始数据。当数值较小时可能在百分比呈现上变化不明显。专注于真实值和变化的单位。


案例2 运动员健康自评量表

正如之前所讨论的,当报告随时间产生的变化时,重要的是要加入可以为解读数据提供框架的情景。目标是,当教练员或者运动表现团队,甚至是运动员自己看到21.5所展示的数据时,他们能够快速地解读出它的含义。

含义1 运动员今天的健康状况与其个体范围比起来如何?

含义2 运动员过去7天的健康趋势如何?

含义3 需要解决有关运动员的哪些问题以及需要使用什么干预手段?

该案例研究采用的是不同信息类型的组合。通过组合数据类型,我们可以最大限度地为不同终端的用户解读信息。柱状图对日健康状况的排序可以直观地展示哪些运动员处在低位,而换算的数据可以让用户看到运动员偏离正常水平的程度。然后,折线图可以展示运动员周健康状况的趋势,其中灰色的虚线表示平均值,橙色的线表示z值为负2。折线图的目的是展示数据是只下跌了一天,还是持续下跌了好几天。最后,右侧子图展示,对于每个问题来说,哪些运动员的分数较低;目的在于展示一个运动员是所有类别的分数都低,还是只有一两个类别的分数较低。结合21.4的数据类型,在几秒的时间内,用户应当能够观察到关键数据。在本案例中,运动员6今天的健康分数较低,与其整周的水平相比,出现了一次大幅的下跌,并且这似乎与睡眠质量有关。类似地,运动员16今天的分数也较低,并且已经连续3天处于低位了。可视化设计和报告的最终目的应当是,让终端用户得到一个明确的结论,以做出更好的决策。

可视化设计中,颜色是非常有力的工具。红色、黄色和绿色3种交通色在训练科学中很受欢迎,但是我们必须注意受众对该方法的使用方式和信赖程度。首先,患有色盲的个体将无法正确识别这些颜色,虽然我们是在尽力利用颜色来简化信息,但是一定要注意不要只依赖颜色或者滥用颜色。例如,我们不能简单地将红色与不好联系起来,并且将绿色与好联系起来,因为我们有必要查看每个运动员的多个因素。在实践中,科学训练师必须非常清楚颜色的含义以及如何使用它们。工作人员和运动员必须理解颜色是用来引起受众对信息重要性的注意的,但是他们必须加入自己的情景,该情景可以提供更多的信息,并且有助于他们做决策。合理配色有助于数据解读。人们确定颜色的一种常用方法是根据分界点。或者颜色也可以根据计算值等于训练负荷的25%分位数、50%分位数或者75%分位数来指定。这样做的目的在于转用红色代表关注,黄色代表谨慎,绿色代表离开或者无须关注这种理念。不过,在表示两个非常相似的数值的差异时,分界点会出现问题。例如,z值为负2时是红色,但是z值为负1.9时便成了黄色。当数字之间没有真实差异的时候,分界点才能确定差异。如果数据是连续的,那么采用颜色梯度是一种更好的选择,因为它们能够更好地反映出数据上的差异。更进一步地讲,颜色的使用不能过度。颜色是否有附加价值?还是我们只是为了用颜色而用颜色?颜色的滥用会让人们的眼睛感知不到重点,从而削弱其传递信息的能力。考察一下同一张图(见图21.5b,其中颜色的唯一用处是强调应关注的数值。信息是否更加具体地显现出来了?哪种颜色使用方法更有效?这些问题强调了设计以及目的性设计的重要性。


案例3 团队内运动员间的横向对比和纵向对比

本章前面的案例专注的是个体,以及如何展示和传达他们对应激源的响应及它们随时间产生的变化趋势如何。然而,在团队运动项目中,我们通常将这些观点结合起来,以理解团队中的个体是如何随着时间做出反应的。当报告和可视化对比时,这里讨论的许多有关随时间产生的变化的规则仍然适用。情境仍然很重要,但是更为重要的是,我们有必要确保对比的设计能够准确地反映需要对比的内容。

21.6直观展示了团队的健康状况,同时还加入了个体在队内分布情况的情景。21.6展示了团队在过去21天内换算健康状态的平均值。这回答了一个问题:作为一个整体,这个团队对训练的反应如何?一个符号代表团队中的一个运动员。图中给出了包含每个运动员结果在内的团队平均值,但有时候平均值可能会让人产生误解。例如,如果团队中一半的运动员分数非常低,而另一半又非常高,那么团队的平均值将在0附近,但是团队的平均值并没有反映出任何一个运动员的分数情况。而且,如果首发运动员是分数非常低的群体,这是需要明确理解的重要信息,以便针对如何干预做出更好的决策。

利用标签标记出低于具体阈值的数值可以让终端用户很快找出数值低于2.5的任何运动员。这加入了另一个情景,以帮助决策者理解下列内容。

内容1 作为一个团队,每个运动员所处的位置。

内容2 多少运动员分数较高或多少运动员分数较低。

内容3 群体之间的相似性要么非常低要么非常高,这有助于为所需的变化或干预做决策。

实际上,如果17日分数低的5个运动员都是首发运动员,并且19日有一场比赛,那么科学训练师便有机会做出一些调整,并采取相应行动。针对运动员主观报告的可视化设计和教育,需要注意,此类报告来自运动员对训练过程情境的主观内在感受,报告应当有助于讨论如何继续推进训练;除了主观内在感受,运动员还存在一些潜在的外在应激源,以及团队和个人信息的视觉分层。当个体或一组个体与整体中的其他人员进行对照时,就可以获得一些额外的细节信息片段。在图21.617日发现的5个分数较低的运动员中有4个是大一新生,并且当时正好是期中,学业压力增大可能是他们报告的健康状况分数低的原因。


小节7.4 整合多种信息源

在如今的竞技体育情境中,我们可以在运动员身上测量和追踪的数据无穷无尽。通过识别并将相似的指标归类到一起,科学训练师便可以针对运动员的训练进展和训练反应情况形成一份更加详细的分析。最常见的指标之一是训练负荷,它可以通过多种方式加以测量。当直观展示训练和比赛负荷时,我们可以将其看作训练量、强度或密度。以这3种方式看待训练负荷很重要,因为有些运动员可能会对训练量做出反应,有些会对强度做出反应,还有些则会对密度做出反应。弄清楚运动员如何对训练与比赛做出反应有助于找出需要追踪的最重要的反应指标。


案例4 训练负荷和运动员的健康状况

21.7举例说明了如何利用趋势图以压缩格式展示各种指标的大量信息,并将多个变量组合到一起来向数据加入更多的情景。大多数数据可视化工具都能够生成趋势图,但是每个工具都有自定义趋势图的独特方式。这些示例都是用工具R生成的,并且我们可以通过自定义来展示每个人的个体标准,还能够交互地展示每个数据点的值。结合多种数据类型可以让终端用户直观地看到团队或者个体层面的趋势,从而纳入多种反应变量。这会让终端用户弄清楚一个运动员是否对训练量、强度或者二者的组合做出更多的反应。在日程繁忙的竞技体育组织中,采用37天的累积负荷可能更为有用,因为天与天之间的变化可能较小,但是短时间内的变化可能会较大。

8 针对不同受众的数据可视化适应性

数据可视化的主要目标之一是让终端用户易于从所展示的信息中看到模式或者得出有意义的结论。这正是数据可视化设计的重要之处。21.8a至图21.8c展示了3种可视化相同信息的方式。

设计数据可视化方式时,科学训练师要清楚哪种方式受众更容易理解,这一点很重要。此外,要清楚在不知道其他任何有关该运动员的信息时,受众还可以从展示信息的方式中得到什么结论。在图21.8,哪种方式能够让受众快速地确定属于训练日历中每周的数据点集?大部分人会选日历视图。因为大部分人都熟悉日历,所以花费较少的时间就能够理解其试图展示的内容。在图21.8b和图21.8c,受众必须花时间找到一周的起点和终点,并且休息的日子可能会导致数据内出现巨大的波峰和波谷。借助标准的文字展示方式,日历视图可以让受众快速地在一周的一天内或者几天之间以及在一月的几周之间进行数据对比。受众很快就能够看到,与其他月份相比,8月是训练负荷较高的月份。在长时间序列的视图中观察这一点会更具挑战性,如果不仔细研究x轴,那么将难以直观地看出是哪天、哪周,甚至是哪个月的数据。这会使对比变得更加困难,但是可能会更适合观察单个运动员随时间产生的趋势和模式。

展示数据的方式会对解读和得出的结论产生重大的影响,包括向可视化数据加入情景的层次。在21.8所示的3个可视化示例中只有几层信息,所展示的内容是日期以及运动员累积的个人负荷。21.8a和图21.8c采用了有梯度的配色方案来表示运动员的负荷,以加入一个反映运动员当天训练难易程度的可视化层次。正如前面所讨论的,梯度对于连续值来说可能会有用处,因为它们有助于展示大小上的细微变化。对比之下,21.8b采用了3种不同的颜色,对于运动员来说,分别代表75%百分位数以上,75%25%的中间百分位数,以及25%百分位数以下。利用分界点的目的是清楚地确定运动员负荷的正常范围以及高于和低于正常范围的情况。然而,分界点意味着类别是离散的,并且它所表明的类别之间存在的差异可能要大于基础连续数据实际所显现出的差异。比较21.8b和图21.8c可知,柱状图采用的是分界点配色方案,而折线图采用的是梯度配色方案。比较817日和23日的数据可知,分界点配色方案表明这两个值不相同,而梯度配色方案表明这两个值实际相差多少。分界点配色方案可以表明这两天存在差异,但是原始数据的差异非常小。将这两天并列放在一起可能会引起更多的困惑,因为终端用户可能会问,为什么它们的绝对差值如此小,颜色却不相同。

设计完报告和可视化方式之后,与终端用户的交流至关重要。科学训练师需要乐于接受反馈,并且愿意调整报告,以满足终端用户的需求。终端用户产生困惑可能是由于设计问题,而不是对数据或概念理解不到位。科学训练师要将终端用户当作其所处领域内的专家,并且专注于可以被准确解读的包容性设计,以让用户加入自己的情境。有些报告本来就是为了教育终端用户,而有些报告展示数据的目的则只是引起讨论。在每种情况下,设计都至关重要,这样讨论才能专注于信息,而不用花时间解释可视化设计所表达的内容。最好的方法最终归结到了用户以及围绕这些数据的意义和用法的教育上。然而,我们还有其他利用颜色向数据加入情境的方式。回想一下本部分开始时关于需要考虑运动员训练负荷、强度以及密度的讨论。这有助于对可视化设计进行完整的描述,后面将介绍一些做法。


小节8.1 层叠数据以展示负荷变化

本章的不同部分已经讨论了换算数据来让运动员个体内部以及运动员之间的对比变得更加容易,利用颜色辅助信息的解读以及结合多个变量来描述全面情况的重要性。接下来的案例研究会考察向终端用户展示时序数据的不同方式,目标在于展示通过显示信息来阐明数据的不同示例。

21.93种不同的方式展示了相同的数据。21.9a展示了原始的总负荷以及实际强度的梯度等级,用于表明每天的训练量和强度。21.9b展示了相同的数据,但是利用z值进行了标准化,其中正值表示负荷高于个体的平均值,负值表示负荷低于个体的平均值。在这种情况下,线和点的颜色根据标准化的每分钟负荷来定,并且越高于平均值颜色越红,而越低于平均值颜色越绿。该可视化设计的目的是让用户理解训练量和强度随时间产生的变化趋势。该设计需要终端用户认识到,线往上走以及颜色越红表明训练量和强度在增加。虽然这可能是一个合理的假设,但是它确实不需要用户不断地参考坐标轴和图例。一些参照线可以方便地添加到21.9by轴的不同点上,以提供对0值或者任何所需z值阈值的参考。21.9c的设计稍有不同,并且展示了标准化负荷、强度和密度的折线图,并利用背景颜色来辅助解读。该可视化设计可以让用户轻易地看到负荷和强度的变化,以及两者对密度的影响。背景颜色可以让终端用户专注于数据的趋势,而不用退回去查看图例。虽然21.9c的相同信息可以从21.9a和图21.9b推断出来,但是图21.9c让解读变得更加容易了。相比于颜色,利用线和点直观展示变化和变异要容易得多。变化大小的相关信息在梯度等级中是丢失的,除非有良好的参照点来说明从橙色变为红色是什么意思。

额外的信息可用于增强这些图的实践应用性。例如,增加训练日期可以让使用者在现有数据基础上获得更多的信息。因此科学训练师必须花时间思考可视化内容或报告所代表的意义,并以满足实践需求为目标合理地设计报告,这样做可以对用户与报告之间的联系产生巨大的影响。


小节8.2 体育数据不确定性的可视化

可视化不确定性对于科学训练师的重要性在本章开始时已经做了讨论。下面的部分将利用案例说明展示不确定性的不同方式,以及它如何有助于为决策提供信息或者形成策略上的优势。在公开客观的讨论环境下,更有助于使用者对不确定性的理解。


案例5 运动员招募

对于连续型的测试指标,展示测量值或者估计值的不确定性有一些非常简单的方法。21.10展示了一组运动员的年龄与经验之间的关系。蓝线和灰色的阴影区域表示运动员在不同的年龄被交易时所打比赛场数的平均值以及该平均值的标准误差。平均值的标准误差是根据标准差和样本内的运动员数量来计算的。该图清晰地表明了运动员所打的比赛场数在被交易之前随着年龄呈线性增长,还表明每个年龄组的比赛场数范围很大。通过展示会出现的宽幅变异,展示完整的数据会限制估计值的不确定性。想象一个场景,专业运动队的管理部门正在寻找新的运动员,并且希望招募更加年轻的运动员,该信息可以用于瞄准那些对于自己的年龄来说经验高于平均值的青少年运动员。数据的展示方式可以辅助决策,并且可能会为俱乐部带来优势。

案例6 身体成分测量

存在不确定性的另一个领域是测量,因为几乎每种测量在精度和信度方面都有一定水平的不确定性。当存在高度不确定性时,科学训练师要公开这种不确定性,这一点很重要。例如,在个体间信度低的情况下,有必要展示或解释不确定性。这种情况比较普遍的一个领域是运动员身体成分的测量。身体成分是一个高度变异的指标,根据所用的方法不同,不确定性也会有所

变化。21.4展示了有关测量身体成分最常用方法的信息:皮褶厚度测量法、空气置换体积描记法,ADPAir Displacement Plethysmography、生物电阻抗法,BIABioelectrical Impedance Analyse,以及双能X射线吸收法,DXADual X-ray Absorptio­metry。表中展示了对于每种方法而言,报告数据的精度、信度、成本和可行性。当身体成分信息被展示给运动员或者教练员的时候,该信息很重要。

21.11举例说明了显示两个运动员身体成分测量值不确定性的重要性。其中采用不同的方法在同一天内测量这些运动员的身体成分,目的是更好地捕捉运动员内部和运动员之间的差异。21.11a展示了采用每种方法时每个运动员的测量值。21.11b展示了每种方法的测量值以及相比于金标准,四室模型的测量平均误差。两幅图表明了展示不确定性的重要性。终端用户在21.11a中所做的默认对比是运动员2的体脂率要高于运动员1。然而,21.11b中对不确定性的展示可以告诉终端用户,训练实践人员确信的是每个运动员的体脂率都在误差线的范围之间,并且他们的体脂率可能是相似的。误差范围较大的原因在于使用这种方法的假设条件的数量,在一些情况下还在于测试操作人员的技能熟练程度。不确定性对于对比随时间产生的变化或者对比运动员来说都非常重要,因为如果不确定性较高,测得的差异可能并不是真实的差异。在图21.11b,如果一个人对比运动员1和运动员2,那么他会假定运动员2的体脂率高于运动员1。虽然这可能是对的,但是根据所用的方法,该差异可能并没有那么大。在图21.11a和图21.11b,运动员身体成分之间的差异被最小化了,因为测量值变得越来越精确和可信了。如果根据与运动员1的对比结果,对运动员2采取了降低体脂率的措施,那么可能就会出现问题。使用21.11b展示的可能误差或者不确定性信息,运动员1和运动员2的实际值变得非常接近,因此他们更有可能具有相似的体脂率。

这类信息在对比随时间产生的变化时也很有价值,因为测量的潜在误差越大,最小有价值变化值将越大。最小有价值变化值是一个绝对值,高于该值时变化肯定具有统计学上的意义。但是简单来说,它只是意味着,误差较高的指标将会更加难以随时间进行评估。如果2个月后测得运动员2的体脂率是7%现在是9%,这是真实变化,还是只是在测量误差范围内的浮动?身体成分是一项重要的评估,因为在许多运动项目中和对于许多个体来说,它是一个敏感的问题。使用这些信息会产生一些后果,科学训练师有责任有效地传达可以和不可以从信息中得出什么结论。


9 本章小结

要想利用数据可视化进行有效的交流,科学训练师需要知道一项分析的动机,了解受众并熟悉他们的能力,以及采用合适的图表形式来传递准确的意义,并且采用的图表形式要符合人们感知可视化信息的方式。在如今的顶级竞技体育情境中,有关准备和表现的数据比以往任何时候都更容易得到,所以至关重要的是,科学训练师要有能力利用数据传递有意义的见解来为决策提供信息,并指导日常训练和比赛情境中的决策。通过采用通用的设计原则和理解人类视觉感知的基础知识,科学训练师可以进行有效的数据可视化设计来准确、清晰地以符合受众需求的方式传递信息,以便受众利用该信息做出有效的判断和基于可靠信息的决策。

第21章 结束




赞赏将全部用于公益

截图时间:08/7/2024

体能舟记
“生命影响生命,品格传递品格。” 职业体能教练 讲师
 最新文章