▼ 本书来源,第五章
1. 体育 doping 概述
• 定义与危害:运动员使用违禁物质或方法提高成绩,违背公平竞争原则,损害健康。
• 常见形式 - 血液 doping:增加血液中红细胞数量,如使用rhEPO,常见于耐力运动员。
• 检测挑战与现有方法:直接检测血液或尿液中的违禁物质,间接方法监测生物标志物变化。现有方法受数据量限制。
2. 生成式建模基础
• 血液样本血液学特征:包含多种受rhEPO影响的参数,如血红蛋白浓度、红细胞压积等。
• 合成血液学特征的要求
• 数据的时间性质:跟踪同一运动员不同时间的多个样本。
• 特征序列长度的可变性:不同运动员样本数量因职业生涯或经验而异。
• 数据类型的多样性:包括分类或离散特征以及连续特征。
• 异常值和离群点的存在:对分析很重要。
• 因缺失值导致的数据稀疏性。
• 生成对抗网络(GANs)
• 概念与架构:包括生成器和判别器,通过对抗训练生成符合原始数据分布的新样本。
• 训练过程:是一个min - max游戏,不断调整生成器和判别器的参数。
3. 实验过程与评估
• 数据描述:来自临床试验,包括两组参与者,在不同海拔条件下进行三个阶段实验,收集864个血液样本。
• 性能指标
• 样本分布比较:比较生成样本和真实临床数据中每个模拟个体的样本数量和分布。
• 边缘分布比较:分析单个血液学参数的边缘分布,评估合成数据集对真实临床样本的模拟程度。
• Kolmogorov - Smirnov测试:定量评估生成血液样本的分布与真实数据是否来自同一分布。
4. 结果分析
• 生成数据样本在多数参数上接近真实样本,证明了数据生成方法的有效性。
• K - S测试结果显示,真实和生成样本分布之间的差异在统计上不显著,但部分分布未完全复制真实数据的复杂特征。
5. 研究结论与展望
• 生成的血液样本可作为真实血液样本数据的有效替代,用于因数据不足或隐私问题难以获取真实数据的研究。
• 未来应改进生成过程,更好地捕捉真实数据的分布。
这本书有好多生理学相关的专业术语,我自己也不是很确定,我在相关网站找到了一些术语库后让Claude3.5/Chatgpt4o1进行了翻译校对,有错的还希望各位在评论区指出!
喜欢的朋友
可以点赞、在看、转发支持一下
第6章体育反兴奋剂分析中的生成式人工智能
Maxx Richard Rahman和Wolfgang Maass著
摘要:体育中的兴奋剂使用涉及滥用违禁物质以提高体育赛事中的表现。血液兴奋剂是一种常见的方法,它通过输血或合成促红细胞生成素(rhEPO)等方式增加红细胞数量来提高有氧能力。当前的间接检测方法需要大量数据进行分析。在本文中,我们研究了使用生成式建模来生成合成血液样本数据,以改进体育中的反兴奋剂分析。我们对临床试验期间收集的血液样本进行了实验。数据集包含来自真实血液样本的血液学参数,对这些参数进行分析以了解基线特征。生成对抗网络(GAN)被用于了解真实血液样本数据的复杂性和变异性。结果表明,该模型能够成功生成与真实样本非常相似的合成样本,这表明它在扩充用于兴奋剂检测的数据集方面具有潜力。这种方法不仅通过提供更大的数据集用于分析来增强间接兴奋剂检测方法的稳健性,还解决了在使用运动员生物数据时涉及的隐私和同意相关的伦理问题。
关键词:血液兴奋剂;rhEPO;GANs;体育
6.1引言
体育中的兴奋剂使用是指运动员使用禁用物质或方法来提高他们的表现(Vlad等人,2018)。这种不道德的行为破坏了公平竞争,并带来了重大的健康风险。兴奋剂的历史可以追溯到1886年,当时使用了可卡因、咖啡因和士的宁等物质来提高表现,尽管在当时它们并不违法(Holt等人,2009)。这一时期是提高成绩的实践的起点,这些实践已经发展成为一套复杂的兴奋剂技术,包括合成代谢类固醇、血液兴奋剂、人类生长激素等。自行车运动中最著名的案例之一是兰斯·阿姆斯特朗,他因兴奋剂指控被禁赛,后来承认使用了提高成绩的药物促红细胞生成素(EPO)(Heuberger等人,2013)。阿姆斯特朗的案例使人们更加关注兴奋剂问题在职业自行车运动和其他体育项目中的普遍性。
血液兴奋剂是最常见的兴奋剂形式之一,它是指增加血液中红细胞的数量,提高运动员的有氧能力和耐力(Plumb等人,206)。这可以通过输血、使用某些药物或其他旨在增加红细胞数量的方法来实现(Goodnough和Panigrahi,2017)。血液兴奋剂在耐力运动员中尤为常见,例如自行车运动员,他们的表现可以通过向肌肉增加氧气输送而显著提高。
重组人促红细胞生成素(rhEPO)是一种负责产生红细胞的天然激素的合成形式(Bunn,2013)。在体育中使用rhEPO也被称为“EPO兴奋剂”,这已经成为一个主要问题,因为它可以帮助提高运动员的表现。使用rhEPO使运动员能够在不需要输血的情况下增加他们的红细胞数量,从而使这种方法成为一种更隐蔽的兴奋剂使用方式(Robinson等人,2006)。然而,使用rhEPO可能会带来心血管风险,如高血压和血栓形成,这给运动员带来了严重的健康问题(Santhanam等人,2010)。血液兴奋剂的检测一直是世界反兴奋剂机构(WADA)和相关实验室面临的挑战。2009年,他们开发了运动员生物护照,这涉及到随着时间的推移监测选定的生物标志物,并通过观察运动员生物标志物的变化来间接检测血液兴奋剂的影响,这些变化可能暗示了人为操纵(WADA,2022)。
当前的检测技术包括直接检测血液或尿液样本中是否存在违禁物质,以及可能提供兴奋剂使用迹象的间接方法,如血液学参数的变化。Manfredini等人(2011)提出了一个包括几个血液参数的统计分数,并强调了与正常水平的差异。Sharpe等人(2006)使用单个先前的样本为运动员确定基线值。Parisotto等人(2001)研究了不同的统计模型,即ON和OFF模型,根据特定的可能参数在分析中的表现。因此,使用统计学和机器学习(ML)技术来处理兴奋剂问题已经成为不同研究的主题。同样,Kelly等人(2019)使用ML算法通过791名UFC运动员的表现数据发现兴奋剂风险,具有44%的高灵敏度率。Sottas等人(2006)开发了异常血液图谱分数(ABPS),这是一种利用间接生物标志物的统计分类的测试策略。ABPS的计算使用了支持向量机和朴素贝叶斯算法,达到了45%的灵敏度和100%的特异性。Rahman等人(2022)也展示了不同的ML方法如何有助于识别血液样本中rhEPO的存在。因此,这项研究是当前最先进的方法,可以作为未来研究的基准。
尽管有这些进展,但其中一个重大的局限性是难以收集到足够的数据用于有效的ML分析。因此,在本文中,我们将讨论生成式建模在体育兴奋剂分析中的潜在用途。这项研究工作的重点是生成式算法是否能够帮助消除有限数据的限制,并对兴奋剂检测产生积极影响。因此,我们应用生成对抗网络来生成血液样本,这些样本可以进一步用于训练ML算法,以检测和识别血液样本中rhEPO的存在,从而改进血液兴奋剂的检测。
6.2生成式建模
6.2.1血液样本的血液学特征
血液样本的血液学特征由一组关键的血液参数组成,这些参数由于rhEPO的摄入而表现出显著的变化(Krumm和Faiss,2021)。它有助于了解每个循环血液细胞的大小和重要特征。表6.1显示了所有重要参数及其描述。
表6.1血液样本中所有血液学参数的描述
参数 | 描述 |
血红蛋白浓度(HB) | 血液中血红蛋白的含量,以克每升(g/L)为单位测量 |
红细胞压积(HCT) | 红细胞在血液体积中所占的比例 |
网织红细胞百分比(RET%) | 血液中未成熟红细胞(网织红细胞)的百分比 |
网织红细胞计数(RET#) | 每微升血液中网织红细胞的绝对数量 |
网织红细胞血红蛋白(RET - HB) | 网织红细胞内的血红蛋白含量 |
平均红细胞体积(MCV) | 红细胞的平均体积 |
平均红细胞血红蛋白质量(MCH) | 红细胞中血红蛋白的平均质量 |
平均红细胞血红蛋白浓度(MCHC) | 红细胞中血红蛋白的浓度 |
红细胞计数(RBC) | 红细胞的总数 |
红细胞分布宽度 - 标准差(RDW - SD) | 红细胞大小变化的一种度量 |
红细胞分布宽度 - 变异系数(RDW - CV) | 红细胞大小变异性的另一个指标 |
白细胞计数(WBC) | 白细胞的总数 |
未成熟网织红细胞分数(IRF) | 未成熟网织红细胞的比例 |
低荧光网织红细胞分数(LFR) | 具有低荧光的网织红细胞的分数 |
中荧光网织红细胞分数(MFR) | 具有中荧光的网织红细胞的分数 |
高荧光网织红细胞分数(HFR) | 具有高荧光的网织红细胞的分数 |
OFF - HR分数 | 网织红细胞和血红蛋白之间的关系。使用表达式计算:OFF - HR = HB(g/L) - 60RET% |
OFF - HR参数的重要性可以通过一个例子来说明。想象一个使用小剂量rhEPO的运动员。虽然这可能不会显著提高血红蛋白水平,但网织红细胞可能会有明显反应,影响OFF - HR分数。相反,一个服用大量rhEPO剂量的运动员可能通过血浆扩张来维持恒定的血红蛋白水平,逃避检测。然而,输注一袋血液会减少网织红细胞,触发OFF - HR。因此,OFF - HR是红细胞生成加速或减速的关键指标。
6.2.2合成血液学特征的要求
由于其纵向性质,生成血液学特征有几个要求(Mosquera等人,2023)。首先,我们列出了合成纵向数据集所需的一组先决条件。通过这样做,我们旨在为我们的生成式算法定义特定的标准。目标是确保生成样本的真实性以及生成式模型对实际数据场景的适用性。(1)数据的时间性质:血液学特征由纵向元素组成,这意味着它随着时间跟踪同一运动员。这个纵向元素涉及在不同时间从每个运动员收集多个样本。
(2)特征序列长度的可变性:每个运动员的样本数量的变化高度依赖于运动员的职业生涯长度或经验水平。年轻或新运动员通常样本较少,而经验丰富、活跃时间长的运动员因此收集了更多的样本。这种序列长度的差异在分析数据时需要考虑。
(3)数据类型的多样性:纵向数据集在性质上是异构的,这意味着它由不同类型的数据类型组成。具体来说,它包括:- 分类或离散特征,这些数据可以分为不同的类别而没有任何内在顺序(例如性别、样本采集)。- 连续特征,这些是数字,可以在一个范围内取任何值,代表测量或数量(例如不同血液学参数的浓度水平)。
(4)异常值和离群点的存在:数据集包含异常值,这些值与参考范围不同。它们对于分析可能是至关重要的,可以用来识别特殊情况、数据收集错误或可能对分析很重要的独特特征。
(5)因缺失值导致的数据稀疏性:数据集包含大量缺失值导致稀疏性是很常见的。这意味着并非所有血液学参数对所有样本都可用。
6.2.3生成对抗网络(GANs)
生成式模型学习理解和复制给定数据集的潜在分布,使它们能够生成可能来自与原始数据相同分布的新样本。这种方法在许多领域都非常强大,如图像和语音生成,在这些领域中,像生成对抗网络(GANs)(Goodfellow等人,2014)和变分自动编码器(VAEs)(Kingma和Welling,2014)这样的模型已经显示出了生成高质量、逼真输出的显著能力。在本研究中,我们使用GANs基于收集的临床样本生成血液样本。
在本节中,我们讨论GANs的概念和架构。一个基本的GAN框架包括一个输入向量以及两个主要组件:一个生成器和一个判别器,这两个组件通常都使用深度神经网络来实现。这个概念依赖于一个预先确定的分布,,它被假定为代表训练样本x的数 据分布。准确识别这个分布是具有挑战性的。传统方法通常假设遵循高斯混合模型。然而,这些方法在复杂模型中可能会失败,导致不理想的结果。因此,建议使用神经网络来定义分布。由G参数化的生成器从一个先验分布中取一个随机变量z,并通过神经网络将其转换为一个伪样本分布,记为,其数据分布标记为。变量z通常来自高斯噪声,代表潜在空间中的一个随机变量。利用G,生成器可以将一个简单的输入分布转换为各种复杂的分布。生成器的目标是使紧密模仿实际数据分布。因此,生成器的目标是优化并找到一个理想的,
下一个问题是识别两个分布之间的差异。尽管对这些分布缺乏精确的了解,但可以从它们中抽取样本。为了解决这个问题,我们有一个由参数D表征的判别器。在训练阶段,判别器对于真实样本x应该输出值为1,并对于生成样本变为0。Goodfellow等人(2014)使用了二进制交叉熵函数,这是常用于二进制分类问题的函数。
在这个上下文中,代表模型预测的标签,y表示样本的实际标签。所考虑的每个样本可能来自真实分布或生成分布。相应地,正例与相关联,负例对应于。判别器的整个目标函数定义如下:
整合这些方程得到基础GAN的目标函数如下:
GAN的训练过程本质上是一个min - max游戏。生成器试图通过最大化判别器对合成样本的输出来欺骗判别器。相反,判别器努力准确地从生成样本中识别出真实样本,试图对于真实样本最大化函数,对于生成样本最小化它,创建一个极小极大场景。在GAN训练过程中,生成器和判别器的参数会迭代调整。在训练生成器时,判别器的参数保持不变,并且将生成的数据输入到判别器中。计算判别器的输出与实际标签之间的差异,并使用反向传播算法根据这个误差更新生成器的参数。相反,在判别器的训练阶段,生成器的参数保持不变。判别器从真实数据集中接收真实样本,而生成器给出一个生成样本。使用判别器的输出和真实标签确定误差,并使用反向传播算法根据这个误差更新判别器的参数,如图6.1所示。
▲ 图6.1用于生成血液样本的生成对抗网络(GAN)架构
6.3评估
6.3.1数据描述
收集关于精英运动员的健康相关数据是一项困难的任务,因为存在数据可访问性和隐私等问题。因此,本研究中使用的数据集来自临床试验,Rahman等人(2022)对该试验进行了详细描述。该临床试验在现实世界条件下进行,包括两组:一组在“海平面”有34名参与者,另一组在“海拔”有39名参与者。实验分为三个阶段:基线(第1 - 4周)、干预(第5 - 8周)和随访(第9 - 12周)时期。两组在基线和随访期间都在海平面。然而,在4周的干预期间,一组留在海平面,另一组在2300m的中等海拔。这个4周的持续时间对应于通常的运动训练制度,其中海拔训练营很少超过这个时间。
表6.2所收集血液样本的数据统计
血液样本 | 海平面 | 海拔(=2300m) |
rhEPO样本 | 100 | 48 |
安慰剂样本 | 609 | 107 |
总样本 | 709 | 155 |
在基线和随访阶段,没有参与者接触提高成绩的药物。然而,在干预阶段,参与者每隔两天连续接受11次注射。对于海平面组,25个人接受了rhEPO注射,其余9人接受了安慰剂。在海拔组,12名患者接受了rhEPO注射,27人接受了安慰剂。在整个研究过程中,共收集了864个血液样本。数据统计信息在表6.2中详细描述。图6.2显示了在海平面收集的rhEPO和安慰剂样本的所有血液学参数的分布。
▲ 图6.2在海平面收集的rhEPO和安慰剂样本的所有血液学参数的分布
6.3.2性能指标
样本分布比较
评估生成数据集的效用的最基本方法是比较为每个模拟个体生成的样本的数量和分布与真实临床数据中的样本。这包括绘制每个参与者的样本数量作为直方图,以观察和比较平均值。此外,为了评估真实和生成数据集中样本类型的分布,我们计算每个数据集内每种类型样本的概率分布。
边际分布比较
为了评估合成数据集与真实临床样本的相似程度,我们可以查看单个血液学参数的边际分布。这涉及独立分析每个参数的分布,以了解合成数据如何很好地捕捉真实血液样本中观察到的变异性和中心趋势。这种方法确保我们对参数分布的比较不会因任何无关或缺失的值而扭曲。
Kolmogorov - Smirnov测试
为了定量评估生成血液样本的分布,我们可以应用双样本Kolmogorov - Smirnov测试(K - S测试)来识别真实和生成数据样本之间的关键差异。K - S测试是一种成熟的方法,用于评估两个数据集是否可能来自同一分布(Dimitrova等人,2020)。它计算两个总体(一个安慰剂和一个接受rhEPO的)的累积分布函数之间的最大差异如下:
该测试的零假设是假设两个分布来自同一父分布,如果超过由以下涉及安慰剂和rhEPO队列样本大小的方程确定的特定阈值,则在显著性水平α下拒绝该假设:其中a和b分别是安慰剂和rhEPO样本的数量。
6.4结果
我们使用前一节中描述的定性和定量措施对生成的样本进行了评估。表6.3显示了真实和生成样本的均值和标准差。使用双样本K - S测试计算d值和p值以量化两个分布之间的差异。图6.3显示了在海平面的真实和生成样本的所有血液学参数的分布。密度图展示了定量分析,表明生成的数据在中心趋势和变异性方面很好地近似真实数据。然而,图中捕捉到的细微差别强调了进一步改进数据生成算法的必要性,以确保分布的尾部和血液学分布的非常具体的特征能够更准确地生成。这对于任何决策过程尤其重要,因为数据模拟的准确性可能会产生重大后果。
表6.3生成的数据样本与真实血液样本的比较分析
真实样本 | 生成样本 | 双样本K - S检验 | ||||
均值 | 标准差 | 均值 | 标准差 | d值 | p值 | |
HB | 14.24 | 1.13 | 14.09 | 1.05 | 0.10 | 2.1e - 03 |
RET% | 1.04 | 0.39 | 0.93 | 0.25 | 0.15 | 3.3e - 07 |
RDW - SD | 41.63 | 2.32 | 41.34 | 2.22 | 0.14 | 9.2e - 07 |
RDW - CV | 12.66 | 0.62 | 12.58 | 0.59 | 0.13 | 1.2e - 05 |
HCT | 41.52 | 2.98 | 41.06 | 2.71 | 0.11 | 4.5e - 04 |
OFF - HR | 82.00 | 15.03 | 83.58 | 13.62 | 0.07 | 5.1e - 02 |
LFR | 92.78 | 3.33 | 93.71 | 2.58 | 0.14 | 1.8e - 06 |
RET# | 0.05 | 0.02 | 0.04 | 0.01 | 0.16 | 1.9e - 08 |
RBC | 4.67 | 0.38 | 4.64 | 0.37 | 0.09 | 4.3e - 03 |
IRF | 7.22 | 3.33 | 6.29 | 2.59 | 0.14 | 3.7e - 06 |
MFR | 6.41 | 2.77 | 5.62 | 2.15 | 0.14 | 1.1e - 06 |
WBC | 5.65 | 1.51 | 5.44 | 1.5 | 0.16 | 2.1e - 08 |
MCH | 30.50 | 1.26 | 30.42 | 1.19 | 0.09 | 2.9e - 03 |
MCHC | 34.28 | 0.01 | 34.27 | 0.83 | 0.05 | 2.4e - 01 |
HFR | 0.81 | 0.74 | 0.67 | 0.58 | 0.17 | 1.0e - 09 |
RET - HB | 33.44 | 1.7 | 33.92 | 1.63 | 0.10 | 1.0e - 03 |
MCV | 88.98 | 3.08 | 88.77 | 2.95 | 0.05 | 1.8e - 01 |
▲ 图6.3海平面队列的真实样本和生成样本的所有血液学参数的分布
6.5结论
本研究旨在探索生成式建模在改进体育中血液兴奋剂检测方面的潜力。在最近的过去,机器学习的应用,特别是监督学习技术,在反兴奋剂努力的背景下一直是一个感兴趣的话题。这样的研究通常依赖于从临床研究中获得的数据,这些研究涉及特定的个人群体。在我们的分析中,我们使用了通过临床试验收集的数据集,并执行GAN来生成更多的血液样本,这些样本模拟了数据集的类似行为。
本研究提供了真实和生成的血液学血液特征之间的详细比较研究。实验结果表明,生成的数据样本在大多数参数上接近真实样本,证明了所使用的数据生成方法的效率。特别是,血液参数如血红蛋白(HB)、红细胞分布宽度(RDW - SD和RDW - CV)和平均红细胞血红蛋白(MCH)的均值接近,且标准差相当小,这意味着生成的数据具有与真实数据相同的中心趋势,这对于任何涉及数据建模或基于真实数据的模拟的过程都很重要。
另一方面,从K - S测试结果可以清楚地看到,真实和生成样本分布之间的差异在统计上是不显著的,如P - 值所证明。d - 值,它测量两个样本的经验分布函数之间的最大距离,相当小,表明差异不大。对于MCHC、OFF - HR和MCV等参数的K - S测试的P - 值>1e - 02,这证明生成的数据很好地类似于临床数据分布。相反,一些分布如HFR、RET#和WBC的P - 值<1e - 08,尽管它们的均值和变异性相似,但并不能完美地复制真实数据的复杂分布特征。这可能是由于数据生成过程中固有的局限性,它可能无法完全捕捉生物变异性和潜在的生理相关性。
总之,在因数据不足或隐私问题而难以收集真实数据的研究中,生成的血液样本可以被视为真实血液样本数据的一个可靠替代品。未来的工作应该旨在改进生成过程,以更好地捕捉真实数据的分布,也许可以通过整合更复杂的建模技术或在生成算法中纳入更多的生物学知识。这样的改进可以使生成的数据与真实数据无法区分,为兴奋剂分析中的研究和应用开辟新的边界。
致谢:我们感谢哥本哈根大学的Nikolai Baastrup Nordsborg教授及其研究小组与参与者进行临床试验并为此次分析收集血液样本。这项工作是由世界反兴奋剂机构(WADA)资助的EP
参考文献
1. Bunn, H. F. (2013). Erythropoietin. Cold Spring Harbor Perspectives in Medicine, 3(3), a011619.
2. Dimitrova, D. S., Kaishev, V. K., & Tan, S. (2020). Computing the Kolmogorov - Smirnov distribution when the underlying cdf is purely discrete, mixed or continuous. Journal of Statistical Software, 95(10), 1 - 42.
3. Goodfellow, I., Pouget - Abadie, J., Mirza, M., Xu, B., Warde - Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative adversarial nets. In Advances in neural information processing systems (pp. 2672 - 2680).
4. Goodnough, L. T., & Panigrahi, A. K. (2017). Blood transfusion therapy. The Medical Clinics of North America, 101(2), 431 - 447.
5. Heuberger, J. A., Cohen Tervaert, J. M., Schepers, F. M., Vliegenthart, A. D., Rotmans, J. I., Daniels, J. M., Burggraaf, J., & Cohen, A. F. (2013). Erythropoietin doping in cycling: Lack of evidence for efficacy and a negative risk - benefit. British Journal of Clinical Pharmacology, 75(6), 1406 - 1421.
6. Holt, R. I., Erotokritou - Mulligan, I., & Sönksen, P. H. (2009). The history of doping and growth hormone abuse in sport. Growth Hormone & IGF Research: Official Journal of the Growth Hormone Research Society and the International IGF Research Society, 19(4), 320 - 326.
7. Kelly, T., Beharry, A., & Fedoruk, M. (2019). Applying machine learning techniques to advance anti - doping. European Journal of Sports and Exercise Science, 7(2).
8. Kingma, D. P. & Welling, M. (2014). Auto - encoding variational Bayes. In 2nd International Conference on Learning Representations, ICLR 2014, Banff, AB, Canada, April 14 - 16, 2014, Conference Track Proceedings.
9. Krumm, B., & Faiss, R. (2014). Factors confounding the athlete biological passport: A systematic narrative review. Sports Medicine - Open, 7(1), 65.
10. Manfredini, F., Malagoni, A. M., Litmanen, H., Zhukovskaja, L., Jeannier, P., Follo, D., Felisatti, M., Besseberg, A., Geistlinger, M., Bayer, P., & Carrabre, J. (2011). Performance and blood monitoring in sports: The artificial intelligence evoking target testing in antidoping (AR.I.E.T.T.A.) project. The Journal of Sports Medicine and Physical Fitness, 51(1), 153 - 159.
11. Mosquera, L., El Emam, K., Ding, L., et al. (2023). A method for generating synthetic longitudinal health data. BMC Medical Research Methodology, 23, 67.
12. Parisotto, R., Wu, M., Ashenden, M. J., Emslie, K. R., Gore, C. J., Howe, C., Kazlauskas, R., Sharpe, K., Trout, G. J., Xie, M., & Hahn, A. G. (2001). Detection of recombinant human erythropoietin abuse in athletes utilizing markers of altered erythropoiesis. Haematologica, 86(2), 128 - 137.
13. Plumb, J. O. M., Otto, J. M., & Grocott, M. P. W. (2016). ‘Blood doping’ from Armstrong to prehabilitation: Manipulation of blood to improve performance in athletes and physiological reserve in patients. Extrem Physiol Med, 5, 5.
14. Rahman, M.R., Bejder, J., Bonne, T. C., Andersen, A. B., Huertas, J.R., Aikin, R., Nordsborg, N. B., & Maass, W. (2022). Detection of erythropoietin in blood to uncover doping in sports using machine learning. In Proceedings of the IEEE International Conference on Digital Health (ICDH) (pp. 193 - 201).
15. Robinson, N., Giraud, S., Saudan, C., Baume, N., Avois, L., Mangin, P., & Saugy, M. (2006). Erythropoietin and blood doping. British Journal of Sports Medicine, 40(Suppl 1), i30 - i34.
16. Santhanam, A. V., d’Uscio, L. V., & Katusic, Z. S. (2006). Cardiovascular effects of erythropoietin an update. Advances in Pharmacology (San Diego, Calif.), 60, 257 - 285.
17. Sharpe, K., Ashenden, M. J., & Schumacher, Y. O. (2006). A third generation approach to detect erythropoietin abuse in athletes. Haematologica, 91(3), 356 - 363.
18. Sottas, P. - E., Robinson, N., Giraud, S., Taroni, F., Kamber, M., Mangin, P., & Saugy, M. (2006). Statistical classification of abnormal blood profiles in athletes. The International Journal of Biostatistics, 2(1).
19. Vlad, R. A., Hancu, G., Popescu, G. C., & Lungu, I. A. (2018). Doping in sports, a never - ending story? Advanced Pharmaceutical Bulletin, 8(4), 529 - 534.
20. WADA. (2022). Athlete biological passport. https://www.wada - ama.org/en/athlete - biological - pas sport. Last accessed March 1, 2024.
作者介绍:郭佰鑫(Max)
作者Max,一位大三的本科生,社交自媒体平台专注于输出体育科技以及体育科学相关内容,期待未来有能力的基础下能加入更多基于人工智能的体育分析与科技。有其他科研合作的欢迎您的联系
▼ 麻烦您带一下备注!