▲ 这是原文↑!我的公众号也翻译了这篇文章欢迎各位阅读
点击右边蓝字阅读→:<原文>体育实时人工智能方法的发展趋势:系统综述
这里我做了一个学术海报,大家可以快速阅读一下!
体育实时人工智能方法的发展趋势:系统综述
一、研究背景与目的
(一)背景
在体育领域,运动员、教练和分析师不断寻求创新方法提升竞技水平,人工智能(AI)尤其是机器学习(ML)的应用日益重要。近年来,通过简单传感器获取实时数据为运动员提供反馈的技术发展迅速,但利用机器学习提供反馈的研究较少。
(二)目的
系统分析机器学习在体育中的应用,包括传感器信号预处理、机器学习模型与方法、应用结果以及评估该领域现状,为后续研究提供参考。
▲ 本文思维导图欢迎各位保存,如果喜欢推文的话希望您能传播一下我的内容!
二、研究方法
(一)遵循PRISMA框架
按照PRISMA框架进行系统综述,确保研究的科学性和规范性。
(二)设定纳入与排除标准
1. 纳入标准
• 至少使用一种机器学习技术。
• 使用实时数据且结果可实时应用(系统无需实时运行)。
• 机器学习模型输入为简单传感器信号(排除视频和运动捕捉系统)。
• 论文发表时间不超过20年。
• 机器学习聚焦于体育相关应用(排除简单活动识别和步态分析)。
2. 排除标准
• 不符合上述纳入标准的论文,如非体育领域、未使用机器学习、使用复杂系统(如摄像头)、未实时处理数据、研究重点不符等。
(三)文献检索
使用SCOPUS、Web of Science和PubMed三个数据库,检索词包括“machine learning”、“deep learning”、“classification”、“realtime”、“sport*”等,检索时间为2023年11月,最终筛选出72篇符合标准的论文进行深入分析。
三、研究结果
(一)领域发展趋势
1. 发展迅速:该领域发展迅速,2009年出现首篇符合标准的论文,之后数量逐年增加,尤其在2017年后,论文数量大幅增长。
2. 深度学习兴起:从使用传统机器学习技术逐渐转向深度学习,在分析的12篇对比深度学习和传统机器学习方法的论文中,9篇深度学习方法效果更佳,3篇传统机器学习方法更好。近四年(2020 - 2023年)的46篇论文中,26篇(57%)使用了深度学习,其中17篇专注于深度学习。
(二)研究的体育项目
研究涉及多种体育项目,其中健身运动最为常见,其次是跑步、高尔夫等。动作简单的运动研究较多,可能因其分类结果更易实现高准确率。
(三)数据集分析
1. 传感器使用情况
• 常见传感器:加速度计是最常用的传感器(83%),其次是陀螺仪(67%)。其他传感器如磁力计(15%)、心率传感器(8%)、肌电图传感器(7%)、应变仪传感器(7%)等使用相对较少。在使用深度学习的论文中,加速度计和陀螺仪的使用率也较高。部分研究使用单一传感器,更多研究使用多个传感器。
• 传感器平台:多数研究(24篇)使用单一可穿戴传感器平台,常见于手腕或背部;大量研究(23篇)使用多个可穿戴传感器平台,测量身体不同部位信号;15篇研究使用安装在设备上的传感器。近年来,使用可穿戴传感器的趋势增加,且深度学习在多传感器平台研究中更常见。
2. 数据集规模:数据集规模相对较小,但深度学习研究中的数据集规模大于传统机器学习研究。研究中参与者数量中位数为9,平均数为16,数据集样本数量中位数为675,平均数为4339.8,使用深度学习技术的研究中,数据集中位数规模为3975样本。
3. 数据分割方式:多数论文(37篇)围绕体育动作手动分割传感器信号,确保机器学习算法输入一致;22篇论文使用滑动时间窗口,部分研究对比了不同时间窗口大小对分类准确性的影响。
(四)信号与预处理
1. 采样率:多数研究使用IMU传感器,其采样率差异大,中位数为100Hz,平均数为196.4Hz,近年来变化不大。高采样率用于分析如跆拳道头部冲击等高频信号,多数运动使用常规采样率即可。
2. 滤波器使用:约一半研究(32篇)进行了信号预处理,最常用低通滤波器(25%),用于去除高频噪声,其次是带通、高通滤波器等,部分研究使用多种滤波器组合。使用IMU信号的研究中滤波器使用更普遍,深度学习研究中多数未使用滤波器,但这并不意味着预处理无益处。
3. 数据集平衡处理:不平衡数据集是常见问题,处理方法包括过采样、欠采样和人工生成样本。8篇研究使用人工生成样本,多为深度学习研究且多在近四年;3篇研究分别使用随机过采样、欠采样方法。多数研究控制数据收集,使数据集不平衡程度低于实际运动情况,未来随着大数据应用增加,这些处理方法将更重要。
4. 特征提取:最常见的预处理方法是特征提取,部分研究使用主成分分析、运动特定特征等,少数研究将信号转换为图像或视频形式,未来此类方法有应用潜力。多数深度学习研究使用完整信号,部分研究比较了不同特征集,发现不同特征在不同研究中效果各异。其他预处理方法包括归一化、信号变换、重采样等。
(五)机器学习模型
1. 模型使用情况:论文使用多种机器学习模型,支持向量机最常用,部分研究使用未涵盖在分析中的模型。43篇研究比较了不同模型结果,深度学习模型在多数对比研究中表现最佳,如多层感知器、卷积神经网络、长短期记忆网络等,传统机器学习模型中隐马尔可夫模型表现较好,但决策树从未成为最佳测试模型。
2. 模型通用性:多数研究使用非特定受试者模型,部分研究比较发现特定受试者模型效果更好,但两者均能取得成功,表明可创建适用于所有受试者的模型。
(六)机器学习结果
1. 模型评估方法:多数研究使用分类模型(62篇),部分使用回归模型(10篇)。分类模型常用评估指标为准确率(52篇),其他指标包括F1值、混淆矩阵、ROC曲线下面积等。模型测试方法包括随机分割、交叉验证等,近四年随机分割使用增多。
2. 分类准确率:使用准确率评估的研究中,63%达到90%以上准确率,部分研究在部分分类目标中达到此准确率。高准确率可能源于体育领域适合机器学习应用或选择偏差,深度学习研究准确率略低可能因其解决更复杂问题,且测试深度学习和传统机器学习模型的研究通常发现深度学习更成功。
(七)反馈应用
1. 应用情况:28篇研究(39%)使用机器学习模型为运动员提供实时反馈,其中20篇来自近四年,表明该领域发展迅速。反馈应用发展潜力大但目前不成熟。
2. 运行设备与协议:反馈运行设备多样,包括可穿戴设备、服务器、手机、电脑等,传输协议常用蓝牙(12篇),但其低延迟性不佳。反馈方式主要为屏幕反馈(17篇)和音频反馈(5篇),手机是最常见的反馈显示设备(14篇)。
四、研究结论与建议
(一)结论
1. 机器学习在体育领域应用从传统技术向深度学习发展,论文数量增长迅速,研究涉及多种体育项目。
2. 加速度计和陀螺仪是常用传感器,数据集规模相对较小,信号预处理方法多样,深度学习模型在对比研究中表现较好,多数分类研究准确率较高,实时反馈应用有发展潜力但不成熟。
(二)建议
1. 研究更复杂运动项目,如足球、篮球等,以拓展机器学习在体育中的应用范围。
2. 数据收集应使用多个参与者,确保模型通用性。
3. 采用IMU传感器等收集多部位数据,利用深度学习优势,初始阶段可减少预处理,使用足够大规模数据集(推荐4000样本以上)。
4. 探索先进深度学习方法,如变压器网络、图神经网络等,以提升运动分析能力。
5. 注重识别对运动员训练有实际帮助的细微错误或偏差,将研究成果转化为实用的实时反馈应用,以提高运动员训练效果为目标,同时评估应用的实际效用和与传统方法相比的优势。
作者介绍:郭佰鑫(Max)
作者Max,一位大三的应用心理学本科生,社交自媒体平台专注于输出体育科技以及体育科学相关内容,期待未来有能力的基础下能加入更多基于人工智能的体育分析与科技。有其他科研合作的欢迎您的联系。
我比较喜欢体育科学、大语言模型以及数据相关的,平常运动喜欢篮球足球以及体能训练更加关注此方向的产品应用和创新。
(我有时候会看一些可穿戴设备、动作捕捉以及AI领域的科研、产品应用,欢迎交流,期待向各位学习!)
邮箱:gbx1220max@gmail.com 我的联系方式(微信): MaxGBX Linkedin领英:Baixin Guo 自媒体视频制作/公众号文章代做/翻译/AI智能体&工作流(大语言模型)搭建/科研&推文绘图/PPT制作也欢迎您的联系! 期待您的合作! ▼ 麻烦您带一下备注!