博客

使用机器学习来回答棒球特定的问题

2017 年 11 月 22 日

鉴于棒球比赛的性质,很大一部分伤害发生在非接触事件中,这意味着需要测量和控制运动负荷将有助于减少这些类型的伤害。

考虑到这一点,Catapult 的分析团队实施了机器学习,利用其获得的数千个数据点。 擎天柱 S5 设备。使用来自专业比赛和训练的原始数据和视频,Catapult 已经能够开发特定于运动的算法,量化投掷和挥棒等活动的数量和强度。

早期测试已经证明了超过 90% 的准确率,机器学习功能允许它随着输入更多数据而改进。

减少美国职业棒球大联盟中的残疾人名单

研究 美国骨科杂志 已经表明,残疾人名单(DL)分配的数量和DL天数的总数逐年增加。在 DL 的受伤球员中,投手更容易受伤,与其他位置相比,投手在 DL 上花费的时间更长。

Catapult 的分析团队着手量化最常导致这些过度使用伤害的动作,其理论是,能够使用这些动作的数量和强度的客观数据将使练习者有能力控制训练负荷。

棒球算法的制作

为了量化投球和击球等事件,我们训练了一个有监督的机器学习算法,将训练期间收集的投球和击球与来自 OptimEye S5 设备的读数相匹配。

具体来说,Catapult 根据从各种棒球队(包括职业和大学)的训练课程中收集的数据构建了一个随机森林算法。训练数据包含针对数十名球员和不同位置的超过 6,000 次投掷、挥棒或两者皆非的事件的加速度计和陀螺仪读数。

引入了玩家负荷的阈值,以便将爆炸事件与其他事件(例如步行)隔离开来。这将确保算法只选择类似游戏的投掷和击球。

围绕这些事件中的每一个,Catapult 研究了在事件发生后两秒的窗口内从 3D 加速度计和 3D 陀螺仪获得的特征:前一秒和后一秒。特征的示例包括加速度计和陀螺仪读数的最大值、平均值和标准偏差。

这些特征中的每一个都是针对感兴趣的事件及其分类为投掷、挥杆或两者都不输入的,以构建算法的训练集。

结果和讨论

在接触大量示例以涵盖许多投掷和挥棒动作后,该算法在训练期间检测投掷和挥棒动作时能够达到超过 90% 的准确度。以出色的准确度检测到的投掷包括:

  • 牛棚
  • 从土墩投球到接球手
  • 热身期间的质量投掷
  • 防守时长距离投掷
  • 在笼子里或在击球练习中摆动

保守估计反映了这样一个事实,即该算法仅设置为计算难度大到类似于游戏的投掷和挥杆(即“质量”投掷和球棒挥动)。大多数错误来自例程开始时的软投掷,这些软投掷太软而无法计数。

在将训练课程分为挥杆、投掷或两者都不是之后,该算法计算与每次击球挥杆和投掷相关的总负荷。可以通过界面获得各种数量,例如平均玩家负荷或这些活动之间的平均时间,以及每次投掷或击球的时间间隔。

Catapult 的投球和球棒摆动指标使棒球从业者能够控制关键动作的数量和强度,这些动作会导致过度使用伤害,并使专业和大学球队每年损失数百万美元。对于希望在现实环境中更好地了解训练效果的教练,这些指标能够决定投手和击球手训练周期的未来。

有兴趣了解 Catapult 如何回答您的运动特定问题? 在此处了解有关我们性能分析的更多信息.