Blog

Utiliser l'apprentissage automatique pour répondre à des questions spécifiques au baseball

22 novembre 2017

Étant donné la nature du jeu au baseball, une grande partie des blessures surviennent lors d'incidents sans contact, ce qui signifie que la nécessité de mesurer et de contrôler la charge d'exercice aidera à réduire ces types de blessures.

Dans cette optique, l'équipe d'analyse de Catapult a mis en place un apprentissage automatique qui tire parti des milliers de points de données obtenus avec ses OptimEye S5 appareil. À l'aide de ces données brutes et de ces vidéos provenant de jeux et d'entraînements professionnels, Catapult a pu développer des algorithmes spécifiques au sport qui quantifient le volume et l'intensité d'activités telles que le lancer et le balancement de chauve-souris.

Les premiers tests ont prouvé un taux de précision supérieur à 90%, avec une fonctionnalité d'apprentissage automatique lui permettant de s'améliorer avec le plus de données qui y sont introduites.

Réduire la liste des personnes handicapées dans MLB

Études en Le Journal américain d'orthopédie ont montré que le nombre d'affectations de listes de personnes handicapées (DL) et le nombre total de jours DL ont augmenté d'année en année. Parmi les joueurs blessés sur le DL, les lanceurs sont plus souvent blessés et passent plus de temps sur le DL par rapport à tous les autres postes.

L'équipe d'analyse de Catapult a entrepris de quantifier les mouvements qui conduisent le plus souvent à ces blessures de surutilisation, avec la théorie selon laquelle la possibilité d'utiliser des données objectives sur le volume et l'intensité de ces mouvements donnera aux praticiens le pouvoir de contrôler les charges d'entraînement.

La fabrication d'un algorithme de baseball

Afin de quantifier des événements tels que les lancers et les mouvements de chauve-souris, un algorithme d'apprentissage automatique supervisé a été entraîné pour faire correspondre les lancers et les mouvements de chauve-souris collectés pendant l'entraînement aux lectures de l'appareil OptimEye S5.

Plus précisément, Catapult a construit un algorithme de forêt aléatoire basé sur des données collectées lors de séances d'entraînement de diverses équipes de baseball, à la fois professionnelles et collégiales. Les données d'entraînement contiennent des lectures d'accéléromètre et de gyroscope pour plus de 6 000 événements de lancers, de balançoires de chauve-souris, ou aucun, pour des dizaines de joueurs et diverses positions.

Un seuil sur la charge du joueur a été introduit afin d'isoler les événements explosifs des autres événements tels que la marche. Cela garantira que l'algorithme ne sélectionne que les lancers et les balançoires de type jeu.

Autour de chacun de ces événements, Catapult a étudié les caractéristiques obtenues à partir de l'accéléromètre tridimensionnel et du gyroscope tridimensionnel dans une fenêtre de deux secondes à partir de l'événement : une seconde avant et une seconde après. Des exemples de caractéristiques comprennent la valeur maximale, la moyenne et l'écart type pour la lecture des accéléromètres et des gyroscopes.

Chacune de ces caractéristiques a été saisie pour l'événement d'intérêt ainsi que sa classification en tant que lancer, balançoire de chauve-souris ou ni l'un ni l'autre pour créer un ensemble d'entraînement pour l'algorithme.

Résultats et discussion

Après avoir été exposé à un grand nombre d'exemples couvrant de nombreux lancers et mouvements de chauve-souris, l'algorithme a pu atteindre une précision de plus de 90% dans la détection des lancers et des mouvements de chauve-souris lors d'une séance d'entraînement. Les lancers détectés avec une excellente précision incluent :

  • Enclos des releveurs
  • Lancer du monticule au receveur
  • Des lancers de qualité pendant l'échauffement
  • Lancer longue distance pendant le fielding
  • Balançoires dans la cage ou pendant l'entraînement au bâton

L'estimation prudente reflète le fait que l'algorithme n'est configuré que pour compter les lancers et les balançoires suffisamment durs pour ressembler à un jeu (c'est-à-dire les lancers et les balançoires de « qualité »). La plupart des erreurs proviennent de lancers légers au début de la routine qui sont trop légers pour être comptés.

Après avoir classé une séance d'entraînement en balançoires, en lancers ou ni l'un ni l'autre, l'algorithme calcule la charge totale associée à chaque coup de chauve-souris et lancer. Diverses quantités telles que la charge moyenne des joueurs ou le temps moyen entre ces activités, ainsi que le baguage pour chaque lancer ou swing de chauve-souris, peuvent être obtenues via l'interface.

Les mesures de Catapult pour les lancers et les coups de batte permettent aux praticiens du baseball de contrôler le volume et l'intensité des mouvements clés qui entraînent des blessures dues au surmenage et coûtent des millions de dollars aux équipes professionnelles et collégiales chaque année. Ces mesures ont la capacité de dicter l'avenir de la périodisation de l'entraînement des lanceurs et des frappeurs pour les entraîneurs qui souhaitent une meilleure transparence de l'effet de l'entraînement dans un environnement réel.

Vous souhaitez savoir comment Catapult peut répondre à vos questions spécifiques au sport ? En savoir plus sur nos analyses de performance ici.