Blog

Uso del aprendizaje automático para responder preguntas específicas sobre béisbol

22 de noviembre de 2017

Dada la naturaleza del juego en el béisbol, una gran parte de las lesiones ocurren en incidentes sin contacto, lo que significa que la necesidad de medir y controlar la carga de ejercicio ayudará a reducir este tipo de lesiones.

Con esto en mente, el equipo de análisis de Catapult ha implementado el aprendizaje automático que aprovecha los miles de puntos de datos obtenidos con su OptimEye S5 dispositivo. Usando esos datos brutos y videos de juegos y entrenamientos profesionales, Catapult ha podido desarrollar algoritmos específicos para deportes que cuantifican el volumen y la intensidad para actividades como lanzar y balancear el bate.

Las primeras pruebas han demostrado una tasa de precisión superior a 90%, con la funcionalidad de aprendizaje automático que le permite mejorar con la mayor cantidad de datos que se ingresan.

Reducir la lista de discapacitados en MLB

Estudios en La Revista Estadounidense de Ortopedia han demostrado que el número de asignaciones de lista de discapacitados (DL) y el número total de días de DL ha aumentado año tras año. Entre los jugadores lesionados en la lista de lesionados, los lanzadores se lesionan más comúnmente y pasan más tiempo en la lista de lesionados en comparación con cualquier otra posición.

El equipo de análisis de Catapult se propuso cuantificar los movimientos que más comúnmente conducen a estas lesiones por uso excesivo, con la teoría de que poder usar datos objetivos sobre el volumen y la intensidad en estos movimientos les dará a los practicantes el poder de controlar las cargas de entrenamiento.

La creación de un algoritmo de béisbol

Para cuantificar eventos como lanzamientos y golpes de bate, se entrenó un algoritmo de aprendizaje automático supervisado para hacer coincidir los lanzamientos y los golpes de bate recopilados durante el entrenamiento con las lecturas del dispositivo OptimEye S5.

Específicamente, Catapult construyó un algoritmo de Random Forest basado en datos recopilados de sesiones de entrenamiento de varios equipos de béisbol, tanto profesionales como universitarios. Los datos de entrenamiento contienen lecturas de acelerómetro y giroscopio para más de 6,000 eventos de lanzamientos, golpes de bate o ninguno, para docenas de jugadores y varias posiciones.

Se introdujo un umbral en la carga del jugador para aislar los eventos explosivos de otros eventos como caminar. Esto asegurará que el algoritmo elija solo lanzamientos y golpes de bate similares a los de un juego.

Alrededor de cada uno de estos eventos, Catapult estudió las características obtenidas del acelerómetro tridimensional y el giroscopio tridimensional dentro de una ventana de dos segundos desde el evento: un segundo antes y un segundo después. Los ejemplos de las características incluyen el valor máximo, la media y la desviación estándar para la lectura de los acelerómetros y los giroscopios.

Cada una de estas características se ingresó para el evento de interés, así como su clasificación como lanzamiento, swing de bate o ninguna para construir un conjunto de entrenamiento para el algoritmo.

Resultados y discusión

Después de estar expuesto a una gran cantidad de ejemplos para cubrir muchos lanzamientos y golpes de bate, el algoritmo pudo lograr una precisión de más de 90% en la detección de lanzamientos y golpes de bate durante una sesión de entrenamiento. Los lanzamientos detectados con excelente precisión incluyen:

  • Toril
  • Lanzamiento de montículo a receptor
  • Lanzamientos de calidad durante el calentamiento
  • Lanzamientos de larga distancia durante el fildeo
  • Columpios en la jaula o durante la práctica de bateo.

La estimación conservadora refleja el hecho de que el algoritmo solo está configurado para contar lanzamientos y golpes que son lo suficientemente duros como para ser similares a los de un juego (es decir, lanzamientos de "calidad" y golpes de bate). La mayoría de los errores se deben a tiros suaves al comienzo de la rutina que son demasiado suaves para ser contados.

Después de clasificar una sesión de entrenamiento en columpios, lanzamientos o ninguno, el algoritmo calcula la carga total asociada con cada golpe y lanzamiento de bate. Varias cantidades, como la carga promedio de jugadores o el tiempo promedio entre estas actividades, así como las bandas para cada lanzamiento o swing de bate, se pueden obtener a través de la interfaz.

Las métricas de Catapult para lanzamientos y golpes de bate permiten a los practicantes de béisbol controlar el volumen y la intensidad de los movimientos clave que conducen a lesiones por uso excesivo y cuestan a los equipos profesionales y universitarios millones de dólares cada año. Estas métricas tienen la capacidad de dictar el futuro de la periodización del entrenamiento de lanzadores y bateadores para los entrenadores que desean una mayor transparencia en el efecto del entrenamiento en un entorno del mundo real.

¿Le interesa saber cómo Catapult puede responder a sus preguntas específicas sobre deportes? Obtenga más información sobre nuestro análisis de rendimiento aquí..