keyboard_arrow_uptop
Image credit: © Robert Hanashiro-USA TODAY Sports

Traducido por Carlos Pérez 

Uno de los preceptos del dogma estadístico del béisbol es la noción del verdadero talento: que cada jugador tiene un nivel de habilidad base sobre el cual su rendimiento fluctúa. Esta idea motiva a muchos cazadores de mitos sabermétricos, como analistas que critican a los managers por dejar como titulares a muchos jugadores que rinden por encima de su valor real, o comentaristas que hablan de datos sesgados, como enfrentamientos entre jugadores particulares. Que un grupo nutrido de jugadores parezca batear bien los martes de junio no tiene nada que ver con su habilidad elevada, sino con la suerte y el ruido.

Pero conforme la sabermetría ha continuado su avance y hemos tenido acceso a mayores y más sofisticados datos, hay razones para dudar de la idea de que los jugadores tienen solo un verdadero nivel de talento al que siempre regresan. Una razón para esto es la medida de la velocidad de las bolas rápidas, que se correlaciona fuertemente con el nivel de rendimiento de un lanzador y es bastante estable de lanzamiento a lanzamiento e incluso de juego a juego. Con un poco de análisis sofisticado sobre la velocidad de las bolas rápidas, es posible detectar cuando los lanzadores están “fríos” y “calientes”, y ese conocimiento puede tener impactos significativos en las probabilidades de victoria o derrota de su equipo, especialmente en las series cortas de octubre.

Ya hablé sobre las rachas calientes y frías con Greg Matthews en FiveThirtyEight, allá por 2017. En ese artículo, usamos un enfoque estadístico llamado el Modelo Oculto de Márkov para detectar cuándo las habilidades de los lanzadores estaban por encima y por debajo de sus niveles típicos, según nos decían sus velocidades de bolas rápidas. Cuando las velocidades de las bolas rápidas eran elevadas, nos dimos cuenta de que todo su rendimiento subía significativamente, incluso en el resto de los lanzamientos: sus curvas se movían más, tendían a generar más ponches y demás.

El Modelo Oculto de Márkov que usamos básicamente intenta reconstruir en qué estado se encuentra un lanzador, frío o caliente, basado en esa única métrica de velocidad de bola rápida. Pero hay muchas cosas en ese modelo para maximizar la señal que podemos extraer: ajustamos según el estadio, la temperatura o el nivel de fatiga del lanzador y otras cosas, y permitimos a los lanzadores individuales tener diferentes niveles de “frío” o “calor”. Ya que el modelo parecía una caja negra para mucha gente (aunque posteamos el código en GitHub), generó muchas críticas y muchos ignoraron nuestros hallazgos.

Pero hay una manera estadística más sencilla de conseguir el mismo fenómeno sin ningún modelo complejo. Puedes ver la misma señal simplemente promediando la velocidad de la bola rápida de un lanzador en cada apertura y después mirar la correlación con la velocidad de su bola rápida en el siguiente juego.

Ya que cada lanzador abridor tiene su propia secuencia de velocidades, al hacer esto tienes alrededor de 150 cocientes de correlación en toda la liga en 2021. La correlación promedio general entre todos los abridores de apertura a apertura es de apenas 0.25, o sea una relación débil, que explica solo el 6% de la variación entre la velocidad de las bolas rápidas de un lanzador estándar.

Pero hay más en esta historia que el promedio. Algunos lanzadores muestran rachas remarcables, con correlaciones de apertura a apertura de 0.6 a 0.7. Para estos abridores, qué tan fuerte lancen la bola en el juego anterior es un predictor potente de qué tan fuerte la lanzarán en cuatro días (cinco si estás en Milwaukee), y, además, qué nivel de “verdadero talento” es probable que muestren.

Drew Smyly, abridor de los Atlanta Braves, muestra la mayor correlación de cualquier abridor con al menos 15 juegos en los registros. Su cuadro de velocidad de bola rápida de Brooks Baseball cuenta su historia. La rápida de Smyly ha variado en velocidad promedio desde un máximo de alrededor de 92.8mph y un mínimo de 90.6. El patrón no es aleatorio: sus mejores bolas rápidas más tuvieron lugar al principio de la temporada, en mayo, junio y julio, pero esta velocidad se enfrió en agosto, antes de que los Braves lo convirtieran en relevista en septiembre.

Sus resultados han variado junto con esa velocidad. Sus dos mejores meses como abridor fueron junio y julio, con una ERA por debajo de 3.5. Sus bajos agosto y mayo bajan su promedio, lo que significa que su temporada tuvo dos grandes partes diferenciables. Dos millas por hora pueden parecer poco, pero según la vieja regla de Mike Fast, eso puede equivaler a un lanzador con una ERA de 0.5 carreras más alta. No es que Smyly se haya convertido en Jacob deGrom en sus aperturas “calientes”, pero es útil saber si la velocidad de su última apertura estuvo más cerca de las 93 que de las 91.

Lo que causa estas rachas de velocidad fría y caliente y el rendimiento nunca está claro. Pero en algunos casos, hay candidatos obvios. Por ejemplo, Symly sufrió una lesión de rodilla a finales de julio que podría haber alterado su velocidad y arruinado su rendimiento en agosto. Las lesiones son probablemente una de las primeras causas de bajo rendimiento, pero como no todas las lesiones salen a la luz (probablemente ni los entrenadores sean conscientes de algunas, y otras ni siquiera sean detectadas por los jugadores) no hay una correlación uno a uno entre lesiones y rachas.

Sean cuales sean las razones, está claro que la vieja noción de un único nivel de “talento verdadero” del que los jugadores parten cada día, sin excepción, no se sostiene para todos los lanzadores. Para muchos, parece haber una serie de aperturas donde exceden sus proyecciones y otras donde se quedan cortos. Y todas esas rachas se vuelven especialmente importantes en los días de máxima tensión de los playoffs, y en particular los juegos de comodines. Una diferencia de 0.5 carreras de ERA puede significar un cambio de probabilidad de victoria del 5-10%, dependiendo de los lanzadores, alineaciones y equipos que estén involucrados.

Conforme progresan los playoffs, los datos de los partidos siguientes puede añadirse al modelo. Los lanzadores en rachas como la postemporada 2016 de Madison Bumgarner deberían ser detectables ahora con la información completa de los juegos de octubre gracias a Statcast, que nos da una nueva ventana sobre cómo y por qué los playoffs pueden ser endiabladamente impredecibles. En un contexto de máxima presión como es la postemporada, un lanzador en una racha caliente puede ser la diferencia entre ganar la Serie Mundial y una eliminación decepcionante en los playoffs.

Thank you for reading

This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.

Subscribe now
You need to be logged in to comment. Login or Subscribe