keyboard_arrow_uptop
Baseball Prospectus Needs Your Help! Check out our call for contributors!
Image credit: Brett Davis-USA TODAY Sports

Traducido por Carlos Pérez 

Esto empezó (como muchas de mis cosas) con una pregunta sencilla. Una de las mejores cosas de vivir en la era de StatCast es que ahora tenemos buenas medidas de cosas que antes teníamos que adivinar. Hace un par de décadas (en serio) estaba intentando crear un indicador para ver qué tan rápido era un jugador. En ese tiempo teníamos que inferir la velocidad basado en cosas como qué tantas bases robó un jugador o cuántos dobletes convirtió en triples. Ahora, tenemos cámaras en todos los estadios que pueden medir en realidad qué espacio cubrió un jugador en una determinada cantidad de tiempo, que es la definición real de velocidad.

Me pregunto si cualquiera de esas antiguas métricas en las que solíamos confiar realmente medían la velocidad. Después de todo, el béisbol implica correr mucho, y si eres rápido, vas a ser capaz de llegar a la siguiente base más rápido, y tenemos muchos datos sobre bases. Por supuesto, el proceso de conseguir la respuesta a esa pregunta -y prometo que la responderé- resultó ser más interesante de lo que pensaba.

¡Cuidado! ¡Vienen detalles matemáticos escabrosos!

Usé los números de velocidad de sprint para 2019, que los puedes sacar de aquí. Vamos a usar eso como nuestra “verdad de fondo” para saber qué tan bueno es un jugador. La velocidad de sprint se refiere a qué tan rápido es un jugador en su pico de velocidad durante una “carrera competitiva”. Sabemos que a veces, si la jugada está clara, los jugadores aflojan un poco, así que la métrica solo usa situaciones en las que no hay incentivos para hacer eso.

Lo siguiente fue escoger los sospechosos habituales que usamos como indicadores de lo rápido que fue un corredor.

  • Superar rodados en el cuadro interior para conseguir imparables
  • Superar doble matanzas
  • Ratio de éxito de bases robadas
  • Si convirtió dobles en triples
  • Conseguir bases “extra” en situaciones de corredor, como ir de primera a tercera en un sencillo

También vi la ratio en el que un jugador hace un intento de hacer esto. Y añadí otra variable que he guardado todos estos años, que es el ratio en el que el corredor provocó un lanzamiento a primera con la segunda base descubierta (es decir, situaciones en las que podría estar tentado a robar).

En 2019, realicé correlaciones para todos los jugadores de la base de datos, y después para aquellos con 100 o más “carreras competitivas” en la base de datos de velocidad de sprint, con las ratios de cada jugador en cada uno de los indicadores.

Indicador Correlación con la velocidad de sprint Correlación con la velocidad de sprint (mín. 100 carreras competitivas)
Ratio de evitar dobles matanzas .414 .546
3B / (2B + 3B) .388 .548
Ratio de éxito de alargar triples .069 .052
Hits en el infield por cada rodado en el infield .556 .705
Ratio de éxito de bases robadas .213 .164
Ratio de éxito de base “extra” en juego (total) .198 .198 (sic)
  De 1ª a 3ª en un sencillo .010 .006
  De 2ª a home en un sencillo .167 .127
  De 1ª a home en un doble .201 .165
  De 2ª a tercera en elevado de out .048 .071
  De 3ª a home en elevado de out -.038 -.004
Ratio intentos .589 .680
Ratio de extender triples .394 .544
Ratio de intentos de bases “extra” (total) .329 .607
  De 1ª a 3ª en un sencillo .295 .461
  De 2ª a home en un sencillo .220 .364
  De 1ª a home en un doblete .302 .396
  De 2ª a tercera en elevado de out .064 .217
  De 3ª a home en elevado de ou .086 .081
Porcentaje de veces en primera provocando al menos un lanzamiento .651 .734

Tenemos una tabla interesante. La mejor correlación de velocidad de sprint es en realidad la situación en la tabla en la que el jugador en cuestión no está esprintando. Es una pequeña y extraña variable, porque no es una medida de velocidad. Es una medida de qué tan probable es que el lanzador (o lanzadores en general) piense que el jugador va a intentar robar base.

La conclusión aquí es que a la ratio en la que un jugador intenta ciertas maniobras encaja mejor con la velocidad de sprint que si lo consigue o no.

Algo de esto es por el tamaño de muestra. Por definición, el tamaño muestral de “no intentarlo” va a ser más grande (o al menos igual) que el tamaño muestral de “lo consiguió”. En tamaños muestrales pequeños, hay más espacio para el ruido dentro de una métrica, algo que no está bien cuando estás tratando de hacer una correlación. Busqué el problema a través de una ruta diferente que es algo más robusta contra esos problemas (aunque menos divertida de contar). Localicé todas las situaciones en 2019 que encajan con las de arriba (por ejemplo, encontré todas las instancias de un corredor en segunda cuando alguien pegó un sencillo). Codifiqué si un intento fue hecho como una variable binaria (sí/no), y en tal caso, si fue exitoso. Esto lleva a nuestro tamaño muestral a unos miles de instancias de cada tipo de evento. Usé una regresión logística con la velocidad de sprint prediciendo cada resultado (o intento al resultado) y una vez más, la fuerza de asociación (para los iniciados, usé la raíz R de Naglekerke como mi punto base) fue lo suficientemente fuerte para las variables del “intento” que para las variables del “éxito”.

Laos dos únicas ratios de “éxito” que funcionaron decentemente bien correlacionándose con la velocidad de sprint son superar los hits del infield y superar el final de una doble matanza. Lo que esos casos tienen en común (que otros no) es que esos son eventos selectivos. Un corredor (y su coach de tercera base) toman una decisión activa para intentar la base extra. En un rodado, el libro de reglas dice que tienes que correr a primera.

Eso importa, porque significa que probablemente tengamos una base sesgada. Los jugadores no solo intentan bases extra al azar. Antes de intentar ir a tercera, el corredor tiene que pensar “Sí, eso es una buena idea”. Por supuesto, hay otras variables que la velocidad que se consideran cuando un jugador intenta ganar una base extra. Dónde está la pelota, quién (si acaso alguien) la tiene, cuál es la fuerza relativa de su brazo, y la situación del juego se mezclan en algún lugar, pero el propio conocimiento del jugador de su velocidad será una consideración. Si asumimos que los jugadores (y entrenadores de tercera) son competentes averiguando las posibilidades de que el corredor consiga su objetivo, eso significa que la muestra de “lo intentó” está sesgada. Normalmente, pensamos que el aspecto clave de correr las bases es qué tan rápido es un jugador. ¿Qué pasa si en realidad es sobre qué tan rápido es procesando esa información y tomando esa decisión?

Asumimos que lo contrario de una base robada es que te cacen. En realidad, lo contrario de una base robada es un corredor que ni siquiera lo intenta. Más correctamente, sabemos que hay un límite de probabilidad de que un corredor lo consiga donde las matemáticas tengan sentido. (Si los jugadores siguen ese límite o algo más es otra historia). Cuando lo intenta, un jugador acepta algunos riesgos de ser cazado, pero el hecho de que lo haga significa que (al menos en su estimación) la elección tiene un valor esperado positivo. Si piensa que es demasiado lento para conseguirlo, y que su intento tendrá un valor esperado negativo, lógicamente pisa el freno y se queda. Funcionalmente, la velocidad no es la habilidad de ser exitoso en un intento de robar una base, sino la habilidad de que los intentos de robo tengan sentido. Ser rápido está bien, pero ¿qué pasa si ser listo sobre tus oportunidades que tomas es más importante?

Los jugadores más rápidos son más propensos a generar lanzamientos y los lanzamientos sirven un propósito, reducir el porcentaje de éxito de robos de base por unos puntos, aunque los datos muestran que no reduce los ratios de intentos de robos de base. Los lanzadores están reaccionando a la idea que un corredor puede hacer un intento dejándolo tan cerca de la baldosa como sea posible.

Thank you for reading

This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.

Subscribe now
You need to be logged in to comment. Login or Subscribe