keyboard_arrow_uptop
BP360 is Back! One low price for a: BP subscription, 2022 Annual, 2022 Futures Guide, choice of shirt
Image credit: USA Today Sports

Traducido por José M. Hernández Lagunes

 La semana pasada escribí acerca del mal praxis estadístico de la cuestión anual sobre algún jugador que contiene la frase “llegamos al punto en donde el Jugador X ya lleva Y apariciones al plato y podemos confiar en sus números”. Estos números que significan dicho umbral tienen como objetivo señalar el punto donde la distribución de todos los jugadores se convierte “lo suficientemente estable”. El problema es que todo sobre lo que queremos escribir son los puntos rezagados en esos datos en los bordes de la gráfica. Esos puntos marcan a quienes están teniendo un tremendo (o pésimo) inicio de temporada. Ellos son, por definición, las excepciones a la regla; y eso los hace más interesantes. Nadie quiere leer sobre cómo el Jugador Y está haciendo exactamente lo que hizo el año pasado.

Pero esto nos genera un problema: los jugadores escogidos quienes están al borde de la distribución son quienes (¿todavía?) no regresan al grupo. Obviamente algo pasó. Una posibilidad es que han tenido suerte. Otra es que han trabajado en un nuevo talento y lo han aterrizado. Tal vez sea un poquito de las dos. Pero si es suerte, esta es aleatoria, así que contar con que seguirá resulta peligroso. El jugador probablemente regresará a donde históricamente siempre ha estado. En contraparte, si es una habilidad, podemos asumir que esta es estable, y de ser así, podemos esperar que su nuevo rendimiento continúe.

¿Entonces cuál es? Esta es la verdadera pregunta que debemos contestar. Y más al punto, ¿cuándo será momento para escribir mi artículo descubriendo qué fue lo que se le metió a Mitch Moreland? Necesitamos una forma más robusta de analizar la pregunta que no sólo sea “pues ya alcanzó X número de apariciones al plato”.

¡Advertencia! ¡Cruentos detalles matemáticos a seguir!

 No vamos a responder la pregunta hoy. Solamente vamos a delimitar lo que es posible. Pero antes de eso, vamos a armar el argumento. Hoy utilizamos datos de 2003 a 2017. Tomé a todos los bateadores con al menos 250 apariciones al plato el año anterior y luego me fijé en sus primeras 100 apariciones al plato al siguiente año. Busqué jugadores quienes redujeron en 20% o más su tasa de ponches (por aparición al plato) del año anterior en esas 100 apariciones. (Para los conocedores, usé el cambio porcentual sobre la base.) Ellos son los cortadores de ponches tempraneros.

Me aseguré de que todos esos desvíos de la media tuviesen al menos 150 apariciones al plato después de las primeras 100 (obteniendo al menos 250 apariciones durante la temporada), y miré qué tanto se poncharon desde la aparición 101 (después de su fulgurante inicio) hasta el final de la temporada. Observé cuantos bateadores en la muestra mantuvieron o no una tasa de ponches inferior durante el resto de la temporada (sin incluir su buen inicio; aparición al plato 101 en adelante), y en esta ocasión definida como una disminución de 10% o mayor entre temporadas (con cambio porcentual sobre la base, nuevamente). No esperábamos que todos mantuvieran sus ganancias, pero debieron mantenerse significativamente por debajo en su tasa de ponches después del fuerte inicio.

Existen 768 casos en esa ventana de 15 años que cumplen con los criterios y el 40.9% de ellos resultaron “exitosos” manteniendo esa tasa de ponches. No me apena admitir que me fui a pescar datos después de esto. Acomodé una serie de factores de predicción de regresión lineares, incluyendo varias estadísticas de la temporada anterior completa (tasas de ponches y bases por bola), estadísticas de los comienzos fuertes, y diferencias entre esas estadísticas. No buscaba los factores que pudiesen predecir si el despunte era auténtico o no (ya nos meteremos en eso en un momento). Lo que me interesó fue si el programa pudiese crear una buena clasificación con tan sólo los datos de 100 apariciones al plato. (Para los conocedores, utilicé un corte de clasificación del 50%, lo que significa que el programa proyectó los momios de cada caso si creía o no que el jugador iba a continuar su racha. Ya que teníamos las respuestas, podíamos graficar la eficacia del programa.)

“Fracaso” pronosticado por el modelo “Éxito” pronosticado por el modelo
“Fracaso” real 400 54
“Éxito” real 235 79

Ahora podemos ver que de aquellos jugadores quienes el modelo pronosticó que iban a mantener su nivel, 59.4% lo logró. Sin embargo, el 37% mantuvieron su nivel a pesar de que el modelo predijo una regresión. Vemos que el modelo empieza a obtener claridad y es superior a la mera fortuna, pero todavía existe ruido que debemos controlar.

Podemos ingresar a una rama de las matemáticas llamada “teoría de detección de señales”, la cual puede ofrecernos números importantes, la “sensibilidad” de los pronósticos, la cual es una medida de qué tan bueno es un modelo al separar los éxitos (en términos de detección de señales, las señales, valga la redundancia) de los fracasos. Este modelo tiene una sensibilidad de 0.569. Este número no tiene una unidad asociada a él—no hay respuesta a 0.569… ¿qué? — pero entre más alto, mejor.

¿Qué crees que podría pasar si alteramos las cosas un poquito? Nuevamente busqué arranques fuertes en esa ventana de 15 años, pero en esta ocasión usé las primeras 150 apariciones al plato. Me aseguré de que el jugador en cuestión tuviese al menos 150 apariciones más durante la temporada, para un nuevo total de 300, y corrí el mismo análisis que hice anteriormente. En esta versión, el modelo tuvo sensibilidad de 0.718.

¿Recuerdas cuando dije que no quería hablar sobre qué variables pronosticaban si un jugador podría mantenerse? La razón es que, en esa regresión, las diferentes variables se despejaron cada vez. Esto significa que el modelo es libre de construir cada juego de variables que le conviene más a cada clasificación, pero no nos dice mucho sobre qué variables hay que buscar. Existen algunas similitudes aquí: entre mayor diferencia hay entre el año pasado y el “arranque fuerte”, existe menor posibilidad de que el jugador no mantenga ese nivel de juego. Podríamos encontrar un juego de variables que rindan igual de bien, y como podemos observar, la sensibilidad de cada función sube en cada ocasión.

(Hay un segundo número, producido por la teoría de detección de señales, el cual es una medida del sesgo de la respuesta. Nos dice de los dos tipos de errores que la función puede cometer—pronosticando que el despunte se mantendría, pero no se logró vs. pronosticando que no se mantendría, pero se logró—y cual es más probable que se cometa. Esto es importante saberlo si eventualmente queremos utilizar este método para identificar casos individuales de jugadores como buenas apuestas para continuar o no sus despuntes, pero por ahora nos vamos a brincar esto.)

Y esto genera otro problema. Incrementé el tiempo a quienes no se poncharon durante su año de despunte después de 200 apariciones al plato. En este punto, el jugador tiene una suerte inmensa o comenzamos a creer que verdaderamente existe un cambio y mejora de sus habilidades como pelotero. Al avanzar la temporada, el número de jugadores que tuvieron tal despunte se reduce notablemente. Utilizando una regresión logística, sólo obtuve sensibilidad de 0.569, bajando. Es probable que ese número sólo vibre en el rango entre .5 y .7.

En realidad, esto nos da una idea básica a principio de temporada si los despuntes serán duraderos o no, y mejora un poco nuestro instinto de suposición. Sin embargo, hay mucho espacio para el error. No nos otorga certeza como si obtuviésemos un número de apariciones al plato y exista una base para decir que todo está bien, pero nos da algo estadísticamente defendible. Aquí tenemos la base de trabajo para encontrar el punto en el cual rebasemos el umbral auténtico para poder escribir artículos que se basan en la suposición de que existe un momento donde la “temporada ya es de verdad”.

Thank you for reading

This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.

Subscribe now
You need to be logged in to comment. Login or Subscribe