keyboard_arrow_uptop
Image credit: Joe Nicholson-USA TODAY Sports

Traducido por Marco Gámez

Baseball Prospectus está dedicado a entregar lo último en análisis e investigación beisbolística. Sin embargo, esta semana vamos a dar un paso hacia atrás y mirar algunas estadísticas que en un momento parecieron ser el futuro, o al menos pasar a formar una pequeña parte de él. El propósito de este ejercicio es el celebrar los pasillos y callejones de nuestro pasatiempo favorito dentro de nuestro pasatiempo favorito, al tiempo que damos un paseo por el cementerio estadístico del béisbol.

SIERA sonó como una explosión, cuando debutó en Baseball Prospectus durante la temporada invernal de 2010. Los articulistas Eric Seidman y Matt Swartz presentaron la métrica (el acrónimo significa Habilidades-Interactivas del Promedio de Carreras Limpias, SIERA, por sus siglas en inglés) como el estimador de carreras permitidas por un lanzador más preciso hasta la fecha. En poco tiempo, SIERA abrió un debate sobre el propósito de las métricas de los lanzadores, el mismo que todavía se desata de manera intermitente en la actualidad.

La base para la nueva estadística de Seidman y Swartz fue, al menos en parte, una reacción a la idea de la teoría de lanzamiento—independiente de la defensiva (DIPS) y FIP. La ideología reinante en ese momento, DIPS afirmaba que los lanzadores no tenían o tenían muy poco control sobre los resultados de las pelotas bateadas. SIERA prometió usar las características propias de los lanzadores para evaluar mejor qué tan buenos eran para prevenir batazos inatrapables, una contradicción flagrante y algo herética de la idea de Voros McCracken.

Pero la forma en que SIERA hizo eso tenía una gran complejidad. La fórmula original para SIERA dice así:

Obviamente, esa ecuación requiere más de un bocado. Contiene un par de términos al cuadrado que hacen que sea difícil saber cómo se relaciona un resultado dado (roletazo, ponche, etc.) con el producto final. SIERA también obtuvo información sobre la trayectoria de la pelota bateada en forma de términos de roletazo/batazo elevado/elevados de poca altura, un hito importante en la ruta hacia el uso de los datos más desmenuzados que tenemos hoy (ángulos de despegue y velocidades de salida, ay ay ay).

Los términos exponenciales en la ecuación permitieron a Seidmain y Swartz capturar relaciones no-lineales en los datos. En lugar de que un ponche contribuya con una cantidad fija al puntaje SIERA de un lanzador, un ponche para un lanzador de alto-K valía menos que para un lanzador de bajo-K.

El beneficio del cálculo elaborado de SIERA fue que predijo mejor la efectividad de un lanzador para la siguiente temporada que cualquier otra métrica disponible en ese momento. La explicación parecía ser que SIERA estaba capturando lo que hizo que los lanzadores fueran geniales: no solo sus habilidades para lograr los llamados “tres resultados básicos”, sino también su capacidad para evitar inatrapables cuando los bateadores ponían la pelota en juego. Pudo haber sido una afrenta contra los teóricos de DIPS, pero la habilidad profética de SIERA fue una clara validación del enfoque de Seidman y Swartz.

Por supuesto, ahora sabemos que la idea de que los lanzadores solo pueden controlar los tres resultados básicos es errónea. (Algunos defensores de lanzamiento-independiente de la defensa argumentaron que nunca fue la tesis, que querían decir que los lanzadores solo ejercían menos control sobre las bolas en juego, pero eso se contradice con el trabajo original sobre el tema). Los datos de velocidad de salida y de ángulo de despegue obtenidos por Statcast demuestran de manera concluyente que es falsa la idea de que los lanzadores no tienen relación con los imparables que permiten, por lo que en este sentido la métrica fue una revelación.

SIERA no tardó mucho en volverse bastante controversial. Dieciocho meses después de su debut, el entonces Director de Operaciones Estadísticas de Baseball Prospectus Colin Wyers (quien ahora ocupa un cargo en el departamento de analítica de los Braves) publicó un artículo denunciando la complejidad adicional de SIERA. “Simplemente no vale la pena pelear esa lucha que hay para reemplazar el FIP con fórmulas más complicadas que agregan poco en cuanto a calidad”, escribió. Wyers concluyó sentenciando:

“En resumen, los buenos resultados [predictivos] reclamados por SIERA son imaginarios al máximo, y nos sentimos bastante cómodos al superarla y avanzar”.

SIERA también se sintió cómoda al seguir adelante: Swartz lo resucitó en FanGraphs con algunos ajustes, donde todavía hoy vive feliz. (Destacó la importancia de la relación entre la tasa de ponches y BABIP en su re-estreno, subrayando nuevamente la forma en que SIERA desafió a DIPS).

Pero la métrica nunca ganó realmente la amplia aceptación que podría esperarse dada su precisión. SIERA tuvo problemas por algunas razones: una fue un malentendido estadístico en su composición, otra fue su complejidad.

Wyers tocó un punto importante en su devaluación a SIERA. La virtud predictiva de la estadística parecía provenir principalmente de hacer regresión a todos los lanzadores pesadamente hacia la media a diferencia de sus contrapartes. En lugar de concentrarse en las fuertes señales de los lanzadores que podrían tener un rendimiento superior o inferior, argumentó Wyers, estaba empujando a todos a la media. Es probable que los buenos lanzadores encuentren su rumbo hacia la mediocridad debido a lesiones o fallas y los malos (al menos, los que se quedaron en la liga) podrían obtener un rendimiento decente a través de un repunte explosivo o por agregar nuevos lanzamientos, pero SIERA no nos estaba diciendo mucho sobre cuáles jugadores individuales iban a sobresalir. Puede que esté en lo cierto la mayoría de las veces (gracias a la imprevisibilidad inherente a lo que es lanzar), pero no fue esclarecedor.

La raíz de los problemas de Wyers con SIERA era la duda sobre qué tipo de métricas de lanzamiento se supone que son. ¿Es el poder predictivo la única consideración? Si es así, SIERA (o un algoritmo de proyección) es la respuesta obvia, aunque insatisfactoria. Pero claramente también hay alguna necesidad de estadísticas para medir qué tan bien lo hizo un lanzador en un año determinado, independientemente de qué tan bien es probable que se desempeñe en el futuro. Claro, es probable que Kyle Hendricks no desafíe a DIPS para siempre, pero si está dominando la Liga Nacional en una temporada determinada, vale la pena señalarlo. (El valor principal de las estadísticas de lanzadores debe ser su capacidad “descriptiva”, en lugar de la “predictiva”).

La reprimenda de Wyers también reprochó a Seidman y Swartz por la complejidad de SIERA. Pero en última instancia, cada avance adicional en poder predictivo y descriptivo tiene el costo de al menos alguna complejidad adicional. Desde las fórmulas exponenciales que se desarrollaron hasta los modelos estadísticos modernos y robustos en los que Jonathan Judge ha sido pionero, cada salto hacia delante en el rendimiento ha traído una nueva arista en los métodos, los datos o ambos. Luego de que todas la frutas bajas ya han sido arrancadas, los expertos en Sabermetría deben recurrir a enfoques más sofisticados para extraer una capacidad más predictiva o descriptiva de las mismas estadísticas antiguas. Si diferentes constantes en la fórmula FIP pudieran producir resultados mucho mejores, alguien ya los habría encontrado.

A pesar de los contratiempos, SIERA se adelantó a su época en algunos aspectos. Mientras que la mayoría de los sabermetristas consideraron a las pelotas mal bateadas como resultado de la suerte, Swartz y Seidman trataron de explicarlas. SIERA también representó un abrazo de complejidad en un momento en que la simplicidad de FIP reinaba ampliamente. Los autores de SIERA estaban en lo correcto al decir que los resultados de bateo no son aleatorios. Tenían razón en que el camino a seguir en las métricas de lanzamiento tenía que ser métricas más complicadas. Estaban solo unos años por delante de los datos para probarlo.

Y SIERA finalmente condujo a una discusión más informada sobre lo que deberían ser las estadísticas de lanzamiento. La validez predictiva no es suficiente; las métricas también deberían explicar quién es bueno y por qué. Es posible que SIERA nunca se haya expandido al uso popular como lo hizo FIPS, pero representa un paso importante en el camino hacia mejores estadísticas en cuanto a lanzar se refiere.

Thank you for reading

This is a free article. If you enjoyed it, consider subscribing to Baseball Prospectus. Subscriptions support ongoing public baseball research and analysis in an increasingly proprietary environment.

Subscribe now
You need to be logged in to comment. Login or Subscribe