jueves, 7 de mayo de 2009

Estadísticas Aplicadas Al Juego de Béisbol (Material Del Examen Final De Estadísticas)

Las estadísticas aplicadas al juego de béisbol es una de tantas ramas que pueden ser aplicadas en la Estadística. Se utiliza para predecir el rendimiento de un jugador o equipo y obviamente, para el entretenimiento del público en general. ¿Por que elegí para discutir este tema en especifico?; Primeramente: Conozco bien el tema, puedo explicar profundamente la mayoría de sus aspectos estadísticos y mecánicos; Segundo: Existe basta información de vital importancia para los invertidotes de equipos y seguidores del juego; Y tercero, es un tema que se tocado a poca profundidad y necesita de mas estudio.

¿Que temas voy a tocar en esta presentación? Primero, entrare de lleno a la aplicación estadística matemática del juego de béisbol; Luego, entrare en el tema física estadística y su mecánica; Y después, entrare en la parte tan importante y del poco tema investigado, de la combinatoria en el béisbol y sus aplicaciones.

I. Aplicación estadística matemática del juego de béisbol.

El promedio de bateo o “AVG.” es el número mejor conocido en el Béisbol, va desde 0 hasta 1, es solo una medida de porciento. Este promedio se obtiene del total veces que el jugador conecto un sencillo, doble, triple o cuadrangular; sobre el total de veces que bateo, sin contar las bases por bolas, pegadas de bolas y los sacrificios. El número promedio de cualquier jugador en las grandes ligas siempre se ha mantenido en .300, que significa que al jugador lo sacan fuera (out) dos de tres veces aproximadamente, considerando la tarea difícil del bateador. Existen ocasiones en donde el bateador empieza la temporada encendido, bateando por encima de .500 pero siempre en el transcurso de la temporada su promedio se ajusta y baja hasta por encima de .300. Ted Williams con promedio de sobre .400 fue el único jugador que pudo conservar su promedio por toda la temporada. La mayoría o empiezan encendidos, bateando sobre .500, una parte que se conserva en .300 y la gran mayoría empiezan por debajo de .300. Los que empiezan por debajo de .300 tienden a esforzarse por mantener el promedio de .300, al igual que los otros. Es un numero mágico en el Béisbol y su casualidad prueba de que solo batearas bien en el juego una o dos veces, dependiendo de las veces que vayas a batear. Con eso se prueba que a pesar de que se pueda comprar cualquier jugador, siempre correrás con en el mismo promedio de bateo y que se sabe que su desempeño va a ser el mismo de uno que juega por menos dinero. Aunque a veces, el entusiasmo lleva a cualquier jugador que juega prácticamente de gratis a trabajar mejor que uno que gana sus 10 millones al año. El numero mágico de .300 lleva también a los espectadores con una gota de aliento para que el jugador impulse la carrera ganadora o llegue su tanto esperado cuadrangular.

No solo el promedio “AVG.” es la única estadística usada para reclutadores y buscadores de talento, también buscan a un jugador, por su capacidad de correr “SB” en bases robadas, batear con fuerza, que incluyen los cuadrangulares “HR” y las carreras impulsadas “RBI”. También el porcentaje de llegar a bases “OBP” versus su capacidad de no poncharse “SO”; su capacidad para jugar defensa; pero también uno que lo haga todo, que es casi imposible de encontrarlo hoy día. El punto es, que se basan en varias estadísticas para conseguir a un jugador que se acomode bien a su equipo. Por ejemplo, si el equipo no esta anotando carreras porque su equipo no corre las bases, entonces, necesitamos velocidad en las bases, y lo mismo viceversa. Se hace un estudio estadístico para determinar cual es el jugador que necesita el equipo y cual se puede comprar con su prosupuesto, que ya dije, que puede variar su desempeño y no necesariamente tiene que ver su desempeño con lo que gane el jugador. En la siguiente tabla se puede ver un ejemplo de la estadística utilizada para un busca talento:


Marcos Peña

Avg. .286 HR. 13 RBI. 25 OBP. .415 SO. 35 SB.17


Juan Lopez

Avg. .309 HR. 5 RBI. 18 OBP. .689 SO. 15 SB. 35


Luis Ramos

Avg. .274 HR. 47 RBI. 115 OBP. .425 SO. 81 SB. 2


En la tabla anterior se puede utilizar para conseguir talento para su equipo, si necesito velocidad en las bases y un primer bate, seguramente escogería a Juan López, porque tiene .309 de promedio, .689 de capacidad de llegar a bases y 35 bases robadas. Si quisiera un tercer bate o cuarto para impulsar carreras seguramente escogería a Luis Ramos, que tiene 47 cuadrangulares, 115 RBI. Pero Marcos Peña podría ser un jugador promedio que hace cualquier cosa que probablemente esta en la liga porque sabe jugar defensa en conjunto con su sólido promedio de .286. De esta forma muy similar equipos con un bajo prosupuesto llegan a la Serie Mundial como fue el caso de los Tampa Bay Rays en el 2008, los Rockies de Colorado en el 2007 y los Marlins de Florida en el 2003.

En el caso de los lanzadores, que tienden a dominar a los bateadores es un poco distinto su forma de buscar talento. Ahora su promedio es llamado ERA, que es el promedio de carreras permitidas por un lanzador en juego completo. Se utiliza la siguiente formula para sacar su efectividad o ERA = (((H + BB + HBP)×PTB)/(BFP×IP))×9 − 0.56, donde H= Hits Permitidos, BB = Base por bola permitidas, HBP = Bolazos permitidos , BFP = Bateadores enfrentados al lanzador, IP = son las entradas lanzadas y PTB = (0.89×(1.255×(H − HR) + 4×HR) + 0.56×(BB + HBP − IBB)) , donde IBB= Bases por bola intencional. Estadísticamente, un ERA efectivo esta por debajo de 4.00 en las Grandes Ligas, para que se tenga una idea de cuantas carreras debería permitir un lanzador por juego.

La estadística básica de los lanzadores depende del ERA, las entradas lanzadas “IP”, y los Ponches que pueda dar el lanzador “SO”. Mientras mas pequeño sea el número del ERA, y otras estadísticas como las bases por bolas, mejor es la calidad del lanzador. Versus mientras mayor sea la cantidad de entradas lanzadas y ponches, obviamente mejor es la calidad que tiene el lanzador. Son precisamente esos dos atributos que buscan los busca talento, su efectividad y consistencia; pero también, por supuesto, su capacidad de trabajar bajo presión.

II. El tema física estadística y su mecánica

El tema de la física del béisbol ha sido un tema interesante para los matemáticos, especialmente los que adoran al béisbol. Puede medirse muy bien con formulas de física elemental y avanzada. Su aplicaciones en el tema de “momentum” en física nos lleva a la conclusión de que si es posible medir estadísticamente sus mecánicas. El tema que voy a tocar aquí trata de la física de batear, lanzar y el vuelo de la pelota. Para empezar el pegarle bien a la pelota depende de: Primero: Si el bateador tiene un buen contacto y ve bien la pelota; Segundo: Debe usar el bate apropiado para su estatura y peso; Tercero: debe tener fuerza para darle velocidad al bate en el momento del contacto. Específicamente, la fuerza en el bate hace la diferencia entre un cuadrangular o doble, versus un “out” sencillo en campo de adentro o un bombo en cualquier parte del campo. Por ejemplo: una velocidad de bate de 40 millas por horas (que es muy veloz) puede desaparecer del parque casi cualquier pelota que le lancen, especialmente si es una bola con mucha velocidad. Una bola con mucha velocidad por parte del lanzador tiene mas probabilidad de convertirse en imparable o “hit”, que un bola con menos velocidad. Es lo que dicen las leyes de “momentum” de física conjunto con las 2da ley de movimiento de Newton de acción y reacción. Mientras mas velocidad choquen dos objetos mayores es su velocidad de repulsión, y en el béisbol, no es la excepción.

El vuelo de la pelota es cuando la pelota bateada viaja cierta distancia a través del aire. Supongamos que la pelota viaja por el aire con una elevación 45 grados de inclinación hacia arriba, saliendo desde el bate como punto de contacto, los siguientes datos y velocidades con respecto a la distancia y el tiempo que es 2.5 segundos se pueden apreciar en la segunda tabla:

Velocidad de Pelota Lanzada Tiempo Distancia Recorrida

70 MPH 3 Sec. 310 Pies

75 MPH 3 Sec. 330 Pies

80 MPH 3 Sec. 350 Pies

85 MPH 3 Sec. 375 Pies

90 MPH 3 Sec. 400 Pies

95 MPH 3 Sec. 420 Pies

Simulando el vuelo de un cuadrangular, un lanzador que le lance a un bateador con una recta de 95 MPH o mas y le hace contacto, se puede decir que la desapareció del parque con su trayectoria parabólica. Claro, como ya dije esto también tiene que ver con la velocidad en que el bateador le puso al bate. Pero dejándome llevar de estos datos me ayudan a notar que el beisbolista que quiera batear una pelota a 95 MPH con fuerza, pues necesita menor velocidad con el bate y así se obtiene mejor contacto. La ventaja de lanzar una recta arriba de las 90 MPH es que es difícil para que el bateador reaccione, pero menos velocidad del bate necesita el bateador para hacer contacto y es más fácil dar un cuadrangular. Pero la ventaja de una pelota a 70 MPH no es mucha, si el pelotero tiene mucha fuerza puede ajustarse con el lanzamiento y tiene mas tiempo para ver la bola y hacer contacto. Pero aunque alguien con poca fuerza en los brazos, también puede ser útil estos datos, por ejemplo: El pelotero puede batear con fuerza las bolas rápidas y los cambios los puede conectar en el “Gap” (distancia entre el campo de adentro y campo de afuera). Así que siempre son útiles estos datos para cualquiera.


III. La combinatoria en el béisbol y sus aplicaciones en estadística.

En cada situación del juego de béisbol se compone de un plan para llevar a cabo, por ejemplo: El lanzador tiene un lanzamiento a seguir para sacar fuera o ponchar un bateador, versus por supuesto un bateador que esta buscando un lanzamiento para mandarlo al jardín derecho central “GAP”. Todo bateador que quiera evitar poncharse o evitar batear a un lanzamiento malo, debe siempre de buscar la “base por bolas”. Debido a eso también tiene que tener conocimiento de su zona de “Strikes”. La zona del “Strike” es la zona que mide la distancia horizontal del plato y verticalmente la distancia desde los brazos hasta las rodillas, en donde se considera que el bateador puede conectar bien en cualquier parte de esa zona. La zona del “Strike” se compone de 9 zonas adjuntas como aparece en el siguiente diagrama:


__________________________________________
| | | |
Adentro Arriba | Centro Arriba | Afuera Arriba |
| | | |
__________________________________________
| | | |
| Adentro Centro | Centro | Afuera Centro |
| | | |
___________________________________________
| | | |
| Adentro Abajo | Abajo Centro | Afuera Abajo |
| | | |
___________________________________________


La tabla anterior se refiere a un bateador derecho mirando hacia el lanzador. La zona en donde mayormente un bateador batea mejor es en el centro y arriba, y donde mayormente el bateador batea mas pobre es abajo y afuera. Pero, depende de cada bateador en especifico, por ejemplo, en la siguiente tabla se obtienen las siguientes zonas que domina bien un bateador, denominadas: zonas calientes; y las que domina muy poco, denominadas: zonas frías; y las neutrales, que puede que las domine o no:



__________________________________________
| | | |
| Neutral | Caliente | Caliente |
| | | |
__________________________________________
| | | |
| Neutral | Caliente | Caliente |
| | | |
___________________________________________
| | | |
Fría | Neutral | Neutral |
| | | |
___________________________________________

Esta tabla que puede ser de un bateador derecho, implica su tendencia batear hacia el lado contrario, y su incapacidad para batear los lanzamientos adentro. Los lanzadores conociendo esta estadística, seguro buscaran la forma de lanzarle adentro lo mas que puedan. Pero, ojo el lanzador no puede enamorarse de esa zona, el bateador puede hacer sus ajustes y conectar bien en el próximo turno. Por eso es que no hay manera segura de sacar fuera a un bateador, tal vez se le haga difícil obtener la extensión o ver bien la bola en esa zona cuando el bateador no lo espera.

El tema que quiero llevar aquí es: ¿Cómo un bateador, conociendo la estadística, puede conectar de “hit” o imparable? Primero: El bateador tiene que conocer bien su zona del “Strike” como ya dije. Y Segundo: El bateador debe buscar un lanzamiento en especifico que pueda halar o depositarlo en la banda contraria. Primero que nada, el lanzador tiene casi siempre tres o cuatro lanzamientos que puede tirar en la zona del “Strike”. Voy a poner en ejemplo tres lanzamientos que puede tirar el lanzador, conociendo que los puede tirar en cualquier momento como “strike” y que tiene la misma acción de su brazo. O sea que cuando el lanzador lance puede lucir a ojos del bateador como cualquiera de los tres lanzamientos. Explicando lo difícil de adivinar un lanzamiento, porque el bateador si va a adivinar un lanzamiento, para batear más efectivamente; tiene por ende que escoger entre tres posibles lanzamientos que el lanzador pueda tirarle y también escoger entre las 9 zonas del “Strike”. Que además de eso el bateador no debe batearle a un lanzamiento fuera de la zona, debido a que puede conectarle mal o poncharse. Así que haciendo los cálculos de combinatoria, llegamos a la siguiente conclusión:

3 lanzamientos distintos X 9 zonas de “Strike” = equivale a 27 posibles lanzamientos en cualquier momento.

Sin incluir los arreglos de lanzamientos, lanzamientos que parecen estar en la zona, pero en lo último caen fuera de la zona del “strike”; los beisbolistas tienen que adivinar un lanzamiento de 1 entre casi 27 posibles a ocurrir. Es por eso que los bateadores hacen bien bateando solo .300, por su dificultad en conectar. Se ve claramente que el lanzador tiene toda la ventaja del mundo, porque el solo los codifica, el bateador tiene que decodificarlo. El bateador, por eso busca en el centro, para buscar un lanzamiento y después hace sus ajustes en la zona y por eso logra batear; en una de sus descuidos del lanzador, deja un lanzamiento en el medio o cuelga una curva; es cuando los bateadores aprovechan batear. En resumidas cuentas casi siempre que hay un cuadrangular o varios cuadrangulares en el juego es debido a que el lanzador coloco incorrectamente un lanzamiento en el medio o una curva que no rompió lo que debía y se quedó en el medio; o si no por supuesto, el bateador se sentó o adivino el lanzamiento que venia hacia a el plato. Es difícil para los atletas adivinar 1 entre 27, pero las Grandes Ligas están lleno de eso. Por eso no me extrañaría que Japón siendo campeón mundial tenga esa actitud de deducción matemática que se necesita para jugar al béisbol.

La siguiente es una simulación de cómo adivinar un lanzamiento en un turno al bate. Teniendo las 9 zonas del “Strike” y tres lanzamientos diferentes con la misma acción del brazo. Se van a simular los lanzamientos del lanzador y la reacción del bateador a cada uno de ellos. Primero Tengamos la siguiente zona que domina este bateador derecho:


__________________________________________
| | | |
| Caliente | Caliente | Caliente |
| | | |
__________________________________________
| | | |
| Caliente | Caliente | Neutral |
| | | |
___________________________________________
| | | | Neutral | Neutral | Fría |
| | | |
__________________________________________

Primer lanzamiento: { (Fastball) Abajo Afuera, el bateador se queda mirando}, el lanzador primeramente se asegura en conseguir el primer “strike” en la zona fría, ya que después de eso consigue estar sobre el bateador.
Segundo lanzamiento: {(Fastball) Abajo Afuera como “Bola”, la deja pasar}, en este caso, el bateador deja pasar la bola, quizás la ve mala, estaba buscando otro lanzamiento, o estaba buscándola adentro. “Los lanzadores tienden a lanzar bolas malas adrede, primero: porque a veces los bateadores tienden a seguirla y hacen mal contacto o no hacen ninguno. Segundo: Si la tiran como “Strike”, ya tienen dos “Strikes” y el lanzador ¡solo necesita tres! Tercero: Es una bola con velocidad y de difícil contacto en esa zona, y en especifico, para ese bateador. Cuarto: La probabilidad de que sea el mismo lanzamiento esta dada por: (1/27)*(1/27)= (1/729).
Tercer Lanzamiento: {(Slider) Abajo Afuera en la tierra, el bateador lo deja pasar}. El lanzador vuelve a tirar un lanzamiento en la misma zona, solo que es un “Slider” en la tierra. El “Slider” se ve en los ojos del bateador como una recta y cuando esta llegando al plato rompe o cambia su dirección hacia fuera y abajo (en caso de que este sea un lanzador derecho), y a muchas veces el bateador le tira a una bola mala, no hace contacto y se poncha. El Lanzador lanzó el slider posiblemente, para ver si el bateador estaba buscando un (Fastball o recta) en esa zona otra vez (Abajo Afuera), que su probabilidad es ahorra de (1/19,683). El bateador deja pasar la bola, posiblemente porque primero: estaba buscando un lanzamiento adentro; segundo: quería tomar el lanzamiento; tercero: estaba buscando otro lanzamiento; y Cuarto: vio algún rompimiento temprano del lanzamiento. Bueno, eso solo lo sabe el lanzador, el receptor, el bateador y a veces los demás que estén en el estadio.
Cuarto Lanzamiento: {(Change-up) Adentro Arriba, el bateador conecta un ¡hit!} El lanzador cayo 2 bolas y 1 strike, el bateador posiblemente se sentó en un lanzamiento. Primero: el lanzamiento estaba prácticamente en la otra esquina y era un cambio de velocidad. Segundo: Tres veces lanzando afuera y abajo el bateador ingenuamente supuso que tenía que venir adentro con otro lanzamiento. Tercero: Adentro y arriba es una zona en donde el bateador ve bien la bola y hace buen contacto. Cuarto: en ocasiones anteriores (usando mas estadística del lanzador), ya el lanzador le había lanzado tres veces afuera y la cuarta vez adentro. Y Quinto: el lanzador tiene como mejor lanzamiento: su cambio, también no lo había lanzado anteriormente en la secuencia.

En resumen, el lanzador tiro sus lanzamientos en donde quería y el bateador le conectó con hit. Pero el bateador en su mente automáticamente conociendo de las estadísticas se aprovecho de eso. Con esto queda demostrado que hasta en el más mínimo detalle, se puede aplicar la estadística en el béisbol.

Queda demostrado con este compendio, que las estadísticas son aplicables a donde menos lo imaginas, el béisbol es uno de esos juegos en donde aparece como la cobertura de un libro de estadísticas, un parque de Pelota. Todo es estadística; Según Yogi Berra: La mitad del 90% del béisbol es mental, la otra mitad es la parte física y atlética del juego; pero el 10% restante consta de probabilidades y estadísticas. Así que no podemos juzgar algo solo por sus colores, como matemático me encargo de conseguir cada aspecto científico que pueda sacar provecho. En el compendio anterior solo se discutió tres temas resumidos en los que conocía a capacidad, quien sabe cuantas aplicaciones mas me falten por encontrar. Pero como todo matemático, es mi trabajo encontrarlo y encontrar prueba de algo que esta solo en forma reducida en su investigación del béisbol a nivel mundial.