¿Cuánta variación tiene el promedio de bateo de un jugador durante una temporada de béisbol y qué métodos estadísticos se utilizarían para estudiar esto?

En realidad, el promedio de bateo de un jugador fluctúa año tras año por una variedad de razones diferentes, por lo que la respuesta empírica puede ser difícil de obtener.

Una forma simple e ingenua de estimar la varianza en el promedio de bateo debido a la suerte podría ser pensar en el golpe base vs fuera como un lanzamiento de moneda con n intentos, con la cabeza como un éxito.

Digamos que hay n pruebas (es decir, al bate). ¿Cuántas veces aparece la cabeza (es decir, el golpe) en esas pruebas? Denote eso como k (es decir, número de aciertos). La tasa de éxito p (es decir, promedio de bateo) viene dada por p = k / n (o H / AB en términos de estadísticas tradicionales de béisbol).

Entonces la varianza en k puede estimarse asumiendo la distribución binomial (distribución binomial). Dados n ensayos, la desviación estándar en el número de éxitos se puede estimar a partir de

[matemáticas] \ Delta k = \ sqrt {np (1-p)} [/ matemáticas]

Entonces, el número de golpes k en n turnos al bate fluctuaría dentro de [matemáticas] k \ pm 2 \ Delta k [/ matemáticas] dentro de dos desviaciones estándar. Esto significa aproximadamente el 95% del tiempo k fluctúa dentro de [matemáticas] k \ pm 2 \ Delta k [/ matemáticas]. (Tenga en cuenta que esto no es estrictamente correcto ya que el percentil para las dos desviaciones estándar se calcula asumiendo la distribución normal, pero algún conjunto de n y p, que está aquí, es una aproximación razonable; vea el artículo de Wikipedia para más detalles. )

Ahora, suponga que un bateador típico tiene 550 turnos al bate y hits para un promedio de bateo de .260 durante una temporada. Entonces tenemos p = .260 yn = 550, entonces de p = k / n obtenemos k = 143. Calculando la desviación estándar,

[matemáticas] \ Delta k = \ sqrt {550 \ veces 0.260 \ veces (1 – 0.260)}
= 10.3 [/ matemáticas]

Entonces, bajo nuestro supuesto, el número de visitas en una temporada puede variar dentro de [matemáticas] 143 \ pm 20.6 [/ matemáticas]. Usando estos límites, el promedio de bateo de la temporada puede variar de .223 a .300. Esto es una gran variación … un bateador .220 se consideraría terrible, pero .300 es genial. Esa gran variación podría ser causada solo por la suerte.

(La advertencia es que no tengo idea si el número de golpes de base en la vida real realmente sigue la distribución binomial).