¿Qué prueba estadística podría usarse para determinar si dos jugadores de béisbol tienen promedios de bateo estadísticamente diferentes?

En primer lugar, permítanme decir claramente que no soy estadístico ni juego en la televisión. Sin embargo, si su objetivo es determinar si dos jugadores con el mismo promedio de bateo son realmente jugadores equivalentes, existen datos públicos y métricas para hacerlo.

Parece que desea diferenciar entre los bateadores productivos y los que se dice que tienen promedios huecos: se generan menos carreras de lo esperado. Si ese no es el caso, en mi mejor voz de Obi-Wan Kenobe, esta no es la respuesta que buscas.

La primera parada para aquellos que desean una mirada más profunda son sitios como Estadísticas y Análisis de Béisbol, Prospecto de Béisbol y Fábrica de Béisbol.

Fangraphs tiene dos medidas de producción ofensiva que funcionan para esto, carreras creadas y carreras ponderadas creadas más. Explican los de este tipo.

“Si está buscando medir el valor de un bateador usando una estadística acumulativa que acredita a un jugador por la producción total en lugar de en un bate por bate, entonces wRC es extremadamente útil. Combina las virtudes de una estadística ponderada como wOBA, que acredita a un bateador por lo valiosa que realmente es cada acción en particular, con las virtudes de contar estadísticas que dan crédito a los jugadores por producir en un nivel dado en un gran número de apariciones en el plato. . . ”

“. . Si quieres una estadística de índice para los bateadores que pondere cada acción ofensiva y controles para los efectos de liga y parque, wRC + es para ti. Si bien wOBA es un gran paso adelante de estadísticas como el promedio de bateo y el porcentaje de slugging, no acredita a los bateadores que juegan en parques difíciles ni deduce puntos para los bateadores que juegan en los más pequeños. wRC + trae todas las virtudes de wOBA más dos beneficios adicionales; ajustes de parque y liga. . . ”

También ofrecen una estadística que incluye lo que hace un bateador después de golpear la pelota para contribuir a la ofensiva.

“Off (Carreras ofensivas por encima del promedio): número de carreras por encima o por debajo del promedio que un jugador ha valido ofensivamente, combinando carreras de bateo y BsR”.

La respuesta del Prospecto de Béisbol a este Verdadero Promedio (TAv).

“. . .es una medida del valor ofensivo total escalado al promedio de bateo. Se realizan ajustes para la calidad del parque y la liga, por lo que la calificación promedio de la liga es constante en .260. ”

Dicen que el TAv, “. . . incorpora aspectos que otras métricas basadas en pesos lineales ignoran. ”Incluyen:

  • Alcanzar la base en un error
  • Golpe situacional: el jugador golpea bien en situaciones de apalancamiento medio y alto
  • wRC odia los ponches y los golpes, pero TAv preferiría que no ocurrieran y no castiga a los bateadores por esos pecados.
  • TAv no considera la base corriendo después de que el jugador llega a la base.
  • En lugar de comparar a un bateador con un bate promedio de la liga mítica, observan cómo se desempeña un bateador dadas “oportunidades similares” con “ajustes hechos para parques y calidad de la liga”. Esos ajustes son más detallados, incluyendo si un bateador juega más en casa que en el camino

Otras cosas entran en juego al comparar a los bateadores que vale la pena considerar. Hay momentos en que los lanzadores simplemente no quieren lanzar a un bateador específico, por lo que el problema es una caminata intencional. Si bien IBB es un factor oculto en wRC, la decisión se basa en la alineación después de ese bateador, bueno, aparte de Barry Bonds de todos modos.

Aparte de eso, podemos mirar a dos jugadores con el mismo promedio de bateo relativo. Digo relativo porque cuando mides tres decimales de profundidad, un promedio de .311 no es significativamente diferente de un .315 sobre 600 en los murciélagos.

Aquí hay una pequeña tabla basada en los números finales de 2016 que muestra cómo cada medida evalúa al jugador

Si bien Trout es el mejor en todos los aspectos, su promedio de bateo no muestra esa diferencia. De manera similar, José Ramírez se ve mejor que Dustin Pedroia usando la métrica de “ofensiva” de Fangraphs, tienen el mismo TAv mientras que Pedroia tiene una ventaja de seis puntos en promedio de bateo y 16 carreras más de wRC +.

La paridad TAv que los ve igualmente productivos probablemente se deba a golpes situacionales, mientras que el bajo número de “ofensas” de Pedroia probablemente esté relacionado con el funcionamiento de la base.

Así es como sugeriría diferenciar entre jugadores con promedios de bateo similares. Ninguna medida es perfecta, pero verlas juntas puede darle una idea de quién prefiere.

No necesitas una prueba estadística.

El objetivo de las pruebas estadísticas es que le permite hacer inferencias sobre una población completa a partir de una muestra más pequeña que tome. Realizamos pruebas estadísticas para ver qué tan probable es que nuestras observaciones hechas de la muestra sean solo una casualidad de nuestras muestras.

En este caso, donde solo estamos comparando dos jugadores, esos dos jugadores son esencialmente toda su población. Por lo tanto, si ve una diferencia en su promedio de bateo, entonces hay una diferencia. Punto final. Realmente no estamos tomando una muestra ya que podemos observar a toda la población.

La pregunta está incompleta.

Si te refieres a quién tiene un promedio de bateo más alto ahora, para la temporada, entonces no necesitas una prueba. Más alto es más alto.

Pero podría ver sus promedios actuales como muestras de sus promedios de bateo de por vida, y luego podría hacer una prueba t de dos proporciones.

También es posible que desee ajustarse a otros factores, como los lanzadores que enfrentaron. Eso entraría en regresión logística.