¿Qué áreas de estudio son necesarias para crear un modelo predictivo para los ganadores de béisbol?

Diría que las dos áreas de estudio más importantes serían las estadísticas bayesianas y las métricas de béisbol. Las estadísticas bayesianas se utilizan para calcular la probabilidad de un resultado particular, como el ganador de un evento deportivo, dado un conjunto definido de circunstancias que rodean ese evento. Cuanto más conocimiento a priori (lo que ya sabe sobre lo que hace que los equipos ganen o pierdan juegos) puede incorporarlo al modelo, cuanto más preciso sea el modelo. La belleza del modelado bayesiano es que el modelo en sí le dirá qué es y qué no es importante, basándose en estos datos a priori. Por lo tanto, sería difícil (no imposible, pero difícil) para alguien (como yo) que sabe poco o nada sobre estadísticas de béisbol construir un modelo bayesiano para predecir con precisión a los ganadores. No se trata solo de las estadísticas capturadas en los puntajes de la caja, tiene que ver con el lugar donde juegan, como el interior contra el exterior (algunos equipos son mejores en uno que el otro), el hogar contra el visitante (algunos equipos juegan en el camino mejor que otros), la hora del día (algunos equipos juegan juegos nocturnos mejor que otros), etc. Probablemente habría docenas, y posiblemente cientos, de variables estadísticamente significativas en un modelo razonablemente preciso (recuerde, estamos tratando con probabilidades aquí) y tendrías que ser un estudiante del juego para adivinar que muchos de ellos podrían ser un factor.

No sé si alguno es necesario. Conozco muchos equipos, y supongo que la mayoría de las industrias están contratando desarrolladores de aplicaciones. Estas personas tienen muchas responsabilidades, como la acumulación de tendencias de los jugadores de la oposición, tanto los jugadores de posición como los fildeadores, la acumulación de datos sobre jugadores de la universidad y la escuela secundaria para selecciones de draft, etc. Los GM transmiten gran parte de los datos apropiados al gerente de campo y entrenadores. Obviamente, si lo usan o no, depende de ellos, pero ignorar repetidamente los datos puede conducir a una salida forzada temprana para el liderazgo de un equipo con dificultades.