Tienes 2 bolsas, cada una con 100 canicas y que contienen solo canicas rojas o blancas. La primera bolsa tiene 40 rojos / 60 blancos. La distribución de la segunda bolsa es desconocida. Desea una canica roja y solo tiene 1 oportunidad de elegir. ¿Qué bolsa eliges y por qué?

No hay una respuesta matemática a esta pregunta. Si el objetivo es elegir la bolsa con la mayor probabilidad de producir una canica roja, el problema es equivalente a:

  • Tengo dos números, X e Y, ambos entre 0 y 1.
  • X es igual a 0.4
  • Y es desconocido.
  • ¿Cuál es mayor, X o Y?

Como el valor de Y es desconocido, simplemente no lo sabemos. Si supone Y = 0.5, entonces es mayor que X. Si supone Y = 0.4, es igual a X. Si supone Y = 0.3, es menor que X.

Pero no hay base para ninguno de estos supuestos sobre ningún otro. El problema simplemente no contiene suficiente información para decirnos si X> Y, X = Y o X <Y.

=====

En su caso, eligió suponer que cada conteo posible de bolas rojas en la bolsa # 2, de 0 a 100, era igualmente probable con probabilidad 1/101. No creo que haya ninguna base particular para esta suposición, y dado que usted dice que esta entrevista fue para un trabajo en servicios financieros, le advertiría que no haga suposiciones de distribución injustificadas. Se dice que muchas cantidades han hecho una suposición de normalidad injustificada en alguna característica de los mercados financieros para facilitar el análisis. Esto llevó a un exceso de confianza y no a una pequeña porción de problemas alrededor de 2008.

Consulte http://www.nytimes.com/2009/01/0… o http://www.wired.com/techbiz/it/… para saber qué puede suceder si hace demasiados supuestos de normalidad en la industria financiera.

Pero sí, esa suposición es equivalente a decir Y = 0.5, porque si la cuenta roja se distribuye uniformemente entre 0 y 100 inclusive, y P (red | redcount = x) = redcount / 100, entonces P (red) = 0.5.

Sin embargo, no creo que esta sea necesariamente la única forma de resolver el problema. ¿Qué pasaría si solo una o dos de las canicas de la bolsa n. ° 1 fueran rojas? ¿Esperaría que CINCUENTA de las de la bolsa n. ° 2 fueran rojas? ¿Qué pasaría si las bolsas tuvieran mil millones de canicas cada una, y la bolsa # 1 tuviera solo una o dos que fueran rojas de toda la bolsa? ¿Esperarías que la bolsa # 2 tuviera CINCO MILLONES de canicas rojas?

Una suposición tan legítima es que las bolsas 1 y 2 fueron muestreadas (uniformemente al azar) de alguna “bolsa cero” invisible que representa la distribución general de canicas rojas y blancas.

¿Cuál es la proporción de canicas rojas en la bolsa cero? No lo sabemos PODRÍAMOS asumir que este parámetro se distribuyó uniformemente a priori, una suposición tan infundada como las demás. Hemos observado una muestra de 100 canicas de la bolsa cero (las de la bolsa n. ° 1), de las cuales 40 eran rojas y 60 blancas. Al aplicar el teorema de Bayes, podemos calcular una distribución de probabilidad condicional (una posterior) en la proporción de canicas rojas en la bolsa cero, dada nuestra observación de la bolsa # 1.

La respuesta es una distribución Beta [41,61], [matemáticas] p (x) = \ frac {101!} {40! 60!} X ^ {40} (1-x) ^ {60} \, \ textrm {para} \, 0 <x <1. [/ Math]

¿Cuál es, entonces, la probabilidad de que una canica seleccionada al azar de la bolsa # 2 sea roja? La respuesta es el valor esperado de un sorteo de esa distribución, [math] \ int_0 ^ 1 x \ cdot p (x) \, dx = \ frac {41} {102} [/ math], o aproximadamente 40.2%.

Entonces, sus posibilidades de obtener una canica roja son LIGERAMENTE mayores en la bolsa n. ° 2, ya que esperamos que tenga una probabilidad del 40.2% de obtener una canica roja allí (con considerable incertidumbre), frente a una probabilidad conocida del 40% de obtener una canica roja en la bolsa # 1

No estoy argumentando que mi suposición de uniformidad previa en la proporción general de canicas rojas es más defendible que su suposición de uniformidad en la distribución de canicas rojas en la bolsa # 2, sino que es posible obtener diferentes respuestas al problema basado en qué suposiciones que suenan razonables (¡incluso suposiciones de uniformidad!) arrojas allí. Estas suposiciones son necesarias para poder producir una respuesta.

Para la bolsa 1 , la probabilidad de obtener una bola roja, P (rojo) = 40/100 = 0.4

Para la Bolsa 2 , dado que la distribución es desconocida, tomamos la probabilidad de que todas las distribuciones posibles (1–100; 2–98;…. 45–55; y así sucesivamente) sean iguales, es decir, 1/100.

Ahora supongamos que elegimos la bolsa con la distribución, 34–66 (34 bolas rojas y 66 bolas blancas)

La probabilidad de elegir una bola roja de dicha bolsa es = 34C1 / 100C1 = 34/100
Este proceso se puede extrapolar a todas las distribuciones posibles.

Probabilidad total de elegir bolas rojas
[matemáticas] = Σ [/ matemáticas] P (elegir una bolsa en particular) * P (Elegir una bola roja de esa bolsa)
= 1/100 * 1/100 + 1/100 * 2/100 + ……………… 1/100 * 100/100
= 101/200
= 0,505

La probabilidad de que la bola elegida sea roja es mayor en el segundo caso.

Su respuesta equivale a poner un uniforme bayesiano antes en la distribución de la segunda bolsa. Usando esta suposición, su cálculo es correcto. Sin embargo, debido a que la segunda distribución es verdaderamente “desconocida”, se trata más de una pregunta psicológica que matemática. En la “vida real”, podría usar otra información que lo llevaría a elegir un previo diferente para la segunda distribución y así alterar la conclusión. Si realmente no tiene absolutamente ninguna otra información, entonces un uniforme previo es lo correcto. Esta pregunta probablemente tenía la intención de poner a prueba su actitud hacia el riesgo u obtener información sobre su enfoque de resolución de problemas.

No hay suficiente información para una solución matemática, por lo que elegiría una práctica.

Supongo que quien compró las canicas las compró en grupos de 100, ya que es un número redondo y es más probable que se venda. Sabiendo eso, y sabiendo que hay 40 bolas rojas en la primera bolsa, parece muy probable que haya 60 canicas rojas en la próxima bolsa, por lo que elegiré la segunda bolsa.