¿Cuál es el problema de Monty Hall y cuál es su solución?

El problema de Monty Hall es un desafío para la mente, en forma de un rompecabezas de probabilidades, basado libremente en el programa de televisión estadounidense Let’s Make a Deal y que lleva el nombre de su anfitrión original, Monty Hall.

El problema es el siguiente:
Suponga que está en un programa de juegos y le dan la opción de tres puertas: detrás de una puerta hay un automóvil; detrás de los demás, cabras. Usted elige una puerta, dice No. 1, y el anfitrión, que sabe lo que hay detrás de las puertas, abre otra puerta, dice No. 3, que tiene una cabra. Luego te dice: “¿Quieres elegir la puerta número 2?” ¿Le conviene cambiar su elección?

Esta es una cuestión de probabilidad condicional.

Probabilidad de elegir un automóvil = 1/3.

Ahora el anfitrión ha revelado una puerta que contiene una cabra.

Así que ahora ya ha sucedido un evento (que se denote como E).

Anteriormente teníamos que elegir entre 3 puertas y ahora podemos elegir entre 2 puertas y la tercera puerta no contiene un premio y tampoco se barajaron los premios. Entonces, ¿qué es mejor? Elija de nuevo.
¿Pero por qué?

Porque la otra puerta debe tener el resto de las posibilidades, o 2/3.
Creo que esta imagen puede demostrarlo de una mejor manera.

Entonces, ¿por qué es tan confuso?

Fuente de confusión:
Cuando se presenta por primera vez el problema de Monty Hall, una abrumadora mayoría de personas asume que cada puerta tiene la misma probabilidad y concluye que el cambio no importa (Mueser y Granberg, 1999). De 228 sujetos en un estudio, solo el 13% eligió cambiar (Granberg y Brown, 1995: 713).

Una intuición competitiva profundamente arraigada en el trabajo en el problema de Monty Hall es la creencia de que exponer información que ya se conoce no afecta las probabilidades. Esta intuición es la base de las soluciones al problema que afirman que la acción del anfitrión de abrir una puerta no cambia la posibilidad inicial de 1/3 del jugador de seleccionar el automóvil.

Fuente del enunciado de la pregunta: Wikipedia

Por favor, vota si te parece interesante. No costará nada 🙂

La declaración del problema ha sido dada por otros. No lo repetiré.

Su importancia es que es un problema en la probabilidad condicional, que como clase parece no intuitiva para la mayoría de las personas. Debe eliminar ciertos resultados de la consideración, basándose en información que hace que algunas de las posibilidades originales se vuelvan imposibles. La parte no intuitiva es que debe eliminarlos en función de cómo podría llegar a la declaración del problema, no de si la situación en la declaración es posible.

Esta dicotomía fue señalada por primera vez en 1889 por Joseph Bertrand, en una historia de advertencia que se conoce como el problema de la caja de Bertrand. Algunos lo llamarán la paradoja de la caja de Bertrand; pero la “paradoja” que Bertrand identificó no era el problema en sí mismo, sino cómo demostró que una respuesta debe estar equivocada.

Aquí hay una versión ligeramente modificada, para que coincida con un punto continuo que quiero hacer:

  • Tres cajas idénticas contienen cada una dos monedas; uno tiene dos monedas de oro (llámelo GG ), uno tiene dos monedas de plata ( SS ) y uno tiene uno de cada ( GS ). Se elige una caja al azar. ¿Cuáles son las posibilidades de que la caja contenga diferentes tipos de monedas?

Se supone que esto es fácil: 1/3.

  • Miro en la caja y te digo que hay una moneda de oro en ella. ¿Cuáles son las posibilidades de que también haya una moneda de plata?

Como hay una moneda de oro, es obvio que la caja elegida no era SS . Entonces ese es el caso imposible. Pero el cuadro aún podría ser GG o GS , por lo que la respuesta parece ser 1/2. Lo que esto significa es que, si repetimos este juego muchas veces, la mitad de las veces te digo que hay una moneda de oro, significa que se eligió la caja GS .

  • Si digo que hay una moneda de plata, ¿cuáles son las posibilidades de que también haya una moneda de oro?

Este es un problema equivalente, excepto que la casilla GG se “elimina” esta vez. El cuadro podría ser GS o SS , por lo que la respuesta es nuevamente 1/2. Y cuando repetimos el juego, la mitad de las veces digo que hay una moneda de plata, la caja es GS .

Digamos que jugamos este juego N veces. Te digo que hay una moneda de oro M veces, y que hay una moneda de plata NM veces. Las conclusiones de que el recuadro GS se eligió en la mitad de ambos casos significa que se eligió M / 2 + (NM) / 2 = N / 2 veces. Sin embargo, sabemos que solo debe elegirse N / 3 veces, por lo que algo está mal. (La paradoja que Joseph Bertrand señaló es esencialmente la misma que esta, solo desde un ángulo diferente).

Se cometió un error cuando “eliminamos” solo lo imposible de la consideración. No puedo contarte sobre ambas monedas cuando elijo la casilla GS , tengo que elegir una de ellas. Debería esperar que yo elija “oro” la mitad del tiempo y “plata” en la otra mitad:

  • La probabilidad de elegir el cuadro GG y decir “oro” es 1/3.
  • La probabilidad de elegir la casilla GS y decir “oro” es 1/6.
  • La probabilidad de elegir la casilla GS y decir “plata” es 1/6.
  • La probabilidad de elegir la casilla SS y decir “plata” es 1/3.

Entonces, la respuesta a la segunda pregunta no es “uno de dos” o 1/2. Es “1/6 de 1/3 + 1/6” o 1/3.


El problema de Monty Hall es realmente solo una variación del problema de Bertrand Box. La gente se equivoca simplemente “eliminando” los casos que son imposibles.

Los que dicen que cambiar no puede ayudar están “eliminando” los casos en que el automóvil se colocó detrás de la puerta # 3. Como era igualmente probable que se colocara detrás del # 1 o # 2, piensan que ahora cada uno tiene la misma oportunidad.

La mayoría de los que dicen que el cambio gana 2/3 de las veces no “elimina” nada. Como Monty Hall siempre puede abrir una puerta con una cabra, no aprendemos nada cuando lo hace. Su puerta comenzó con una probabilidad de 1/3, y eso no puede cambiar, por lo que todavía tiene una probabilidad de 1/3. Este es el resultado correcto, pero la lógica de que no ha aprendido nada, por lo que sus posibilidades no pueden cambiar, no lo es.

Lo que aprendiste es que Monty Hall eligió una puerta porque tenía una cabra. Cuando eliges la puerta n. ° 1:

  • La probabilidad de que el automóvil esté detrás de la Puerta # 2 y que Monty Hall abra la Puerta # 3 es 1/3.
  • La probabilidad de que el automóvil esté detrás de la puerta n. ° 1 y que Monty Hall abra la puerta n. ° 3 es 1/6.
  • La probabilidad de que el automóvil esté detrás de la puerta n. ° 1 y que Monty Hall abra la puerta n. ° 2 es 1/6.
  • La probabilidad de que el automóvil esté detrás de la puerta n. ° 3 y que Monty Hall abra la puerta n. ° 2 es 1/3.

Entonces, cuando lo vea abierto, diga, Puerta # 3, habrá aprendido algo útil. O no pudo abrir el # 2, o decidió no hacerlo. Las posibilidades de que el automóvil esté ahora detrás de la Puerta # 2 ahora son “1/3 de 1/3 + 1/6” o 2/3.

El problema de Monty Hall se basa únicamente en los conceptos de probabilidad.

Problema

Considera una situación en la que estás en un programa de juegos y el presentador del programa te ha pedido que elijas una puerta entre tres. Se le proporciona información específica de que una puerta oculta una cierta suma de dinero del premio y las otras dos no ocultan nada. Usted es libre de hacer su elección y si elige la puerta correcta (solo por suerte), camina a casa con un bolsillo lleno de efectivo. Si eliges la puerta equivocada, ¡mala suerte!

Situación

Has hecho tu elección (por ejemplo, la primera puerta). El presentador del programa te pide que reconsideres tu decisión, pero te mantienes firme. El anfitrión abre la tercera puerta y le muestra el hecho de que no oculta nada. Ahora te quedan 2 puertas, una de ellas oculta esa cubeta llena de efectivo. Sientes que tus probabilidades de ganar han aumentado. Ahora, en ese punto, el presentador del programa te hace la pregunta: “¿Quieres cambiar tu elección?” En ese momento específico, el problema de la sala Monty se arrastra.

Si pasa por el problema de Monty Hall, DEBE alterar sus elecciones en ese momento.

Solución

Cálculo inicial

Probabilidad del gran premio detrás de la primera puerta = 1/3.

Probabilidad de que su gran premio NO esté detrás de la primera puerta = 2/3 = Probabilidad del gran premio detrás de la segunda o tercera puerta.

Pasemos al cálculo final ahora. Se toma en cuenta el hecho de que usted es consciente de la situación de que el gran premio de 5 millones de dólares no está detrás de la tercera puerta.

Cálculo final

Probabilidad del gran premio detrás de la primera puerta = 1/3.

Probabilidad de que su gran premio NO esté detrás de la primera puerta = 2/3

Probabilidad de segunda puerta + probabilidad de tercera puerta = 2/3

Probabilidad de segunda puerta + 0 = 2/3

Probabilidad de segunda puerta = 2/3.

Resultado

Probabilidad de primera puerta = 1/3.

Probabilidad de segunda puerta = 2/3.

Probabilidad de tercera puerta = 0.

Entonces, según el problema de Monty Hall, las probabilidades de ganar aumentan si solo cambias tu elección a la segunda puerta. La probabilidad de ganar detrás de esa segunda puerta es mayor en comparación con la primera.

El problema de Monty Hall es un problema contra intuitivo basado en la probabilidad.
Se basa en un programa de juegos. Donde se proporcionan tres puertas.

Como configuración inicial, se coloca un premio detrás de una puerta (elegido al azar) y se colocan cabras detrás de otras dos.

La idea es elegir una puerta con premio.

Ahora, para cualquier puerta que elija: la probabilidad de que el premio esté detrás de la puerta elegida es 1/3.
A juzgar por eso, para cualquier puerta que tenga una cabra detrás, la probabilidad es 2/3.

Una vez que elige la puerta, Monty (el anfitrión) abre una puerta no válida.

Te pregunta de nuevo si quieres cambiar la puerta.

Esto es lo que comienza la contrainserción:
Normalmente, la gente piensa que este es un problema nuevo, por lo tanto, la probabilidad de que el premio esté detrás de cualquier puerta cerrada debería ser 1/2.

Por lo tanto, no debe importar el tiempo que se peguen o cambien la puerta.

Pero en realidad, la probabilidad no ha cambiado, ya que los premios no se barajan después de abrir la puerta, por lo tanto, la probabilidad inicial permanece.
la probabilidad de que la puerta que elijas sea 1/3
la probabilidad de otras dos puertas es 2/3
pero, sabes que una puerta (abierta) tiene 0 probabilidades de tener el premio.
Esto da como resultado: usted gana el 33% de las veces si no cambia la puerta, y gana el 66% de las veces si cambia.
Se explica mejor aquí: problema de Monty Hall

Aquí tenemos una demostración funcional para lo mismo: Monty Hall

Declaración:

Suponga que está en un programa de juegos y le dan la opción de tres puertas: detrás de una puerta hay un automóvil; detrás de los demás, cabras. Usted elige una puerta, dice No. 1, y el anfitrión, que sabe lo que hay detrás de las puertas, abre otra puerta, dice No. 3, que tiene una cabra. Luego te dice: “¿Quieres elegir la puerta número 2?” ¿Le conviene cambiar su elección?

Después de cambiar tengo posibilidades de ganar de [math] \ frac {2} {3} [/ math] en comparación con nada de probabilidad de cambio [math] \ frac {1} {3}. [/ Math]

Hay muchas maneras de resolver el problema, puedes ver las respuestas aquí Problema de Monty Hall

Pero, si no eres fácil de digerir lo que está escrito allí, puedes jugar este juego varias veces y ver si tu estrategia funciona o no. Eso es básicamente por la simulación de Monte Carlo.

Tengo un código escrito para ti en Matlb. ¡Juega y mira lo que pasa!

%% Escrito por Aniket Marne %%
%% [correo electrónico protegido] %%

clc;
limpiar todo;
permanecer = 0;
swich = 0;

k = 1000;
para i = 1: k

d = randi ([1,3]); % puerta detrás de la cual hay un automóvil
c = randi ([1,3]); % puerta que eliges

si (d == c)
quedarse = quedarse + 1; % Si cambia, perderá un automóvil

más
swich = swich + 1; % si cambia, entonces puede obtener el automóvil como lo conoce otra persona.
final
final

a = sprintf (‘Las posibilidades de ganar si permanece en su selección son% f por ciento’, permanezca / k * 100);
disp (a)
b = sprintf (‘Las posibilidades de ganar si cambia son% f por ciento’, swich / k * 100);
disp (b)

% El juego %

disp (‘Ingresa cuántas veces quieres jugar’)
n = entrada (”);
puerta = [1,2,3];
win = 0;
gana = 0;
winns = 0;

disp (‘¿Quieres jugar en modo automático o manual? 1 = automático más manual’)
auto = input (”);

si auto == 1

para i = 1: n
porche = randi ([1,3]);
cabra = setdiff (puerta, porche);

c = puerta (randi ([1, numel (puerta)]));
a = sprintf (‘Usted elige la puerta% d’, c);
disp (a)
host = setdiff (cabra, c);

hostopens = host (randi ([1, numel (host)]));
notseen = setdiff (puerta, hostopens);
toswitch = setdiff (no visto, c);

si porche == c

winns = winns + 1;
disp (“¡Ganaste al no cambiar la puerta! ¡La lealtad te da sus beneficios!”)

final
c = toswitch (randi ([1, numel (toswitch)]));
si porche == c

gana = gana + 1;
disp (‘¡Ganaste al cambiar la puerta, felicidades, chico inteligente!’)
final
final
e = sprintf (‘Las posibilidades de ganar al no cambiar son% f por ciento’, gana / n * 100);
disp (e)
f = sprintf (‘Las posibilidades de ganar al cambiar son% f por ciento’, gana / n * 100);
disp (f)
más para i = 1: n
porche = randi ([1,3]);
cabra = setdiff (puerta, porche);
disp (‘elija la puerta 1,2 o 3’)

mientras que (1)
c = entrada (”);
si c ~ = 1 && c ~ = 2 && c ~ = 3
disp (‘Ingrese enteros 1,2 o 3’)
más descanso
final
final

host = setdiff (cabra, c);

hostopens = host (randi ([1, numel (host)]));
notseen = setdiff (puerta, hostopens);
toswitch = setdiff (no visto, c);
disp (‘¿Desea cambiar 1 = sí, de lo contrario = no’)
swich = input (”);
si swich == 1
c = toswitch (randi ([1, numel (toswitch)]));
final

si porche == c
disp (“¡Tú ganas! Felicitaciones por Porche”)
ganar = ganar + 1;
else disp (‘Hurrey! Lo siento amigo, tienes una cabra’)
final

final
d = sprintf (‘Las posibilidades de ganar según su estrategia son% f por ciento’, win / n * 100);
disp (d)
final

Salida de muestra:

Las posibilidades de ganar si permanece en su selección son 33.200000 por ciento
Las posibilidades de ganar si cambia son 66.800000 por ciento
Ingresa cuántas veces quieres jugar
20
¿Quieres jugar en modo automático o manual? 1 = automático más manual
1
Tu eliges la puerta 2
¡Ganaste al no cambiar la puerta! ¡La lealtad te da sus beneficios!
Tu eliges la puerta 2
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tu eliges la puerta 2
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tu eliges la puerta 2
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tu eliges la puerta 2
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tu eliges la puerta 2
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tu eliges la puerta 2
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tu eliges la puerta 2
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tu eliges la puerta 2
¡Ganaste al no cambiar la puerta! ¡La lealtad te da sus beneficios!
Tu eliges la puerta 1
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tú eliges la puerta 3
¡Ganaste al no cambiar la puerta! ¡La lealtad te da sus beneficios!
Tu eliges la puerta 2
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tú eliges la puerta 3
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tú eliges la puerta 3
¡Ganaste al no cambiar la puerta! ¡La lealtad te da sus beneficios!
Tu eliges la puerta 1
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tu eliges la puerta 2
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tu eliges la puerta 2
Ganaste al cambiar la puerta, ¡Felicidades, chico inteligente!
Tú eliges la puerta 3
¡Ganaste al no cambiar la puerta! ¡La lealtad te da sus beneficios!
Tú eliges la puerta 3
¡Ganaste al no cambiar la puerta! ¡La lealtad te da sus beneficios!
Tú eliges la puerta 3
¡Ganaste al no cambiar la puerta! ¡La lealtad te da sus beneficios!
Las posibilidades de ganar al no cambiar son 35.000000 por ciento
Las posibilidades de ganar al cambiar son 65.000000 por ciento
>>

Editar: código más generalizado

clc;
limpiar todo;
disp (‘Ingresa cuántas veces quieres jugar’)
n = entrada (”);
disp (‘Ingrese cuántas puertas hay’)
nd = input (”);

puerta = 1: nd;
win = 0;
gana = 0;
winns = 0;
disp (‘Ingrese cuántas puertas abre el host’)
ho = input (”);

mientras que (nd-ho) <2
disp (‘Esto no puede suceder. Deberías tener al menos 2 puertas cerradas’)
disp (‘Ingrese cuántas puertas abre el host’)
ho = input (”);
final
disp (‘¿Quieres jugar en modo automático o manual? 1 = automático más manual’)
auto = input (”);

si auto == 1

para i = 1: n
porche = randi ([1, numel (puerta)]);
cabra = setdiff (puerta, porche);

c = puerta (randi ([1, numel (puerta)]));
a = sprintf (‘Usted elige la puerta% d’, c);
disp (a)
host = setdiff (cabra, c);
no visto = puerta;

para k = 1: ho

hostopens = host (randi ([1, numel (host)]));
host = setdiff (host, hostopens);
notseen = setdiff (notseen, hostopens);
final

toswitch = setdiff (no visto, c);

si porche == c

winns = winns + 1;
disp (“¡Ganaste al no cambiar la puerta! ¡La lealtad te da sus beneficios!”)

final
c = toswitch (randi ([1, numel (toswitch)]));
si porche == c

gana = gana + 1;
disp (‘¡Ganaste al cambiar la puerta, felicidades, chico inteligente!’)
final
final
e = sprintf (‘Las posibilidades de ganar al no cambiar son% f por ciento’, gana / n * 100);
disp (e)
f = sprintf (‘Las posibilidades de ganar al cambiar son% f por ciento’, gana / n * 100);
disp (f)
más para i = 1: n
porche = randi ([1, numel (puerta)]);
cabra = setdiff (puerta, porche);
disp (‘elija la puerta 1,2 o 3’)

mientras que (1)
c = entrada (”);
if numel (setdiff (puerta, c) == numel (puerta))
fprintf (‘Ingrese enteros entre 1 y% d’, numel (puerta));
más descanso
final
final

host = setdiff (cabra, c);

no visto = puerta;

para k = 1: ho

hostopens = host (randi ([1, numel (host)]));
host = setdiff (host, hostopens);
notseen = setdiff (notseen, hostopens);
final

toswitch = setdiff (no visto, c);
disp (‘¿Desea cambiar 1 = sí, de lo contrario = no’)
swich = input (”);
si swich == 1
c = toswitch (randi ([1, numel (toswitch)]));
final

si porche == c
disp (“¡Tú ganas! Felicitaciones por Porche”)
ganar = ganar + 1;
else disp (‘Hurrey! Lo siento amigo, tienes una cabra’)
final

final
d = sprintf (‘Las posibilidades de ganar según su estrategia son% f por ciento’, win / n * 100);
disp (d)
final