¿Cómo se debe jugar contra un Monty Hall adversario pero no perfectamente lógico?

Dado que permanecer en silencio o mostrar la cabra es parte de la estrategia, entonces debemos considerar cambiar incluso cuando Monty permanece en silencio porque este Monty podría tener alguna estrategia para no dejarnos ganar al permanecer en silencio.

Ahora, cuando elegimos una puerta por primera vez, hay (1/3) de probabilidad de que elijamos la puerta con el automóvil y (2/3) de elegir la puerta con cabra.

considere la siguiente figura
Ahora, después de elegir la puerta, Monty, que sabe detrás de qué puerta está el automóvil, tiene la opción de mostrar la cabra o permanecer en silencio. Aquí x e y son las probabilidades de que Monty haga la elección que quiera.

dejemos que sea la probabilidad de nuestro cambio, entonces (1-a) es permanecer con la misma opción. Luego,
P (Auto | Silencioso) = 1/3 * (1-y) * (1-a) + 2/3 * (1-x) * a
P (Coche | Mostrar cabra) = 1/3 * y * (1-a) + 2/3 * x * a

Para ver que lo anterior es correcto, considere dos casos:
1) Cuando Monty siempre muestra (problema típico de Monty Hall):
x = 1 e y = 1 y a = 1
P (Coche | Mostrar cabra) = (a + 1) / 3 = 2/3 (si cambiamos)

2) Cuando Monty nunca se muestra (probabilidad = 1/3)
x = 0 e y = 0 y a = 0
P (Coche | Silencioso) = 1/3

Ahora, variar x e y es la elección y estrategia de Monty
mientras variamos, es decir, cambiar o no, es nuestra elección.

Dado que se da en el problema que necesitamos maximizar las posibilidades de ganar si él muestra la cabra. Necesitamos maximizar P (Car | Show Goat)
Simplificando de la ecuación anterior obtenemos
P (Coche | Mostrar cabra) = (y-ay + 2ax) / 3
1) Si a = 1, es decir, cambiamos P (Coche | Mostrar cabra) = 2x / 3 …… .. (digamos p1)
2) Si a = 0, es decir, nos quedamos P (Coche | Mostrar cabra) = y / 3 ……. (Digamos p2)

Como los valores de x e y pueden estar entre 0 y 1
0 <= p1 <= 2/3
0 <= p2 <= 1/3

Así que creo que es mejor cambiar que permanecer en la misma opción si nos muestra la cabra.
No es para reproducción.
Las sugerencias son bienvenidas.
Gracias por la A2A

Por estrategia mixta, supongo que quiere decir que puede cambiar entre estrategias en cualquier etapa.

Estrategia I: Mostrar siempre una cabra.
Estrategia II: Mostrar cabra cuando la elección original contiene un automóvil.
Estrategia III: siempre permanecer en silencio.

cuando muestra una cabra, está usando la estrategia I o II para esa ronda en particular.

P (se muestra win / goat) =
/ estrategia I / estrategia II
quedarse 1/3 1
cambiar 2/3 0

suponiendo que ninguna de las estrategias tenga preferencia sobre otra, es decir, P (estrategia I) = P (estrategia II) = 1/2

usando el teorema de baye
P (estrategia I / cabra mostrada) = 3/4 ya que P (cabra mostrada / estrategia I) = 1
P (se muestra la estrategia II / cabra = 1/4 ya que P (se muestra la cabra / estrategia II) = 1/3

P (ganar cuando nos quedamos / se muestra la cabra) = 3/4 * 1/3 + 1/4 * 1 = 1/2
P (gana cuando cambiamos / se muestra la cabra) = 3/4 * 2/3 + 1/4 * 0 = 1/2

por lo que no hay diferencia si cambiamos o nos quedamos con la elección inicial.

si alguna de las estrategias se ve favorecida sobre otra (w1: ponderación para la estrategia I y w2: ponderación para la estrategia II, de modo que w1 + w2 = 1), entonces podemos tener una ventaja con: Mantenerse si (w2> w1) y Cambiar (si w1> w2)

si hay una estrategia IV: Mostrar cabra cuando la elección original no contiene un automóvil,
entonces obtendrá una tabla de probabilidad diferente y en ese caso es mejor cambiar cuando se muestra una cabra.

De hecho, Monty Hall puede usar la siguiente estrategia: 1) Mostrarle siempre la cabra cuando haya recogido correctamente, y 2) Lanzar una moneda imparcial con un resultado secreto y abrir la única otra puerta no ganadora si cae cara (es decir, 50% del tiempo), o simplemente forzarlo a aceptar su elección si aterriza de cola.

Es bastante fácil demostrar que ninguna acción que realice cambiará su resultado de ganar 1/3 de las veces. Sin embargo, ninguna estrategia que elija Monty Hall puede caer por debajo, lo que le da una probabilidad de 1/3 de ganar, siempre y cuando se mantenga en su elección original. Así que tienes exactamente el mismo resultado sin importar lo que hagas, en esta versión más interesante del juego.

Dos actitudes hacia el MHP …

El matemático y el cínico …

El matemático está obligado por el entrenamiento a creer en la absoluta honestidad del Anfitrión.

El cínico lo ve como un engaño mentiroso para confundir a los observadores …

El experto en matemáticas cree en el intercambio uno por uno: tiene una probabilidad de 1/3 de cambiar a cero cuando aparece la cabra revelada; no se detienen a considerar que la otra puerta de cabra no identificada también debe tener una probabilidad cero y que la puerta del automóvil – por la misma lógica – una probabilidad del 100% – todo al mismo tiempo – no hay puerta con una oportunidad de 1/3 y, sin embargo, todas las puertas con una oportunidad de 1/3.

Dicen que la cabra revelada es Nueva información y significativa: no se detienen para razonar que un niño brillante podría predecir la cabra revelada porque siempre habrá al menos una cabra entre dos puertas MHP. Lo sabemos antes de verlo, por lo que apenas es información nueva.

¿Entonces dejan caer una probabilidad cero en su ecuación de probabilidad y obtienen el resultado de que una sola puerta tiene una probabilidad de 2/3 de un solo objeto? Ahora dos cabras dan una oportunidad de 2/3, pero con solo un auto, lo mejor que puedes obtener es una oportunidad de 1/3: una probabilidad de 2/3 de un solo objeto en una sola puerta es algo ilógico.

El cínico lo tiene más fácil – el anfitrión miente – primero el anfitrión revela una cabra sin sentido – y luego – para agravar su engaño – declara falsamente la oferta de intercambio – Para el cínico la oferta es Entregar una puerta de oportunidad 1/3 para los otros dos Puertas de oportunidad 1/3 juntas.

El cínico puede razonar que el contenido real no altera la posibilidad de contenido, más allá del alcance de un matemático. El cínico tiene las posibilidades fijadas independientemente del contenido: los matemáticos hacen que cambien solo para que sus ecuaciones funcionen.

Soy cínico, siento pena por los matemáticos, cegado por su propia experiencia.

© Richard Buxton – Noviembre 2017

La respuesta es sí, es posible y la estrategia es: siempre cambia, haga lo que haga. Ninguna otra estrategia tiene una probabilidad de ganancia mínima más alta (1/3), y ninguna otra estrategia tiene una probabilidad de ganancia promedio mejor (50%) contra un Monty aleatorio.

Lo mejor que Monty puede hacer contra su estrategia es permanecer en silencio si su suposición inicial es incorrecta. Como siempre cambias, no importa lo que haga después de tu suposición inicial correcta. Si hay una mínima posibilidad de que muestre una cabra después de su conjetura incorrecta inicial, su probabilidad de ganar aumenta de 1/3.

Considerar:
Conjetura inicial incorrecta (2/3) – Monty permanece en silencio (p) – Cambias – Ganas (50%)
Inicial adivinar mal (2/3) – Monty muestra cabra (1-p) – Cambias – Ganas (100%)

La suma es 2/3 * p * 1/2 + 2/3 * (1-p) = 2/3-p / 3.