¿Por qué no importa ninguna estrategia en el juego de la próxima carta es roja?

Aunque la descripción de Alon es excelente, aquí hay algo para elaborar un poco más las probabilidades:

Escribí un script de Perl para simular el juego (solo para desafiar a todos los usuarios de Python). Pero en lugar de simplemente verificar el resultado general de victorias / derrotas, examinemos los detalles.

A primera vista, estaba haciendo las mismas suposiciones: si pides detener el juego cuando tienes una mejor oportunidad de ganar (lo cual parece perfectamente probable), entonces … eso debería aumentar tu probabilidad general de ganar, porque los otros juegos ( donde no lo detuviste) son 50/50, ¿verdad?

Bueno no.

Hay 4 cosas diferentes que pueden suceder:

A) ¡Detén el juego y gana!
B) Detén el juego y pierde
C) Deja que el juego llegue a la última carta y gane
D) Deja que el juego llegue a la última carta y pierda

El pensamiento que tenía (y erróneamente) fue que si detener el juego podría resultar en una victoria (que debería ser, ya que sabes que hay más tarjetas rojas para ganar), entonces la proporción de victorias en A & B debería ser mayor (como 60%, digamos). Y la proporción de victorias en C&D debe ser del 50%, porque la última carta debe asignarse al azar. ¡Eso debería dar como resultado un porcentaje de victorias general del (55%) Pero no. Entonces … ¿por qué eso no funciona?

Veamos el desglose. Aquí hay algunos números de muestra de 1,000,000 de juegos:

A) 397,271 (parar y ganar)
B) 314.707 (parar y perder)
C) 102,927 (último y ganador)
D) 185,095 (último y perder)

De hecho, cuando eliges detener el juego, ¡tienes una mejor oportunidad de ganar! 397,271 / 711,978– aproximadamente 55.80%, ¡lo cual es bastante bueno! (Eso se detiene cuando el recuento de cartas negras repartidas es 3 o más más allá del recuento de cartas rojas repartidas, por cierto). Entonces, ¡esas partes se alinean con la teoría!

Pero, ¿qué pasa con todas esas veces en que NO detuviste el juego y jugaste hasta el final? Bueno, eso salió a 102,927 / 288,022. ¡Eso solo gana alrededor del 35.74% del tiempo!

¡Así que todos esos momentos en los que no detuviste el juego te están arrastrando hacia abajo, en lugar de estar a punto! Y cuando los sumas a todos juntos (500,198 / 1,000,000), tienes un 50.02% de posibilidades de ganar, ¡lo que es esencialmente volver al 50%!

Básicamente, lo que esto nos dice es que el número total de juegos que ganas es del 50%, independientemente. Lo que es diferente es cuando puedes comenzar a predecir en qué tipo de juego estás actualmente. Si ves que los negros son tratados como locos, puedes predecir que estás en uno de los juegos ganadores, pero en realidad no mejoraste tu posibilidades de ganar. Todo lo que hiciste fue aumentar las posibilidades de adivinar correctamente que ganarías ese juego en particular, después de ver algunos de los datos desplegados.

En otras palabras, los 4 resultados diferentes descritos anteriormente siempre tendrán la misma proporción, independientemente de la estrategia utilizada: (A + C) / (B + D). Lo que hace la estrategia es cambiar las ganancias de C a A, y las pérdidas de D a B. Cuanto más “segura” esté su estrategia, menos cambios habrá. Pero independientemente de la estrategia, nunca convierte una pérdida en una victoria o una victoria en una pérdida. ¡Entonces la relación de A / B puede ser bastante favorable! Pero la proporción general no cambia: por cada ganancia que mueva de C a A, está empeorando la proporción de C / D, lo que equilibrará su proporción de ganancia general de vuelta al 50%.

Debe tener mucho cuidado con la forma en que formula el problema.

Las reglas son: las cartas, barajadas uniformemente, se reparten una por una. Puede decir “detener” en cualquier momento, y gana si y solo si la próxima carta es roja . No puedes adivinar el color de la siguiente carta y luego ganar si tienes razón. Si ese fuera el caso, el juego ciertamente tendría buenas estrategias.

Además, si no dice “detener”, la última carta determina si gana o no.

Con eso fuera del camino, aquí hay una explicación muy simple e intuitiva de por qué ninguna estrategia hace ninguna diferencia en este juego.

1) Supongamos que el juego es un poco diferente: se reparten las cartas, dices alto y luego verificamos la última carta en el mazo. Si es rojo, tú ganas.

¿Importa la “estrategia” en este juego modificado? Por supuesto no. Este juego es simplemente ridículo. El reparto y la detención no hacen nada al color de la última carta. Barajamos el mazo, y cualquiera que sea la última carta determina directamente si ganas o no. Es como lanzar una moneda justa.

2) El juego modificado y el juego original son el mismo juego . Cuando dice “detener”, las posibilidades de que la próxima carta sea roja son las mismas que las posibilidades de que la última carta sea roja. De hecho, todas las cartas boca abajo son completamente simétricas, y su ubicación en el mazo no tiene relación con su color.

QED

Su estrategia podría no terminar realmente. En los juegos donde eventualmente tienes al menos 3 rojos más que negros, tienes más del 50% de posibilidades de adivinar correctamente. Pero en un porcentaje correspondiente de juegos, nunca obtienes 3 rojos más que los negros y no puedes adivinar. Si no tiene sentido para usted, intente calcular la fracción de juegos en los que nunca tiene 3 tarjetas rojas más que negras (o para hacerlo más simple, cuando nunca tiene 1 tarjeta roja más que negra).

Además, supongo que quiere decir que se vieron al menos 3 rojos menos que los negros si tiene que exclamar “la próxima carta como roja”. Debes esperar hasta que se vean menos rojos y, por lo tanto, queden más rojos en la cubierta.

No soy matemático y, como muchos, mi intuición me llevó a concluir que habría una estrategia ganadora obvia que utilizaría el conteo de las cartas rojas y negras mostradas hasta que obtuvieras alguna ventaja establecida arbitrariamente (como tres negros más extraídos que rojo) en cuyo punto terminarías el juego diciendo que la siguiente carta robada sería roja. Si eso nunca sucediera, irías a la última carta.
Como se demostró, esta estrategia no funciona, pero ¿cómo entender esto intuitivamente?
Aquí está mi sugerencia.
(1) Claramente, si decides nunca tomar una decisión y simplemente ir a la última carta cada vez, las posibilidades de ganar son del 50%.
(2) Entonces, ¿hay una estrategia ganadora? ¿Cuándo se debe llamar “detener” y decir que la próxima tarjeta será roja? A veces es útil ir a casos extremos para aclarar una situación, así que digamos que nuestra estrategia fue no decir “detener”, hasta que se hayan robado 26 cartas negras, en cuyo caso la siguiente carta tendría que ser roja. El problema con esto es que existe la misma posibilidad de que se saquen 26 cartas negras antes de que se saquen 26 cartas rojas, por lo que esta estrategia obviamente conduce a un resultado de 50-50.
(3) Así que vamos al otro extremo. Llamaremos “stop” después de que se robe la primera carta, sin importar su color. Claramente, esta es una propuesta 50-50, ya que existe la misma posibilidad de que la primera carta sea roja o negra.
(4) Entonces, ¿qué pasa si decidimos llamar a “detener” si alguna vez llegamos a un punto donde quedan más cartas rojas en el mazo que cartas negras. Si esto ocurre, claramente tenemos una ventaja, y este es un juego “ganador”. Pero cuando esto no ocurre, nunca decimos nada y dejamos que el juego pase a la última carta. El aspecto contrario a la intuición, creo, es que suponemos que, dado que se trata de una propuesta de “50-50”, llegamos a un punto de equilibrio en estos juegos, pero tuvimos una ventaja en otros juegos, por lo que en general lo hacemos mejor que 50-50 . Pero creo que la tesis NO es una propuesta de 50-50 cuando DELIBERADAMENTE dejamos que el juego vaya a la última carta. ¿Por qué hicimos eso? Porque quedaban más cartas negras en el mazo que cartas rojas. Entonces, digamos que quedaban tres cartas y dos de ellas eran negras. No terminaríamos el juego en ese punto, y ahora somos un perdedor 2: 1. Si la siguiente carta es roja, entonces somos un perdedor seguro. Si es negro, solo tenemos 50-50, así que, en general, con tres cartas restantes y dos de ellas negras, estamos en un juego “perdedor”.
Creo que esta lógica se puede extrapolar a CUALQUIER número de cartas o estrategias restantes.

Tienes razón en parte: si te detienes cuando se ven 3 negros más que rojos (supongo que eso es lo que querías decir), la probabilidad de ganar condicional a este conocimiento es mayor al 50%, obviamente ya que quedan más cartas rojas que negras.

Sin embargo, estamos hablando de la probabilidad incondicional de ganar el juego: antes de comenzar el juego, esta estrategia todavía te da un 50% de posibilidades de ganar. ¿Por qué? Como otros han señalado, puede que no haya un punto en el tiempo en el que se hayan visto 3 negros más que rojos, por lo que el escenario en su estrategia nunca sucederá.

Pero podría decir: “Si mi estrategia funciona, tengo una probabilidad de ganar> 50%. Si falla, entonces tengo un 50% de posibilidades de ganar, ya que la última carta es roja o negra con un 50% de posibilidades. Por lo tanto, mi posibilidad de ganar es> 50% “.

Tenga cuidado: dado que su estrategia falla, en realidad tiene <50% de posibilidades de ganar. ¿Por qué? Con la condición de que nunca veamos 3 negros más que rojos, es más probable que hayamos sacado más cartas rojas que negras en cualquier momento dado (sin decir nunca parar). Por lo tanto, es más probable que cuando lleguemos a la última carta, ya hayamos sacado 26 rojos y 25 negros, lo que nos obliga a perder con una carta negra.

Por lo tanto, su estrategia puede funcionar y ayudar a sus posibilidades, pero si no lo hace, sus posibilidades se ven perjudicadas: este es el acto de equilibrio que mantiene la probabilidad al 50%. En cuanto a por qué la probabilidad es exactamente la mitad, la respuesta de Alon está en el acto.

Quería asegurarme de que realmente entendía el problema antes de perder mucho más tiempo pensando en ello, así que escribí una simulación de Python:

  de aleatoria importación aleatoria

 cartas = ['r' para x en el rango (26)] + ['b' para x en el rango (26)]

 def nAheadStrategy (n):
     estrategia def (numRedSeen, numBlackSeen):
         return numBlackSeen> = n + numRedSeen
     estrategia de retorno

 def callRedGame (mazo, estrategia):
     juego def ():
         numRedSeen = 0
         numBlackSeen = 0
         barajar (baraja)
         para tarjeta en mazo:
             if estrategia (numRedSeen, numBlackSeen):
                 tarjeta de devolución == 'r'
             si tarjeta == 'r':
                 numRedSeen + = 1
             más:
                 numBlackSeen + = 1
         plataforma de retorno [-1] == 'r'
     juego de regreso

 def simulate (juego, numTrials = 100000):
     gana = 0
     para prueba en xrange (numTrials):
         si juego ():
             gana + = 1
     devolver victorias / float (numTrials)

 para n en [1,2,3,4,5]:
     print n, simulate (callRedGame (cards, nAheadStrategy (n)))

He aquí que sale el resultado anunciado:

  1 0.50189
 2 0.50002
 3 0.4986
 4 0.49951
 5 0.49828

Volveré a publicar si descubro la intuición detrás de esto.

Editar: Alon Amit lo consiguió. Prestigio.

El método de fuerza bruta:

1. Inicialmente tienes un 50% de posibilidades de ser correcto, ya que la mitad de las cartas del mazo son rojas.

Ahora, si llamas “rojo” y pierdes, entonces el juego ha terminado. De lo contrario, es rojo y tú ganas y el juego ha terminado.

2. Si no llamó y si la primera carta que se entrega es roja, entonces su probabilidad de ganar para la próxima carta disminuye.

3. Si la primera carta elegida es negra, entonces su probabilidad aumenta a medida que el número de rojos es mayor que el de los negros.

Entonces, utilizando una analogía similar, solo tiene que contar la cantidad de rojos y negros que se seleccionan. Cuanto mayor sea el número de rojos en el mazo, mayor es la probabilidad de ganar.