¿Cuál es la explicación más simple y convincente de la solución al problema de los Dos Sobres?

El “argumento de cambio” se enmarca incorrectamente, ya que afirma que hay tres cantidades posibles contenidas en los dos sobres ($ A, $ 2A y $ A / 2). Pero esto es inconsistente con el problema: ya se ha establecido que solo hay dos cantidades contenidas en los dos sobres. En otras palabras, la incertidumbre radica en qué sobre elegirás, no en la cantidad contenida en cada uno.

Aquí está la forma correcta de enmarcarlo:

Supongamos que le presento dos sobres con cantidades de $ A y $ 2A, es decir, un sobre contiene el doble de dinero que el otro. Hay 0.5 probabilidades de que elija el sobre con $ A, por lo que al cambiar obtendrá una ganancia de $ 2A – $ A = $ A. Del mismo modo, hay 0.5 probabilidades de que elija el sobre con $ 2A, por lo que al cambiar obtendrá una ganancia $ A – $ 2A = – $ A.

Con el problema enmarcado de esta manera, el beneficio esperado es 0.5 * $ A + 0.5 * – $ A = $ 0, por lo que no hay ningún beneficio de cambiar como esperamos intuitivamente. Para evitar la “paradoja”, debe etiquetar los sobres claramente antes de realizar la selección, no después.

La justificación para cambiar es incorrecta. Eso es porque estás comparando dos cosas diferentes. La justificación dice que el otro sobre podría contener el doble de la cantidad en este, o la mitad de la cantidad en este con igual probabilidad, lo cual está bien ( sin inspeccionar lo que hay en este) . Pero el siguiente paso, que calcula el valor esperado para el segundo sobre, es incorrecto. El valor esperado es siempre
[matemáticas] \ frac {1} {2} [/ matemáticas] * (x + 2x)
= [matemáticas] \ frac {3x} {2} [/ matemáticas].
Ahora a x solo se le puede asignar un valor a la vez. Ahí es donde se crea la confusión. Están mezclando los valores para x, asignando diferentes valores cada vez.

Por ejemplo, en la justificación suponen que nuestro sobre consta de $ 20, y luego están ejecutando los cálculos para el segundo sobre en función de eso.
es decir, 0.5 (10 + 40) = 25, porque la segunda envoltura puede contener la mitad de 20 o el doble de 20 con la misma probabilidad.

Pero aquí está el truco: no mencionaron cuál es el valor de x. ¿Es 20? Bueno, en ese caso, el valor de 2x es 40, lo que significa que el otro sobre contiene $ 40, con probabilidad 1.
Si el valor de x es 10, entonces el sobre que tienes contiene 2x, es decir, $ 20. Entonces, el otro sobre contiene solo $ 10 con probabilidad 1 .

Ahora, el valor esperado del dinero depende solo de x, no de cuánto contiene el primer o segundo sobre. Si supieras el valor de x antes de que comience el juego, es decir, si la elección se especificó ya que un sobre contiene $ 10 y el otro contiene $ 20 (pero no sabes cuál contiene cuál), entonces la confusión ni siquiera surgiría , ya que sabría de inmediato qué contiene el otro sobre tan pronto como inspeccione este. Pero debido a que no conocemos el valor de x, se produce la confusión.

Descubrí que una vez que las personas están convencidas de una solución para este tipo de problema de probabilidad “simple” (y por “simple”, me refiero a un pequeño número de casos, no simples en concepto; los ejemplos incluyen Monty Hall y Two Children), Casi nunca están convencidos por una solución contradictoria. Para hacer eso, debe hacer que acepten lo que está mal con su solución. Y crearán un punto ciego mental para la lógica detrás de lo que está mal.

En el Problema de los dos sobres, el error que debe aceptarse es una aplicación incorrecta del Principio de indiferencia, o POI. Es lo que dice, cuando tienes un dado de seis lados y no hay razón para creer que un lado está equilibrado de manera diferente que otro, que cada uno tiene una probabilidad de 1/6 de terminar en la cima cuando se tira el dado. La lógica es que si no tiene base para decir, por ejemplo, que P (1)

P (2), solo puede suponer P (1) = P (2).

Pero para aplicarlo, debes asegurarte de no tener esa base. La gente se equivoca simplemente enumerando casos que suenan equivalentes a ellos. Si intenta discutir el Problema de los dos niños, siempre encontrará a aquellos que dicen “el orden no puede importar”, por lo que dos niños, un niño y una niña, y dos niñas tienen la misma probabilidad.

El paso incorrecto en el Problema de dos sobres es “La probabilidad de que A sea ​​la cantidad más pequeña es 1/2, y que es la cantidad más grande también es 1/2″. Si bien el POI dice que es igualmente probable que uno elija la cantidad mayor o menor, no dice que cualquier número específico sea ​​igualmente probable que sea la cantidad mayor o menor. Por ejemplo, si lo que contienen los sobres es papel moneda estadounidense, $ 1 simplemente no puede ser la cantidad más alta. Muchas personas, con puntos ciegos como mencioné, han intentado crear distribuciones de probabilidad que permiten P (A = alto) = P (A = bajo), pero todos tienen fallas que los hacen poco realistas.

La solución correcta no trata a A como fijo, trata la cantidad total T como fija. Esto funciona porque no necesitamos saber cuál es la probabilidad de que T tenga algún valor específico para obtener un valor esperado. Se espera que cada sobre contenga T / 2.


Recientemente pensé en otra forma de explicar el concepto que describí anteriormente. Si bien la explicación es más larga e incluye un concepto avanzado, puede ser más fácil de aceptar.

Digamos que se le presentan dos pares de sobres; un par contiene $ 10 y $ 20, respectivamente; y el otro contiene $ 20 y $ 40. Eliges un sobre y tienes la oportunidad de cambiar al otro sobre del mismo par. Deberías?

Tenga en cuenta que, independientemente de cómo elija, existe un 50% de posibilidades de que tenga la menor cantidad del par, y un 50% de posibilidades de que tenga la mayor cantidad. Excepto que conoce los valores establecidos (pero no lo que ha elegido), esto es lo mismo que el clásico Problema de los dos sobres.

Las posibilidades son mucho más fáciles de describir ahora: las posibilidades son iguales de que gane $ 10 (canjee $ 10 por $ 20) o pierda $ 10 (canjee $ 20 por $ 10). También son iguales a que ganará $ 20 (canjee $ 20 por $ 40), o pierda $ 20 (canjee $ 40 por $ 20). Por lo tanto, no puede haber ningún beneficio en el intercambio. Tampoco es que el argumento “intercambiar de nuevo” esté completamente invalidado ya que congeló el conjunto de valores cuando seleccionó un par de sobres.

¿Qué pasa si se le permite abrir el sobre? Si ve $ 10, sabe que ganará $ 10, por lo que debe cambiar. Si ve $ 40, sabe que perderá $ 20 y no debe cambiar. Y si ve $ 20, ¿el valor que conoce tiene la misma probabilidad de ser el valor alto o bajo? Solo entonces tiene una ganancia esperada de ($ 20- $ 10) / 2 = $ 5, que es exactamente lo que predice el argumento de cambio. Y cambiar de nuevo solo puede devolverlo a donde estaba, por lo que tiene una pérdida esperada de $ 5.

¿Qué pasaría si hubiera tres pares de sobres: {$ 10, $ 20}, {$ 20, $ 40} y {$ 40, $ 80}? Se aplican las mismas conclusiones: no puedes esperar una ganancia si no miras, porque congelaste el par de valores cuando elegiste un par. Mirar puede ayudar, pero solo si ve un valor que no es de $ 80. Y si es de $ 80, la pérdida por el intercambio es mucho mayor que cualquier ganancia esperada. Y las conclusiones siguen aplicándose sin importar cuántos pares de sobres haya.

Ahora para la parte avanzada: incluso si no conoce el conjunto de valores, quien haya puesto el dinero en estos sobres tenía un conjunto en mente. Sus posibilidades dependen de dónde encaja el valor que tiene en ese conjunto. Si no lo sabe, incluso si parece que cambiar no puede ayudar.

Persona 1: Antes de elegir un sobre, ¿son los dos equivalentes (en cuanto a información / valor esperado)?

Persona 2: Sí, los dos sobres son equivalentes. No hay nada para distinguir a los dos o hacer que uno sea mejor que el otro.

Persona 1: Si me limito a señalar un sobre, ¿le da alguna información nueva sobre la situación, los sobres, las cantidades de dinero o algo en absoluto?

Persona 2: No, no lo hace.

Persona 1: Si nada ha cambiado, entonces los dos sobres deben ser equivalentes, ¿sí?

Persona 2: sí.

Persona 1: Entonces no puedes argumentar que de repente debes cambiar al mejor.

Las dos opciones (pegar y cambiar) están disponibles solo después de ver cuánto dinero contiene el sobre que recogió inicialmente. Por lo tanto, el análisis probabilístico debe aplicarse solo a partir de este punto.

Ahora suponga que tiene $ Y en su mano. El otro sobre contiene $ Y o $ Y / 2 con probabilidades iguales (porque el primer sobre fue elegido al azar).

Cambio de caso: puede perder $ Y / 2 o ganar $ Y con las mismas probabilidades.
Stick Case: sin pérdida no hay ganancia. Obtienes $ Y.

La ganancia esperada en el caso de cambio es $ ((1/2) (Y) – (1/2) (Y / 2)) = $ Y / 4.
Ganancia esperada en caja de caja os $ cero.

Por lo tanto, debe cambiar (siempre que Y sea positivo) .

La mejor manera de pensarlo es en un caso acotado.

Digamos que hay un límite superior, $ 1 mil millones de dólares, que es muy grande. Es la riqueza de la persona que está configurando el juego, y es un número que ni siquiera conoces explícitamente.

Luego, suponga que recoge un sobre con una pequeña cantidad, digamos $ 500. En ese caso, es casi igualmente probable que ganes $ 500 o pierdas $ 250 cuando cambies. Entonces ganas de un interruptor. Pero la cantidad que gana es del orden de $ 250 por cambio.

Sin embargo, las pocas veces que tienes suerte y recoges un sobre con $ 500 millones más, aún piensas que el otro sobre puede tener más. Pero en estos casos, seguramente perderá cuando cambie, porque la cantidad máxima en cualquier sobre es de $ 1 mil millones. Y lo que es peor, perderá mucho, del orden de $ 500 millones, lo suficiente para compensar todas las pequeñas ganancias que recogió las veces anteriores que jugó e hizo el cambio.

Por lo tanto, parece que si está recogiendo sobres pequeños en dólares, es probable que gane con un cambio, pero si comienza a elegir sobres grandes en dólares, es más probable que pierda que gane. De modo que el promedio es una ganancia neta 0 cero si juegas muchas veces y siempre cambias.

Si desea generalizarlo a un caso ilimitado, requiere más matemática (ver, por ejemplo, el comentario de Erik Madsen a continuación). Pero la idea es similar.

Si el dinero en los sobres no está acotado, entonces, en algún momento, la probabilidad de que encuentre una gran suma de dinero en un sobre debe comenzar a caer rápidamente, o está viendo un juego con un valor esperado infinito.

Suponiendo que no estás jugando un juego con un valor esperado infinito (en cuyo caso tienes suerte de jugar), una vez que estés en esa región, no será simétrico para ti cambiar o no. De hecho, es más probable que pierdas que ganes. Y las cantidades que está perdiendo serán mayores que las cantidades que ha estado ganando hasta ahora. Por lo tanto, se equilibra a largo plazo.

Las explicaciones dadas hasta ahora explican que, de hecho, no hay ninguna ventaja en cambiar sobres, pero no explican por qué es incorrecto decir que la cantidad esperada en el segundo sobre es matemáticamente un 25% más que la cantidad en el primer sobre.

Por extraño que parezca, a pesar de toda la discusión, el pensamiento y las ecuaciones, a menos que me falte algo, hay una respuesta simple, y la respuesta es negarse a aceptar la oferta de cambio. ¿Por qué? Simplemente porque, aunque nunca se puede saber la verdad absoluta de antemano en cuanto a la motivación de la persona que le ofrece este acuerdo desconcertante, parece muy poco probable, en el curso de los eventos humanos normales, que una persona simplemente QUIERA dar al azar lejos más dinero en lugar de menos.

Soooo … el hecho de que hayan preguntado si te gustaría cambiar parece implicar inevitablemente al menos alguna posibilidad de que sepan que has elegido el sobre con más dinero y esperan que cambies para que ahorren parte de su efectivo.

Podría haber un contraargumento, afirmando que algunas personas locas QUIEREN regalar más dinero … pero creo que son pocos y lo suficientemente distantes como para no estropear mi respuesta inicial: si se está haciendo la oferta de cambio, tiene sentido suponga que al menos PODRÍA haber un motivo material detrás de la oferta de cambio que beneficiará financieramente a quien lo realiza, y tiene sentido creer que tal caso es más probable que la oferta realmente odie el dinero y quiera verlo tomar Más de eso.

– MJM, que estará feliz de estar en el extremo receptor de este juego muchas y múltiples veces con muchas y múltiples personas … puramente en interés de la ciencia, por supuesto.

Si cree en la ley de promedio y probabilidad, este siguiente enfoque seguramente podrá convencerlo:

Deje que esté experimentando esto 100 veces y hay dos denominaciones 50 y 100 en estos dos sobres.

La ley del promedio dice que elegirá un sobre de 50 $ 50 veces y un sobre de 100 $ 50 veces.

Si intercambia cada vez que obtiene: 100 $ * 50 + 50 $ * 50 == 7500 $
si no intercambia en cualquier momento que obtenga: 50 $ * 50 + 100 $ * 50 = 7500 $

Ambas veces obtienes la misma cantidad. Entonces, ¿por qué molestarse en cambiar estos sobres por 100 veces y hacer que te duela la mano?

Creo que la mejor manera de resolver la paradoja es darse cuenta de que el problema solo funciona si realmente no tienes idea de cuánto dinero es probable que haya en cualquiera de los sobres. Esto significa que la distribución de probabilidad tiene que ser uniforme de 0 a infinito.

Por lo tanto, el valor esperado de cada sobre es infinito, y no tiene ninguna razón para preferir uno sobre otro.

La pregunta se plantea erróneamente. No puede afirmar una cantidad específica en un sobre y desconocido en el otro sobre (a menos que sean independientes), y esperar hacer cálculos basados ​​en él.

Los dos sobres contienen dinero en total 30 $. 10 $ en uno y 20 $ en otro.

Si elige primero el sobre de 10 $, el intercambio le da 10 $ más.

Si elige primero el sobre de 20 $, el intercambio le quitará 10 $.

Entonces, la probabilidad de ganar o perder 10 $ es 50/50%. El intercambio de IE o no tiene exactamente las mismas probabilidades y “avances”.

*** Explicación más detallada a continuación ***

El problema original de dos sobres en realidad describe tres sobres, si lo miras con cuidado.

La envolvente x y las opciones posibles envuelven 2x y envolvente x / 2 (son opciones posibles solo si existen).

Sin embargo, eso no cambia el resultado de las matemáticas. Digamos x = 10.

Si elige 5, entonces (50/50%) gana 5 o 15 (intercambiando, por supuesto).

Si eliges 10, entonces pierdes 5 o ganas 10.

Si eliges 20, entonces pierdes 15 o 10.

Por un vistazo rápido, es posible que no vea cómo este resultado es cero, pero mírelo de esta manera:

Todas esas opciones iniciales tienen la misma probabilidad de suceder (1/3) y después de eso, las opciones restantes también tienen la misma probabilidad de suceder (1/2). Entonces, cualquiera de esas seis opciones finales es igualmente probable. De nuevo son:

  1. +5
  2. +15
  3. -5
  4. +10
  5. -15
  6. -10

Déjame reorganizarlos por ti:

  1. +5
  2. -5
  3. +10
  4. -10
  5. +15
  6. -15

¿Ver ahora? Por cada victoria hay igual pérdida con igual probabilidad.

El problema es que una vez que haces una selección, aún no sabes si tienes x o 2x. Por lo tanto, no puede etiquetar el otro sobre 1 / 2x o 2x. Todavía es x o 2x. Si elige x, el otro es 2x, si elige 2x, el otro es x.

La probabilidad radica en la elección de un sobre, cambiar o quedarse no importa. Usted eligió 2x y cambió a x, o eligió x y cambió a 2x. Una vez que haya elegido, todos los cálculos de probabilidad terminan, los números son finales.