¿Cuál sería la probabilidad bajo este experimento hipotético aleatorio?

Gracias por el A2A.
David Wise ya ha dado una buena respuesta, señalando hacia los “trastornos”, es decir, permutaciones sin coincidencias.

El número de alteraciones de n elementos se puede encontrar como:
[matemáticas] n! \ sum_ {j = 0} ^ n \ frac {(- 1) ^ j} {j!} [/ math]
Con esto, podemos tener el número de secuencias de coincidencia de k como el número de formas de seleccionar k elementos de n (coeficiente binomial), multiplicar las formas de permutar estos k elementos, multiplicar las formas de seleccionar el nk restante sin coincidencias .
Esto significa que el número de k-coincidencias es:
[matemáticas] \ frac {n!} {k!} \ sum_ {j = 0} ^ {nk} \ frac {(- 1) ^ j} {j!}, \ quad k \ in \ {0, 1, \ ldots, n \} [/ math]
y dividiendo esto por el número total de permutaciones de elementos [math] n [/ math] tiene la respuesta; la probabilidad de tener coincidencias [matemáticas] k [/ matemáticas] viene dada por:
[matemáticas] P (k) = \ frac {1} {k!} \ sum_ {j = 0} ^ {nk} \ frac {(- 1) ^ j} {j!}, \ quad k \ in \ { 0,1, \ ldots, n \} [/ math]

La probabilidad requerida de tener al menos 25 coincidencias en 100 ensayos se dará aplicando esta fórmula. Es suficiente decir que la probabilidad ya es extremadamente pequeña para 25, muere muy rápidamente.

El siguiente código de octava / matlab le dará las probabilidades y trazará el pmf para cualquier número de coincidencias.

n = 100;
para k = 1: n
P (k) = 0;
para j = 0: nk-1
P (k) = P (k) + (-1) ^ j / factorial (j);
final
P (k) = P (k) / factorial (k-1);
final

plot (0: 9, P (1:10), ‘LineWidth’, 2)
cuadrícula activa
P (26)
suma (P (26: final))

He encontrado que las probabilidades de exactamente 25 coincidencias son
P (25) = 2.3717e-26

y de al menos 26 partidos:
P (x> 25) = 9.4722e-28

Básicamente, si eligen realmente al azar; ¡nunca va a pasar!

Si desea la versión realmente TL; DR puede consultar:
http://www.math.uah.edu/stat/urn…

Desde un punto de vista estrictamente matemático, su problema está poco especificado; no ha explicado cómo se generan las secuencias (incluso si supiéramos suficiente psicología para adivinar la secuencia dada a la persona, no ha especificado cómo se eligen las personas).

El 25% de coincidencia me parece un requisito muy alto; Supongo que la respuesta es casi 0.

Si suponemos que la permutación se elegirá de manera uniforme al azar, entonces podemos calcular la respuesta con precisión. Si [math] d (n) [/ math] es el número de permutaciones de n elementos sin puntos fijos (llamados desordenes), entonces el número de permutaciones de longitud 100 que fija exactamente k elementos es
[matemáticas] {100 \ elegir k} \ frac {d (k)} {100!}. [/ matemáticas]
Usar Mathematica para sumar esto de 25 a 100 da una fracción exacta pero fea que se redondea a
[matemáticas] 2.466423172 \ veces10 ^ {- 26}. [/ matemáticas]

EDITAR: Como señaló Jeff Little, la suma debería comenzar en 26, por lo que la respuesta debería ser
[matemáticas] 9.472270385 \ times10 ^ {- 28}. [/ matemáticas]

La respuesta se resuelve a continuación, pero es aterradora: 1.17546234628e-27.
Básicamente, si las dos personas hicieron este experimento de 100 elecciones una vez por segundo, tomaría más de mil millones de vidas en el universo tener una sola vez que> 25% se alinearía.

Así es como funciona:

Voy a arriesgarme e interpretar ese único = distinto, es decir, hay 100 números distintos del 1 al 100. Entonces, el problema se vuelve si tengo dos permutaciones aleatorias de los números del 0 al 100, ¿cuál es la probabilidad de que emparejar.

El primer paso es darse cuenta de que el primer orden aleatorio se puede clasificar en un orden estándar 1 … 100. Al hacer esto, hemos reducido el problema a: ¿cuál es la probabilidad de superposición entre una combinación aleatoria de 1 … 100 y los números 1..100?

Ahora la probabilidad de que dos números sean idénticos es 1/100, por lo que nos hemos reducido al problema del teorema binomial:

Dados 100 eventos, cada uno con probabilidad 1/100, cuál es la probabilidad de tener exactamente n eventos. Esto resulta ser la expresión binomial con prob = 0.01.

de scipy.misc import comb
prob = 0.01

para j en el rango (0,101):
print j, comb (100, j) * (prob ** j) * (1-prob) ** (100-j)

Aquí está la salida:

0 0.366032341273
1 0.36972963765
2 0.184864818825
3 0.0609991658075
4 0.0149417148569
5 0.00289778712376
6 0.000463450802622
7 6.28634566327e-05
8 7.38169377126e-06
9 7.62195091982e-07
10 7.00603569398e-08
11 5.79011214378e-09
12 4.33771027607e-10
13 2.96595574432e-11
14 1.86174711223e-12
15 1.07818351281e-13
16 5.78570698162e-15
17 2.88769688922e-16
18 1.34499911226e-17
19 5.86336667759e-19
20 2.39865000447e-20
21 9.23001444722e-22
22 3.34789321088e-23
23 1.1468408891e-24
24 3.71661399246e-26
25 1.14126328657e-27
26 3.32535922662e-29
27 9.20600758585e-31
28 2.42438150709e-32

Esos números comienzan a reducirse. Sumarlos da la respuesta final para más del 25%:

suma = 0
para j en el rango (25,101):
sum + = comb (100, j) * (prob ** j) * (1-prob) ** (100-j)
imprimir suma

Cuál es 1.17546234628e-27.

Gracias por A2A Hitesh Dholaria 🙂
Riccardo Sven Risuleo (usando Matlab) y David Wise (usando Mathematica) ya ofrecen 2 métodos muy buenos.

Intenté encontrar un método que no requiriera un software, pero era demasiado cálculo y solo podía hacerlo hasta que coincidan “más de 12 números”. Para los datos dados, creo que escribir un código es la mejor manera de hacerlo. 🙂

P = 1 / (25!) = 6.45e-26

Permítame reformular la pregunta para que sea más fácil de analizar.
“Cree por separado dos secuencias aleatorias utilizando todos los enteros en el rango 1-100. Encuentre la probabilidad de que al menos 25 valores (25% de 100) estén en las mismas posiciones en ambas secuencias”.

Paso 1: Determine la cantidad de formas de satisfacer la condición; es decir, el número de pares de secuencias aleatorias con al menos 25 valores coincidentes.

Paso 1.1: Elija los 25 valores coincidentes. Como tenemos 100 valores (sin repetición) para elegir, hay 100C25 formas de elegir los valores.
Paso 1.2: Elija una posición para cada valor coincidente. Como hay 100 posiciones para elegir (y el orden es importante), hay 100P25 formas de asignar posiciones.

Paso 1.3: Asigna los valores restantes. Como no hay valores / vacantes adicionales (75 valores y 75 vacantes), no necesitamos elegir valores. Para la primera secuencia, hay 75P75 = 75! maneras de asignar Para la segunda secuencia, también hay 75P75 = 75! maneras de asignar
Como puede haber alguna coincidencia en estos 75 valores (las secuencias podrían incluso ser idénticas), podemos multiplicar directamente las formas de asignación.

Entonces, el número de pares de secuencias aleatorias con al menos 25 números coincidentes es
100C25 * 100P25 * 75! * 75!

Paso 2: Determine el número total de formas posibles; es decir, número de pares de secuencias aleatorias. Como no hay valores / vacantes adicionales, podemos asignar directamente los números.
Para la primera secuencia, hay 100P100 = 100! posibilidades Para la segunda secuencia, también hay 100P100 = 100! posibilidades
Como son independientes, las formas se pueden multiplicar directamente.

Entonces, el número total de pares de secuencias aleatorias es
100! * 100!

Paso 3: Calcula la probabilidad. Esto viene dado por la relación entre el número de pares de secuencias aleatorias coincidentes del 25% y el número total de pares de secuencias aleatorias.

P = (100C25 * 100P25 * 75! * 75!) / (100! * 100!)
P = 1 / (25!) = 6.4469502843844733961948532192047e-26

Vamos a nombrar a las personas como A y B.
La probabilidad de que A y B escriban los números son eventos independientes (a pesar de que se llaman uno por uno, la secuencia de A no tiene efecto en B y viceversa).
Ahora, dado que cada persona tiene que escribir números únicos, ¡el número de formas en que cada uno puede hacerlo es 100!
El problema es P (obtener más del 25% de coincidencia en las dos secuencias).
Ahora el objetivo aquí es calcular la probabilidad de obtener los mismos números en las mismas posiciones.
Suponiendo que estas posiciones no son dependientes entre sí (un 1-1 en la quinta posición seguido de un desajuste y 8-8 en la séptima posición se consideran 2 coincidencias. Si estas posiciones son dependientes, un 1-1 en alguna posición seguido de los números coincidentes consecutivamente en 25 posiciones se consideran un 25% de coincidencia).
Por lo tanto, P (obtener más del 25% de coincidencia en las dos secuencias) = ​​P (obtener un 26% de coincidencia) + P (obtener un 27% de coincidencia) + ….. + P (obtener un 100% de coincidencia)
(o)
1-P (obteniendo no más del 25% de coincidencia en las dos secuencias)
Esto sigue una distribución binomial de éxito, p = (1/100) * 1 y fracaso, 1-p = (1/100) * 99
Ahora,
P (obteniendo no más del 25% de coincidencia en las dos secuencias)
= P (sin coincidencia) + P (1% de coincidencia) +… + P (25% de coincidencia)