8 votos

Rompecabezas de probabilidad de una entrevista cuantitativa

Una urna contiene 20 bolas de cada uno de los 7 colores del arco iris (un total de 140 bolas). Seleccionamos bolas una por una sin reemplazo. Dado que en los primeros 70 sorteos seleccionamos 5 bolas más rojas que amarillas, encuentra la probabilidad de que la 71ª bola sacada sea amarilla.

Fuente de la pregunta

Mi enfoque

Denotemos el evento de que la $71^{ra}$ bola sea amarilla como $A$ y el evento de que haya 5 bolas más rojas que amarillas en los primeros 70 sorteos como $B$ Necesitamos encontrar

$$ \mathbb{P}(A | B) = \frac{\mathbb{P}(A, B)}{\mathbb{P}(B)} $$

Para calcular $\mathbb{P}(B)$, podemos hacer casos para el número de bolas rojas que vemos en nuestros primeros 20 sorteos (puede ser entre 0 y 15, ambos inclusive) y sumar las probabilidades El procedimiento que seguimos para llegar a la expresión es:

  1. Elegir $r$ bolas rojas de 20
  2. Colocarlas en $r$ de las primeras 70 posiciones
  3. Elegir $r+5$ bolas amarillas de 20
  4. Colocarlas en $r+5$ de las $70-r$ posiciones
  5. Elegir $65-2r$ bolas de las 100 restantes de todos los colores y colocarlas en las $65-2r$ posiciones en los primeros 70 sorteos
  6. Colocar las 70 bolas restantes después de llenar las primeras 70 posiciones con las 70 bolas restantes

Para calcular $\mathbb{P}(A | B)$, utilizo un procedimiento similar con los primeros 5 pasos iguales.

  1. Elegir una de las $20-r$ bolas restantes y ponerla en la posición $71^{ra}$

Al hacerlo, el numerador y el denominador resultan ser sumas largas de coeficientes binomiales que no pude evaluar.

Mis pensamientos

Siendo una pregunta de entrevista de Quant, siento que la fuerza bruta no sería la forma de proceder con esto. Dos hechos que podrían ser explotados pero no sé cómo son:

  1. El número de bolas es igual para todos los colores. ¿Se puede usar la simetría de alguna manera aquí?
  2. 70 es la mitad de 140. ¿Hay una razón específica por la que han pedido 70 sorteos?

Cualquier ayuda, ya sea con la evaluación de la suma en el enfoque de fuerza bruta o un enfoque más inteligente sería genial. ¡Gracias!

3voto

dotnetcoder Puntos 1262

Esta es mi cálculo.

Si reemplazaste la pregunta original con:

"Una urna contiene 20 bolas de cada uno de los 7 colores del arcoíris (140 bolas en total). Seleccionamos las bolas una por una sin reemplazo. Encuentra la probabilidad de que la bola número 71 seleccionada sea amarilla."

Entonces no hay información, la respuesta es simplemente 1/7 (0.14285) porque todo es simétrico.

Pero tenemos la información de que "en los primeros 70 sorteos seleccionamos 5 bolas rojas más que amarillas". Las bolas rojas no importan. Todo esto significa que al seleccionar la bola número 71 sabes que hay al menos 5 bolas amarillas en la bolsa. Por lo tanto, la probabilidad es mayor que 1/7. (Sea $Y$ representando el color amarillo)

$$ P(Y \; en \; la \; 71ª) = \frac{1}{7} = \sum_{i=0}^{20} P(Y \; en \; la \; 71ª | i \; Y \; en \; la \; bolsa ) P(i\; Y \; en \; la \; bolsa) $$

Esto puede ser expresado de nuevo como:

$$ \frac{10}{70} - \frac{4}{70} P(4 \; Y \; en \; la \; bolsa) - \frac{3}{70} P(3 \; Y \; en \; la \; bolsa) - \frac{2}{70} P(2 \; Y \; en \; la \; bolsa) - \frac{1}{70} P(1 \; Y \; en \; la \; bolsa) = P(Y \; en \; la \; 71ª| Y \; en \; la \; bolsa \geq 5) P (Y \; en \; la \; bolsa \geq 5)$$

Así que si puedes calcular las probabilidades de cuántas bolas amarillas hay en la bolsa para el turno número 71, eso da la respuesta. Pero no hice eso a mano. Utilicé Excel y obtuve la respuesta 0.14315. Fue una probabilidad bastante baja (0.003) de que hubiera menos de 5 bolas en la bolsa para el turno número 70.

Nota: $$ P (i \;Y\; en\; la\; bolsa\; después\; del\; 70) = \frac{20!}{(20-i)!} . \frac{120!}{(50+i)!} . \frac{70!}{140!} . ^{70}C_i$$

3voto

dmuir Puntos 146

Hay algunas respuestas buenas arriba. Esta es una implementación en Python que simplemente muestra lo sencillo que es esta pregunta. Mismo método que @Jan Stuller. Usando el módulo fractions se obtiene una respuesta no decimal.

Es importante pensar primero en las probabilidades condicionales. A menudo parecen confusas e intrincadas a primera vista, ¡pero muchas veces no lo son!

import numpy as np
from fractions import Fraction

yellow_remaining = np.arange(5, 21)

probabilities = yellow_remaining / 70

average_probability = np.mean(probabilities)

fraction = Fraction(average_probability).limit_denominator()
print(fraction)

Salida:

5/28

3voto

Braden Anderson Puntos 1088

Ya ha habido muchas respuestas geniales (pero no puedo estar de acuerdo con los que simplemente dicen promediar las probabilidades)

Esta es otra manera a través de las teorías de probabilidad total

$Pr[A|C] = \sum_{T}Pr[A|T \cap C] * Pr[T|C]$

donde $T$ es una partición

Primero establezcamos algunos eventos

$Y$ : la 71ª extracción es amarilla

$M$ : se han extraído cinco bolas rojas más que bolas amarillas

$T=t$ : se han extraído t bolas amarillas

Entonces lo que se pregunta es $Pr[Y|M]$

Usa la probabilidad total para la probabilidad condicional:

$Pr[Y|M] = \sum\limits_{t=0}^{15} Pr[Y|M\cap T=t] \times Pr[T=t|M]$

Veamos cada término:

el primer término:

$Pr[Y|M\cap T=t] $ es la probabilidad de extraer una bola amarilla dado que en las 70 extracciones anteriores ha habido t bolas amarillas y 5 bolas rojas más. es decir, la probabilidad de extraer una bola amarilla dado que en las 70 extracciones anteriores hay $t$ bolas amarillas y $t+5$ bolas rojas

Simplemente es $\frac{20-t}{70}$

el segundo término

$Pr[T=t|M] \\= \frac{Pr[T=t \cap M]}{Pr[M]} $

donde

$Pr[T=t\cap M]={20\choose t} \times {20\choose 5+t} \times {140-20-20\choose 70-t-t-5}/{140\choose 70}$

y
$Pr[M]=\sum\limits_{q=0}^{15}Pr[M \cap T=q] = \sum\limits_{q=0}^{15} {20\choose q}\times{20\choose q+5}\times{140-20-20\choose70-q-q-5}/{140\choose 70}$

Esto es porque $M\cap T=q$ forma una partición de $M$, para $q={0,1,...15}$

Júntalo todo:

$$Pr[Y|M] = \sum\limits_{t=0}^{15}\frac{20-t}{70}\times \frac{{20\choose t}{20\choose t+5}{100\choose 65-2t}}{\sum\limits_{q=0}^{15}{20\choose q}{20\choose q+5}{100\choose 65-2q}}$$

Observa que $q$ y $t$ son variables independientes

Luego usa el truco dado por kaddy para simplificarlo al resultado mencionado en la pregunta

De esto también se puede ver por qué no creo que promediar las probabilidades sea la manera correcta, porque esas probabilidades tienen diferentes pesos

Esto puede generalizarse como el mismo procedimiento anterior y espero que la generalización pueda responder si la mitad de los números son artificiales o si la simetría es necesaria

3voto

Sebastian Gray Puntos 1137

Considera cada bola amarilla individualmente como una prueba. Para cualquier bola amarilla, su valor es $1$ si cae en el lugar $71$, y el valor es $0$ de lo contrario.

Sabemos que $5$ de las bolas amarillas deben estar entre los lugares $71$ y $140$. Cada una de ellas tiene un valor esperado de $1/70$.

Sabemos que $15$ de las bolas amarillas pueden estar en cualquier lugar. Cada una de ellas tiene un valor esperado de $1/140$.

Por la linealidad de la esperanza, el valor esperado total para las bolas amarillas, es decir, el número esperado de bolas amarillas en el lugar $71$, es decir, la probabilidad de que la bola $71$ sea amarilla, es

$5 \cdot \frac{1}{70} + 15 \cdot \frac{1}{140} = \frac{5}{28}$.

2voto

Ben Porter Puntos 50

Es cierto que elegir exactamente la mitad es útil. Supongamos la diferencia $R-Y=x$ en la primera mitad (así que tu pregunta específica tiene $x=5$). La probabilidad de que el 71º sorteo sea $Y$ es la misma que cualquier otro sorteo después del $70$, así que podemos calcular el número esperado de $Y$ en la segunda mitad, $E(x)$, luego dividirlo por $70$. Observa que $E(x)+E(-x)=20$, ya que si $R-Y=x$ en la primera mitad, entonces $R-Y=-x$ en la segunda mitad, y hay $20$ $Y$ en total. Finalmente, $E(x)-E(-x)=x$, ya que $E(x)$ es también el valor esperado de $R+x$ en la segunda mitad (de manera similar, $E(-x)$ es el valor esperado de $R-x$ en la segunda mitad), y la expectativa es lineal. Así, $E(x)=10+\frac x2$, y obtenemos $E(5)=\frac{25}{2}$, por lo que la probabilidad es $\frac{25}{140}$.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X