8 votos

Rompecabezas de probabilidad de una entrevista cuantitativa

Una urna contiene 20 bolas de cada uno de los 7 colores del arco iris (un total de 140 bolas). Seleccionamos bolas una por una sin reemplazo. Dado que en los primeros 70 sorteos seleccionamos 5 bolas más rojas que amarillas, encuentra la probabilidad de que la 71ª bola sacada sea amarilla.

Fuente de la pregunta

Mi enfoque

Denotemos el evento de que la $71^{ra}$ bola sea amarilla como $A$ y el evento de que haya 5 bolas más rojas que amarillas en los primeros 70 sorteos como $B$ Necesitamos encontrar

$$ \mathbb{P}(A | B) = \frac{\mathbb{P}(A, B)}{\mathbb{P}(B)} $$

Para calcular $\mathbb{P}(B)$, podemos hacer casos para el número de bolas rojas que vemos en nuestros primeros 20 sorteos (puede ser entre 0 y 15, ambos inclusive) y sumar las probabilidades El procedimiento que seguimos para llegar a la expresión es:

  1. Elegir $r$ bolas rojas de 20
  2. Colocarlas en $r$ de las primeras 70 posiciones
  3. Elegir $r+5$ bolas amarillas de 20
  4. Colocarlas en $r+5$ de las $70-r$ posiciones
  5. Elegir $65-2r$ bolas de las 100 restantes de todos los colores y colocarlas en las $65-2r$ posiciones en los primeros 70 sorteos
  6. Colocar las 70 bolas restantes después de llenar las primeras 70 posiciones con las 70 bolas restantes

Para calcular $\mathbb{P}(A | B)$, utilizo un procedimiento similar con los primeros 5 pasos iguales.

  1. Elegir una de las $20-r$ bolas restantes y ponerla en la posición $71^{ra}$

Al hacerlo, el numerador y el denominador resultan ser sumas largas de coeficientes binomiales que no pude evaluar.

Mis pensamientos

Siendo una pregunta de entrevista de Quant, siento que la fuerza bruta no sería la forma de proceder con esto. Dos hechos que podrían ser explotados pero no sé cómo son:

  1. El número de bolas es igual para todos los colores. ¿Se puede usar la simetría de alguna manera aquí?
  2. 70 es la mitad de 140. ¿Hay una razón específica por la que han pedido 70 sorteos?

Cualquier ayuda, ya sea con la evaluación de la suma en el enfoque de fuerza bruta o un enfoque más inteligente sería genial. ¡Gracias!

8voto

Clint Puntos 21

Aquí hay un intento de un argumento más intuitivo, con el riesgo de perder algo de rigor, basado en la solución que escribí en la sección posterior a la barra divisoria.

Supongamos que en los primeros 70 sorteos, vimos 5 bolas rojas más que bolas amarillas. Respondamos dos preguntas sobre nuestro 71º sorteo:

1) ¿Qué tan más probable es que saquemos una bola amarilla que una roja?

Bueno, las bolas que quedan en la urna siempre tienen 5 bolas amarillas más que rojas. Podemos marcar 5 bolas amarillas como "extra", y la probabilidad de sacarlas es $5/70$. Aparte de las bolas extra, hay la misma cantidad de bolas rojas y amarillas, por lo que sin importar su número las probabilidades se cancelan.

2) ¿Cuál es la probabilidad de sacar una bola roja o amarilla?

Vamos a ver por qué esto es simplemente $40/140$, la tasa base de bolas amarillas y rojas.

En los primeros 70 sorteos sacamos 5 bolas rojas más que amarillas, y preguntamos acerca de la probabilidad de sacar una bola roja o amarilla en los próximos 70 sorteos. Pero es igualmente probable que hubiéramos obtenido la situación simétrica en la que sacamos las otras 70 bolas, y obtuvimos 5 bolas amarillas más que rojas, y estamos preguntando por la probabilidad de sacar una bola roja o amarilla en la primera mitad. Así que, si intercambiamos "amarillo" y "rojo", es igualmente probable que estemos en cualquiera de los dos escenarios.

El promedio de estos es simplemente la probabilidad de sacar una bola roja o amarilla de cualquiera de las dos mitades, así que de las 140 bolas en total, de las cuales 20 son rojas y 20 son amarillas. Por lo tanto, es $40/140$.

Obteniendo la respuesta

Entonces, encontramos que

$$\mathbb{P}(\text{amarillo}) - \mathbb{P}(\text{rojo}) = 5/70$$ $$\mathbb{P}(\text{amarillo}) + \mathbb{P}(\text{rojo}) = 40/140$$

Podemos resolver estos para $\mathbb{P}(\text{amarillo})$ sumándolos y obteniendo $\mathbb{P}(\text{amarillo}) = 25/140 = 5/28$


Aquí hay un argumento que utiliza el truco de kaddy de esta otra respuesta con $15-r$, pero evita los binomios por completo y hace más obvia la simetría.

Definamos $f(r)$ como la probabilidad de que si sacamos las $140$ bolas en orden, las primeras $70$ bolas tengan exactamente $r$ bolas amarillas y $r+5$ bolas rojas. Notemos que esto implica que las restantes $70$ bolas tienen las restantes $20-r$ bolas amarillas y $15-r$ bolas rojas. Si dejamos $s = 15 - r$, esto es $5+s$ bolas amarillas y $s$ bolas rojas. Intercambiando las dos mitades de las $70$ bolas, y amarillo con rojo, esto es exactamente el evento cuya probabilidad es $f(r)$, así que tenemos $f(r) = f(s) = f(15-r)$.

La propiedad de simetría $f(r) = f(15-r)$ es el único hecho que necesitaremos sobre $f(r)$.

Sea $B$ el evento de que las primeras $70$ bolas tengan exactamente $5$ bolas rojas más que amarillas. Esto es simplemente la suma de $f(r)$ en el rango de posibles $r$, que va desde $0$ hasta $15$:

$$ \mathbb{P}(B) = \sum_{r=0}^{15} f(r) $$

Ahora, si dejamos que $A$ sea el evento de que la bola $71$ sea amarilla, dado $B$, la probabilidad de que suceda $A$ es igual al número de bolas amarillas restantes $20-r$ sobre las bolas restantes $70$. Así que, sumando sobre los $r$.

$$ \mathbb{P}(A, B) = \sum_{r=0}^{15} f(r) \frac{20-r}{70} $$

En este caso, intercambiamos $r \leftrightarrow 15-r$ y usamos $f(r) = f(15-r)$ para transformar esto en:

$$ \mathbb{P}(A, B) = \sum_{r=0}^{15} f(r) \frac{5+r}{70} $$

Ahora, sumando estas dos fórmulas término por término, los $r$ se cancelan en $\frac{20-r}{70} + \frac{5+r}{70} = \frac{25}{70}$, dando

$$ 2 \mathbb{P}(A, B) = \sum_{r=0}^{15} f(r) \frac{25}{70} = \frac{25}{70} \mathbb{P}(B) $$

Entonces, $\mathbb{P}(A, B) = \frac{25}{2 \cdot 70}\mathbb{P}(B) = \frac{5}{28}\mathbb{P}(B)$, lo que nos da la probabilidad condicional $$\mathbb{P}(A \mid B) = \frac{\mathbb{P}(A, B)}{\mathbb{P}(B)} = 5/28$$.

7voto

lkpeters Puntos 26

Respondiendo a mi propia pregunta porque descubrí una forma semi elegante de abordar esto analíticamente y obtener la solución en forma cerrada.

TL;DR

La probabilidad es $\frac{5}{28}$

Método

La primera afirmación es que el problema de sacar bolas de un frasco sin reemplazo es exactamente idéntico a hacer permutaciones de todas las bolas en el frasco. Así que hacer 3 extracciones es lo mismo que disponer todas las bolas (digamos en una fila) y analizar los primeros 3 elementos de la fila. Simplemente seguí los pasos y escribí las largas sumas como mencioné en la pregunta. Supongamos que estamos haciendo casos en el número de bolas Amarillas que sacamos en las primeras 70 extracciones, llamemos al número $r$ y sea el número de bolas Rojas consecuentemente, $r+5$.

$$ \therefore \mathbb{P}(A | B) = \frac{\frac{\sum_{r = 0}^{15} \binom{20}{r}\binom{70}{r}r!\binom{20}{r+5}\binom{70}{r+5}(r+5)!\binom{100}{65-2r}(65-2r)! \times (20 - r) \times 69!}{140!}}{\frac{\sum_{r = 0}^{15} \binom{20}{r}\binom{70}{r}r!\binom{20}{r+5}\binom{70-r}{r+5}(r+5)!\binom{100}{65-2r}(65-2r)! 70!}{140!}} $$

Desglosando esto término por término: $$ \binom{20}{r} = \text{Elegir r de las 20 bolas amarillas} \\ \binom{70}{r} r! = \text{Disponer las r bolas amarillas en r de las primeras 70 posiciones} \\ \binom{20}{r+5}\binom{70-r}{r+5}(r+5)! = \text{Elegir r+5 bolas rojas de las 20 y disponerlas en las posiciones restantes entre las primeras 70} \\ \binom{100}{65-2r}(65-2r)! 70! = \text{Elegir y disponer las bolas restantes en los espacios restantes en las primeras 70 extracciones y también el resto de los espacios en las últimas 70 extracciones} $$ Para el numerador, después de disponer las bolas en las primeras 70 extracciones, colocamos una de las restantes $20-r$ bolas amarillas en la posición $71^{st}$ y disponemos el resto de las bolas en las 69 posiciones restantes.

$$ \therefore \mathbb{P}(A | B) = \frac{\sum_{r = 0}^{15} \binom{20}{r}\binom{70}{r}r!\binom{20}{r+5}\binom{70}{r+5}(r+5)!\binom{100}{65-2r}(65-2r)! \times (20 - r) \times 69!}{\sum_{r = 0}^{15} \binom{20}{r}\binom{70}{r}r!\binom{20}{r+5}\binom{70-r}{r+5}(r+5)!\binom{100}{65-2r}(65-2r)! 70!} $$

Llamemos al numerador $S$

$$ S = \sum_{r = 0}^{15} \binom{20}{r}\binom{70}{r}r!\binom{20}{r+5}\binom{70}{r+5}(r+5)!\binom{100}{65-2r}(65-2r)! \times (20 - r) \times 69! $$ Ahora viene el truco crucial empleado. Observa cómo podemos invertir la sumatoria o reemplazar $r$ por $15 - r$ $$ \therefore S = \sum_{r = 0}^{15} \binom{20}{15-r}\binom{70}{15-r}(15-r)!\binom{20}{20-r}\binom{70}{20-r}(20-r)!\binom{100}{35+2r}(35+2r)! \times (5 + r) \times 69! $$ Al expandir el coeficiente binomial y cancelar términos, nos damos cuenta de que las sumatorias son exactamente idénticas excepto los términos $(20-r)$ y $(5 + r)$. Esto se puede verificar bastante fácilmente. $$ \therefore 2S = \sum_{r = 0}^{15} \binom{20}{r}\binom{70}{r}r!\binom{20}{r+5}\binom{70}{r+5}(r+5)!\binom{100}{65-2r}(65-2r)! \times 25 \times 69! $$ $$ \therefore \mathbb{P}(A | B) = \frac{25}{2} \times \frac{69!}{70!} \times \frac{\sum_{r = 0}^{15} \binom{20}{r}\binom{70}{r}r!\binom{20}{r+5}\binom{70-r}{r+5}(r+5)!\binom{100}{65-2r}(65-2r)!}{\sum_{r = 0}^{15} \binom{20}{r}\binom{70}{r}r!\binom{20}{r+5}\binom{70-r}{r+5}(r+5)!\binom{100}{65-2r}(65-2r)!} \\ \therefore \mathbb{P}(A | B) = \frac{25}{2 \times 70} = \frac{5}{28} $$

¡Quantguide acepta $\displaystyle \frac{5}{28}$ como la respuesta cuando se envía!

Por favor avísame si hay algún error.

6voto

Amod Gokhale Puntos 26

TLDR: Según mi comentario, creo que la manera más fácil de calcular esto es darse cuenta de que hay 16 resultados posibles, todos igualmente probables (ya se han sacado 20 bolas rojas, 19 bolas rojas... 5 bolas rojas).

Para cada resultado, la probabilidad de sacar la próxima bola amarilla es simplemente el número de bolas amarillas restantes, dividido por el número total de bolas restantes:

$$\frac{1}{16}\left(\frac{20}{70}+\frac{19}{70}+\frac{18}{70}+\frac{17}{70}+\frac{16}{70}+\frac{15}{70}+\frac{14}{70}+\frac{13}{70}+\frac{12}{70}+\frac{11}{70}+\frac{10}{70}+\frac{9}{70}+\frac{8}{70}+\frac{7}{70}+\frac{6}{70}+\frac{5}{70}\right)=\\=\frac{1}{16}\frac{200}{70}=\frac{5}{28}\approx17.8\%$$

Comentarios adicionales:

Ha habido cierta confusión sobre por qué el método descrito anteriormente debería funcionar y por qué las probabilidades no necesitan ser ponderadas.

Para simplificar, asumamos que solo hay 3 bolas rojas, 3 amarillas y 3 negras, y estamos sacando sin reemplazo.

  • Permite que el evento de que la primera bola sacada sea amarilla se denomine $Y_1$

  • Permite que el evento de que la primera bola sacada sea roja sea $R_1$, etc...

Ahora supongamos que la pregunta es: ¿cuál es la probabilidad de que la segunda bola sea amarilla, si la primera bola es amarilla o roja? Esto se da por:

$$\mathbb{P}((Y_2\cap Y_1)\cup (Y_2\cap R_1)=\\=\mathbb{P}(Y_2\cap Y_1) +\mathbb{P}(Y_2\cap R_1)=\\=\mathbb{P}(Y_1)\mathbb{P}(Y_2|Y_1)+\mathbb{P}(R_1)\mathbb{P}(Y_2|R_1)=\\=\frac{3}{9}\left(\frac{2}{8}\right)+\frac{3}{9}\left(\frac{3}{8}\right)=\frac{5}{24}$$

Ahora supongamos que la pregunta es: ¿cuál es la probabilidad de que la segunda bola sea amarilla, dado que la primera bola es amarilla o roja? Esto se da por:

$$\mathbb{P}(Y_2|(Y_1\cup R_1))=\frac{\mathbb{P}(Y_2\cap(Y_1\cup R_1))}{\mathbb{P}(Y_1\cup R_1)}=\\=\frac{\mathbb{P}(Y_2\cap Y_1)}{\mathbb{P}(Y_1 \cup R_1)}+\frac{\mathbb{P}(Y_2\cap R_1)}{\mathbb{P}(Y_1 \cup R_1)}=\\=\frac{1}{\mathbb{P}(Y_1\cup R_1)}\left(\mathbb{P}(Y_2\cap Y_1)+\mathbb{P}(Y_2\cap R_1)\right)=\\=\frac{1}{\mathbb{P}(Y_1\cup R_1)}\left(\mathbb{P}(Y_2|Y_1)\mathbb{P}(Y_1)+\mathbb{P}(Y_2|R_1)\mathbb{P}(R_1)\right)\\=\frac{9}{6}\left(\frac{2}{8}\frac{3}{9}+\frac{3}{8}\frac{3}{9}\right)=\\=\boxed{\frac{1}{2}\left(\frac{2}{8}+\frac{3}{8}\right)}=\frac{5}{16}$$

Ahora, notemos que:

  • Los dos resultados son diferentes: porque los eventos son diferentes (el último es un conjunto de eventos de probabilidad condicional, el primero es un conjunto de eventos de probabilidad "regular")

  • Para el caso de probabilidad condicional, como muestra la fórmula resaltada, podemos obtener la respuesta correcta suponiendo que el espacio muestral hacia adelante se ha "dividido en dos" y trabajando con las probabilidades restantes de las bolas amarillas que se sacan en esos dos espacios muestrales (algunos comentaristas señalaron incorrectamente el ejemplo anterior para decir que no funciona, pero la diferencia clave es si condicionamos o no)

  • Por último, una forma que encuentro "útil" de pensar en probabilidades condicionales es que los eventos en los que se están condicionando pueden ser "eliminados del espacio muestral", es decir:

  • Si condicionamos en solo un evento, es decir, la primera bola sacada siendo amarilla: $\mathbb{P}(Y_2|Y_1)$, podemos usar la regla de Bayes o simplemente quitar el evento $Y_1$ del espacio muestral y trabajar con el espacio muestral que queda, es decir, esto da la respuesta directa como $\frac{2}{8}$).

  • Si condicionamos en múltiples eventos posibles (es decir, $\mathbb{P}(Y_2|Y_1\cup R_1)$), nuevamente podemos usar la regla de Bayes como se demostró anteriormente, pero como se muestra, esto finalmente conduce a una respuesta que se puede obtener simplemente eliminando los eventos en los que se condiciona del espacio muestral, y tratando los espacios muestrales que son "posibles" en adelante como de los que se extrae con igual probabilidad.

5voto

Philipp Puntos 173

Aquí para compartir mi respuesta. No hice uso de la ley de Bayes ni de ningún otro teorema de probabilidades. Simplemente trabajé con números, que es mi enfoque habitual hacia estos cuestionarios (hay un montón de miembros super inteligentes en este foro que probablemente pueden dar respuestas mucho mejores que yo).

introducir descripción de la imagen aquí

Solo para proporcionar algo de explicación a mi figura:

  • Bolas Antes: El número de bolas en las 140 (como mencionaste) antes de cualquier selección.
  • Rojo > Amarillo: Simplemente elegí 5 bolas rojas adicionales en comparación con las amarillas.
  • Bolas Después: El número restante de bolas después de separar rojas y amarillas.
  • Cantidades Esperadas en las 65 Restantes: El número esperado de bolas dibujadas por color excluyendo rojas y amarillas.
  • Cantidades Esperadas en las 70 Restantes: El número restante de bolas para el 71º sorteo.

Por lo tanto, la probabilidad de sacar amarillo en tu 71º sorteo es solo (en la imagen) abajo = 16/70, lo que nos da 22.86%.

Sin embargo, esto es con la suposición de que las bolas rojas y amarillas se sacaron inicialmente después de 9 y 4. Pueden ser 5 y 0, 6 y 1, etc. Esto nos da un total de 16 combinaciones, porque la última combinación de bolas rojas y amarillas es 20 y 15 (porque el rojo debe ser más que el amarillo en 5).

Por último, revisé todas las combinaciones y tomé un promedio para obtener la respuesta final de 17.86%.

¡Espero que eso ayude!

4voto

Stephen Puntos 1

Normalmente, el valor esperado de la cantidad de bolas dibujadas de un color particular en la primera mitad es de 10. Pero se nos da que la cantidad de bolas rojas dibujadas en la primera mitad es 5 más que la cantidad de bolas amarillas dibujadas. Entonces, el número esperado de bolas rojas dibujadas en la primera mitad es de 12.5 y el número esperado de bolas amarillas es de 7.5. Por lo tanto, el número esperado de bolas amarillas restantes es de 12.5. Si tomamos 12.5/70, eso es 25/140 o 5/28.

Ahora, calculé la probabilidad a partir del valor esperado, lo cual no es en general algo válido para hacer. Por lo tanto, una prueba completamente rigurosa es más complicada, pero este es un argumento intuitivo. Para hacer un argumento riguroso, podemos utilizar el hecho de que la probabilidad es lineal con respecto a la cantidad de bolas amarillas restantes, y que calcular probabilidades a partir de valores esperados es válido dada la linealidad.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X