5 votos

Programación Dinámica: Dinámica De La Tarjeta De Juego

Estoy leyendo una entrevista libro llamado Una Guía Práctica en Finanzas Cuantitativas de la Entrevista y tengo algunas dudas acerca de la solución proporcionada por el libro, así que realmente aprecio tu consejo si mi duda es correcta o no.

Pregunta descripción (desde el Cap 5 Procesos Estocásticos y Cálculo Estocástico/5.3 Programación Dinámica/Dinámica de Juego de cartas):

Un casino ofrece un juego de cartas con el estándar de 52 cartas (26 de rojo, de 26 de negro). Las tarjetas son completamente revueltos y el distribuidor dibuja tarjetas una por una. (Cartas no son devueltos a la cubierta). Usted puede pedir al vendedor para detener en cualquier momento que desee. Por cada tarjeta roja dibujada, usted puede ganar 1 dólar; para cada tarjeta negra dibujada, se pierde 1 dólar. ¿Cuál es la mejor parada de la regla en términos de maximizar el beneficio esperado y cuánto están dispuestos a pagar por este juego?

Solución: Vamos a $(b,r)$ representan el número de la espalda y las tarjetas rojas a la izquierda en la cubierta, respectivamente. Por simetría, tenemos:

$RedCardsDrawn-Tarjetas Negras Dibujadas = Negro Tarjetas De Izquierda - Tarjetas Rojas A La Izquierda$

En cada $(b,r)$, nos enfrentamos a la decisión de parar o seguir jugando. Si le pedimos al concesionario a parar en $(b,r)$, el pago es de$b-r$. Si seguimos jugando, hay $b/(b+r)$ probabilidad de que la siguiente carta será de color negro-en cuyo caso el cambio de estado a $b-1,r)$y $r/(b+r)$ probabilidad de que la siguiente carta será de color rojo-en cuyo caso el estado de cambios a $(b,r-1)$. Nos detenemos si y sólo si el beneficio esperado de dibujo más cartas es menor que $b-r$. Que también nos da el sistema de ecuaciones:

$E[f(b,r)]= max(b-r(b/(b+r))*E[f(b-1,r)]+(r/(b+r))*E[f(b,r-1)])$

Usando la condición de frontera:

$f(0,r)=0$

Mi duda: yo creo que los de arriba de la condición de límite debe ser de$f(0,r)=-r$ en su lugar debido a:$RedCardsDrawn-Tarjetas Negras Dibujadas = Negro Tarjetas de Izquierda - Tarjetas Rojas a la Izquierda = 0-r$ me pregunto si mi interpretación es correcta?

1voto

dotnetcoder Puntos 1262

Hice esto en excel con las condiciones de contorno:

$$f(0,r)=0 \quad f(b,0)=b$$

Y

$$f(x,y) = \max \left (x-y,\; \frac{x}{x+y}f(x-1,y) + \frac{y}{x+y}(x,y-1) \right)$$

La respuesta que recibí fue de$f(26,26) = 2.498$

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X