Estoy leyendo una entrevista libro llamado Una Guía Práctica en Finanzas Cuantitativas de la Entrevista y tengo algunas dudas acerca de la solución proporcionada por el libro, así que realmente aprecio tu consejo si mi duda es correcta o no.
Pregunta descripción (desde el Cap 5 Procesos Estocásticos y Cálculo Estocástico/5.3 Programación Dinámica/Dinámica de Juego de cartas):
Un casino ofrece un juego de cartas con el estándar de 52 cartas (26 de rojo, de 26 de negro). Las tarjetas son completamente revueltos y el distribuidor dibuja tarjetas una por una. (Cartas no son devueltos a la cubierta). Usted puede pedir al vendedor para detener en cualquier momento que desee. Por cada tarjeta roja dibujada, usted puede ganar 1 dólar; para cada tarjeta negra dibujada, se pierde 1 dólar. ¿Cuál es la mejor parada de la regla en términos de maximizar el beneficio esperado y cuánto están dispuestos a pagar por este juego?
Solución: Vamos a $(b,r)$ representan el número de la espalda y las tarjetas rojas a la izquierda en la cubierta, respectivamente. Por simetría, tenemos:
$RedCardsDrawn-Tarjetas Negras Dibujadas = Negro Tarjetas De Izquierda - Tarjetas Rojas A La Izquierda$
En cada $(b,r)$, nos enfrentamos a la decisión de parar o seguir jugando. Si le pedimos al concesionario a parar en $(b,r)$, el pago es de$b-r$. Si seguimos jugando, hay $b/(b+r)$ probabilidad de que la siguiente carta será de color negro-en cuyo caso el cambio de estado a $b-1,r)$y $r/(b+r)$ probabilidad de que la siguiente carta será de color rojo-en cuyo caso el estado de cambios a $(b,r-1)$. Nos detenemos si y sólo si el beneficio esperado de dibujo más cartas es menor que $b-r$. Que también nos da el sistema de ecuaciones:
$E[f(b,r)]= max(b-r(b/(b+r))*E[f(b-1,r)]+(r/(b+r))*E[f(b,r-1)])$
Usando la condición de frontera:
$f(0,r)=0$
Mi duda: yo creo que los de arriba de la condición de límite debe ser de$f(0,r)=-r$ en su lugar debido a:$RedCardsDrawn-Tarjetas Negras Dibujadas = Negro Tarjetas de Izquierda - Tarjetas Rojas a la Izquierda = 0-r$ me pregunto si mi interpretación es correcta?