Estoy asistiendo a mi primer curso de optimización dinámica, y lo que aún no entiendo completamente es que a veces tenemos que usar más de una ecuación Bellman.
¿Cómo te das cuenta de eso? Quiero decir, ¿cómo sabes cuándo la solución de tu problema requiere más de una ecuación Bellman?
Por ejemplo este problema tomado de la teoría macroeconómica recursiva de Sargent, 2da edición.
Un trabajador desempleado recibe cada período una oferta de salario w extraída de la distribución F(w). El trabajador tiene que elegir si aceptar el trabajo, y por lo tanto trabajar para siempre, o buscar otra oferta y cobrar c en compensación por desempleo. El trabajador que decide aceptar el trabajo debe elegir el número de horas para trabajar en cada período. El trabajador elige una estrategia para maximizar
$E\Sigma_{t=0}^{\infty}\beta^{t}u(y_t,l_t)$
y $y_t=c$ si el trabajador está desempleado, y $y_t=w(1-l_t)$ si el trabajador está empleado y trabaja $(1-l_t)$ con $l_t$ de ocio y $0
Analiza el problema del trabajador. Argumenta que la estrategia óptima tiene la propiedad del salario de reserva. Muestra que el número de horas trabajadas es el mismo en cada período.
El manual de soluciones va así para la parte de establecer las ecuaciones de Bellman:
Sea s el vector de variables de estado. Elegimos $s=(w,0)$ donde $w$ es la oferta de salario y $0=E$ si el trabajador está empleado y $0=U$ si el trabajador está desempleado. Consideremos primero la situación de un trabajador empleado. La ecuación de Bellman es:
$v(w,E)= max \{u[w(1-l),l]+\beta v(w,E)\}$
y para un trabajador desempleado:
$v(w,U)= max \{v(w,E);u[c,1]+\beta\int v(w',E)DF(w')\}$
Así que siendo más concreto. ¿Por qué las soluciones requieren dos ecuaciones Bellman y cómo te das cuenta de eso al leer el problema?
Por ejemplo, mi primera suposición al intentar resolver sin mirar las soluciones fue:
$v(w,E)= max \{u[w(1-l),l];u[c,1]+\beta\int v(w',E)DF(w')\}$
¿Por qué es esto diferente?
Gracias de antemano.
3 votos
"Sea s la variable de estado" es algo confuso. Estrictamente hablando, el estado que ingresa en la decisión del agente aquí es un par (salario ofrecido, estado de empleo). Las funciones de valor son, en general, funciones del estado. Por ejemplo, si el espacio de estados es un subconjunto de $\mathbb{R}^2$, entonces la función de valor es una función, digamos, V(x,y). Aquí la segunda variable es binaria (E o U), lo que da la apariencia de "2 ecuaciones".
0 votos
Gracias @Michael, entonces en realidad no hay dos ecuaciones? ¿Cómo te das cuenta de que el estado de empleo es una variable de estado?
0 votos
No estoy discutiendo que aquí hay dos ecuaciones y dos funciones. En el caso de que una de las coordenadas del estado sea discreta y las otras no discretas, multiplicarías las ecuaciones indexadas por la variable discreta, por así decirlo.
0 votos
Aquí, ver la solución como dos funciones, una para E y otra para U, puede ser informativo. Si miras la segunda ecuación v(w, U) = ..., te dice que el w* donde las dos funciones se intersectan es donde el agente es indiferente entre E y U. Si w < w*, el agente elige U. Si w > w*, el agente elige E. También te dice que E/U debería formar parte del estado.
0 votos
"También te dice que E/U debería ser parte del estado ¿Qué quieres decir con esto? Además, no entiendo completamente por qué necesitas escribir las dos ecuaciones separadas. ¿Qué en el texto del problema te indica eso?"
1 votos
El estado (vector, si lo prefieres) consiste en todas las variables que determinan el escenario enfrentado por el agente (es decir, su problema de optimización). Aquí, dado el mismo w, tu problema de optimización es diferente si estabas empleado que si estabas desempleado, por lo tanto tu estatus laboral es parte del estado.
0 votos
Eso aclaró mucho, muchas gracias.
0 votos
Un agente en el estado U tiene la opción de cambiar a E, mientras que lo contrario no es cierto. Por lo tanto, los problemas de decisión son diferentes y E/U es parte del estado. La diferencia entre las dos funciones cuando w < w* es el valor de opción. Si el salario ofrecido w es demasiado bajo, preferirías mantener la opción y no ejercerla. (Por cierto, hay un error en la segunda ecuación v(w,U) = ... en el lado derecho. El V(w,E) debería ser v(w,U).)