Lo que tienes ahí son las preferencias bajo una política arbitraria -- lo que algunos llaman el función de prevalencia . Lo único que falta es el operador máximo. Escrita con maximización (y haciendo explícitos el estado y la elección), la ecuación de Bellman es
\begin{align} U(K_t, \epsilon_t) =& \max_{C_t} \{ (1-\beta) C_t^{1 - \frac{1}{\eta}} + \beta [E_t(U(K_{t+1}, \epsilon_{t+1})^{1-\gamma})]^{\frac{1 - \frac{1}{\eta}}{1 - \gamma}} \}^{\frac{1}{1 - \frac{1}{\eta}}} \\ \text{s.t. } & C_t \in F(K_t, \epsilon_t) \\ & K_{t+1} = G(K_t, C_t, \epsilon_t), \\ & \epsilon \sim \Phi \end{align}
donde $K_t$ es el estado, $F(K_t)$ es el conjunto de opciones, $\epsilon_t$ es algún choque con CDF $\Phi$ (se supone que se revela antes de elegir $C_t$ (no es necesario que sea IID), y $G(K_t, C_t)$ es la ley del movimiento.
La maximización con preferencias recursivas es prácticamente la misma que con las preferencias estándar separables en el tiempo, e incluso funciona bien con los métodos de programación dinámica (por ejemplo, si tienes algún código VFI configurado puedes hacer que las preferencias sean recursivas simplemente cambiando la función de prevalencia). El único cambio real es que ahora tenemos diferentes agregadores sobre los estados y sobre el tiempo en el RHS de la función de prevalencia. Estas notas sobre las preferencias recursivas puede ayudar, en particular la sección 5 ("Optimización y la ecuación de Bellman").
Hacer que las restricciones sean estocásticas no cambiará los detalles de tu problema -será similar a cómo formularías y resolverías el problema equivalente separable en el tiempo con una restricción estocástica- a menos que tengas alguna estructura específica en mente que cambie las cosas para las preferencias recursivas de forma diferente a las preferencias separables en el tiempo. No se me ocurre tal estructura, pero estoy seguro de que se podría encontrar con un poco de investigación.
Una cosa que es diferente con las preferencias recursivas es la escala de la utilidad - la utilidad del período se escala por $(1-\beta)$ . Esto se discute un poco en la página 3 de las notas adjuntas. La escala permite medir la utilidad en unidades de consumo, de modo que la utilidad de una secuencia de niveles de consumo constantes seguros es ese mismo nivel de consumo, es decir $U(c,c,...) = c$ . Es un buen ejercicio intentar mostrar esta simetría sin el escalamiento para ver cómo sale (si lo haces con el agregador de riesgo, recuerda que el equivalente de certeza de una cosa segura es la cosa segura misma).