4 votos

Método de los multiplicadores de Lagrange con variables aleatorias

Voy a ilustrar la cuestión que tengo con un problema sencillo.

Dejemos que $c_1, c_2 \in \mathbb{R}$ y $Z$ una variable aleatoria de valor real. Sea $u:\mathbb{R} \rightarrow \mathbb{R} $ sea una función diferenciable, y $f(c_1,Z)$ sea una función de valor real diferenciable con respecto a $c_1$ .

El problema es: Maximizar: $u(c_1) + \mathbb{E}[u(c_2)]$ tal que $c_2=f(c_1, Z)$

Este problema se resuelve fácilmente por sustitución directa, y la respuesta es

$u'(c_1) + \mathbb{E}\left[u'(f(c_1,Z)) \frac{\partial f(c_1,Z)}{\partial c_1}\right] = 0 \label{answer}$

La cuestión es cómo escribir un Lagrangiano cuyos extremos corresponden a la solución de este problema de forma normal.

Mi primer instinto fue escribir $\mathcal{L} = u(c_1) + \mathbb{E}[u(c_2)] + \lambda(c_2 - f(c_1,Z))$ .

Sin embargo, esto no parece tener sentido. Si se trata $c_2$ como si fuera una variable aleatoria, entonces la derivada de $\mathbb{E}[u(c_2)]$ con respecto a $c_2$ da cero, y esto no puede dar la respuesta correcta. Por otro lado, tampoco tiene sentido tratarlo como no estocástico, ya que está "obligado" a ser estocástico por la restricción.

Pregunta: ¿Cómo escribo un lagrangiano cuyos extremos corresponden a la solución del problema de optimización anterior?

0 votos

Podrías tomar la expectativa de todo.

0 votos

Me temo que eso tampoco funciona.

0 votos

La expectativa se puede escribir como una integral quizás, y entonces se puede aplicar la regla integral de Leibniz.

3voto

Bernard Puntos 10700

Si tratas $c_2$ como si fuera una variable aleatoria, entonces la derivada de $E[u(c_2)]$ con respecto a $c_2$ da cero.

¿Por qué? Tal afirmación no se deduce de ninguna parte. Las sutilezas están en otra parte. El problema con el Lagrangiano considerado por el OP

$$\mathcal{L} = u(c_1) + \mathbb{E}[u(c_2)] + \lambda(c_2 - f(c_1,Z))$$

es que también es una variable aleatoria ya que ahora $Z$ aparece en el exterior el valor esperado (El enfoque de sustitución directa seguido de la maximización con respecto a $c_1$ sólo, no crea ningún problema de este tipo).

Ahora, ¿podemos maximizar una variable aleatoria? Pues no, porque la característica esencial de una variable aleatoria es que se trata de una función cuyo valor no se puede fijar por mandato y control.

Pero uno podría decir "de acuerdo, pretendamos que este Lagrangiano no es una variable aleatoria, y simplemente escribamos las condiciones para la maximización, aunque sepamos que no podemos forzar la solución".

Pero esto no funcionará: si uno lo intenta acabará obteniendo

$$u'(c_1) + \mathbb{E}\left[u'(f(c_1,Z))\right] \cdot \frac{\partial f(c_1,Z)}{\partial c_1} = 0 $$

que es no la misma condición que la obtenida por sustitución directa, porque aquí la derivada parcial es en el exterior el valor esperado.

(para los que piensen "oye, entonces cómo aplicamos los procedimientos de maximización en el enfoque de máxima verosimilitud" la respuesta es que ahí, ya nada es aleatorio cuando llegamos a aplicar los pasos de maximización).

3voto

Alexandros B Puntos 131

Esto no es una respuesta, para eso ver Respuesta de Alecos . El objetivo de este post es aclarar que la pregunta se basa en la falsa suposición $$ \frac{d \ E(c_2)}{d \ c_2} = 0 $$ a modo de ejemplo. Consideremos la variable aleatoria que obtengo al lanzar un dado de seis caras y multiplicar el resultado $X$ por un número entero positivo $n$ . El valor esperado es $$ E(n \cdot X) = n \cdot \frac{7}{2}. $$ ¿Afirmaría usted que $$ \frac{d \ E(n \cdot X)}{d \ n} = 0 $$ porque "Tomar la derivada de la expectativa [...] con respecto a cualquier cosa da cero, ya que la expectativa [...] es sólo una constante"?

1voto

Mishyoshi Puntos 1220

Para resolver esto con la restricción exacta dada en la pregunta, se podría establecer el siguiente Lagrangiano:

$\mathcal{L}(c_{1},\lambda(\cdot))=u\left(c_{1}\right)+\int u\left(c_{2}\left(z\right)\right)g(z)\mathrm{d}z-\int\lambda(z)\left\{ f\left(c_{1},z\right)-c_{2}\left(z\right)\right\} \mathrm{d}z,$

donde $g(z)$ es la función de densidad de probabilidad de la variable aleatoria $Z$ y $\lambda(z)$ es el multiplicador de Lagrange correspondiente a cualquier valor $z$ .

Condiciones de primer orden para las funciones $c_2$ y $\lambda$ y para el escalar $c_1$ entonces lo son:

  • $\forall z:\lambda(z)=-u^\prime (c_2(z))g(z)$
  • $\forall z: f(c_1,z)=c_2(z)$
  • $u^\prime(c_1)-\int\lambda(z)\frac{\partial{f}}{\partial{c_1}}g(z)\mathrm{d}z=0\Leftrightarrow u^\prime(c_1)+\int u^\prime(c_2(z))\frac{\partial{f}}{\partial{c_1}}g(z)\mathrm{d}z$

La última condición corresponde a lo que bobhawke encontró utilizando el método de sustitución. Steven encuentra la misma solución, pero imponer la igualdad de las funciones de distribución no corresponde exactamente a lo que se pide.

0voto

justingrif Puntos 126

Responde primero:

La "función objetiva" es en realidad un funcional. La tarea consiste en encontrar una función $g(y)$ seguido de $c_2$ y un número real $c_1$ que maximizan el siguiente Lagrangiano

$$ \mathcal{L}(c_1, g) = u(c_1) + \int u(x)g(x) \mathrm{d}x + \int \lambda(y) \left[ g(y) - \eta(c_1, y) \right] \mathrm{d}y. $$

Aquí, $\eta(c_1, y)$ es la pdf seguida por la variable aleatoria $f(c_1, Z)$ . $\lambda(y)$ es un multiplicador de Lagrange, utilizado para hacer cumplir la restricción $g(y)=\eta(c_1,y)$ . Todas las integrales son sobre $\mathbb{R}$ . Las condiciones de primer orden son

$$ u'(c_1) - \frac{\partial}{\partial c_1} \int \lambda(y) \eta(c_1,y) \mathrm{d} y =0, \\ u(y) + \lambda(y) =0, \\ g(y) - \eta(c_1, y) = 0. \\ $$

Combinando las dos primeras se obtiene

$$ u'(c_1) + \frac{\partial}{\partial c_1} \int u(y) \eta(c_1,y) \mathrm{d} y =0. $$

Ahora utilizando la "ley del estadístico inconsciente" da

$$ u'(c_1) + \frac{\partial}{\partial c_1} \int u(f(c_1,z)) \phi(z) \mathrm{d} z =0 \\ \Rightarrow u'(c_1) + \int u'(f(c_1,z)) \frac{\partial f(c_1,z)}{\partial c_1} \phi(z) \mathrm{d} z =0 .$$ Aquí, $\phi(z)$ es la pdf seguida por la variable aleatoria $Z$ . Esto es equivalente a la solución dada por OP.


Ahora quiero abordar algunas otras cosas. Lo ideal sería hacerlo en los comentarios, pero no tengo la suficiente reputación para comentarlo.

En primer lugar, soy OP. Realmente no sé por qué no pude iniciar sesión con las credenciales originales. Todavía estoy tratando de entenderlo.

Como señala denesp, no hace mucho escribí una respuesta que borré inmediatamente. Lo hice por varias razones:

  1. En realidad no he respondido a la pregunta en ese post.
  2. Estaba en el autobús en ese momento, escribiendo en mi teléfono. El formato que tenía no era correcto, y la redacción era muy floja. Quería dedicarle más tiempo y dar una respuesta mejor y más precisa. Así que, por ejemplo, algunos de los comentarios de denesp van dirigidos a una redacción imprecisa en un post que borré.

Para responder a los comentarios de denesp en el post original: Comenté brevemente que las cosas no funcionan porque

  1. Pensé que era muy obvio por qué las cosas sugeridas no funcionan.
  2. No creí que un post detallado explicando exactamente por qué no funcionan con muchas matemáticas fuera apropiado para los comentarios

La "respuesta" de Alecos no es una respuesta en absoluto. Puede leerse mejor como una ampliación de las razones por las que el enfoque ingenuo del post original no funciona.

Ahora permítanme abordar la cuestión de la diferenciación. Es cierto que no fui preciso en el post original, pero esto era para ilustrar el enfoque ingenuo que estaba adoptando y por qué no estaba funcionando.

La confusión aquí proviene de lo siguiente. Digamos que tengo una función diferenciable $f: \mathbb{R} \rightarrow \mathbb{R}$ . Ciertamente puedo hablar con sentido de la función que es la derivada de $f$ que denotaré por $f'$ .

Por otra parte, a veces la gente 'permite que el argumento sea un azar, $\mathbb{R}$ -variable valorada". Cuando hagan esto, probablemente deberían llamar a las variables aleatorias resultantes algo distinto a $f$ y $f'$ . Toda la confusión ha surgido de esto. No hice esta distinción en el post original, porque mi pensamiento sobre la cuestión no estaba claro, y esto ha sido confundido por otros comentarios que no reconocen esta causa básica de la confusión.

0 votos

Aquí se establece una restricción diferente en $c_2$ que en la pregunta original. Usted dice que $c_2$ debe ser igual a la función de densidad de probabilidad de $f(c_1,Z)$ . En la pregunta original usted dice que $c_2$ debe ser igual a $f(c_1,Z)$ y no al pdf de este último. ¿Cuál es la correcta? Además: una variable aleatoria es una función, normalmente una función medible de valor real.

0 votos

Creo que has leído mal. Arriba, la restricción es que el pdf $g(y)$ seguido de $c_2$ debe ser igual al pdf $\eta(c_1, y)$ seguido de $f(c_1, Z)$ . No hay ninguna diferencia. Tienes razón en el segundo punto, no he hablado con precisión. Se ha hecho una pequeña edición.

0 votos

Sean dos variables aleatorias $X, Z$ con los respectivos pdf's $f_X$ y $f_Z$ . Si $X=Z$ se deduce que $f_X = f_Z$ . Pero si $f_X = f_Z$ lo hace no seguir que $X=Z$ . Así que la restricción de la pregunta original es más fuerte que la de la respuesta anterior, y por tanto una restricción diferente.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X