3 votos

ajuste de la función lagrangiana

Consideremos un simple problema de consumo:

Max $u(X)$ s.t. $\sum_i^l p_i x_i\leq \sum_i^l p_i w_i$

$w$ es la dotación inicial.

Podemos establecer la función lagrangiana para resolver este problema.

$L=u(X)+\lambda ( \sum_i^l p_i w_i +\sum_i^l p_i x_i)$

Pero algunos pueden establecer la función lagrangiana de forma diferenciada.

$L=u(X)+\lambda ( \sum_i^l p_i x_i -\sum_i^l p_i w_i)$

El resultado del cálculo es el mismo excepto el signo del multiplicador lagrangiano $\lambda$

Para el problema del consumidor, ¿qué camino es el correcto?

Editar después del comentario: Hay una errata en la primera ecuación de esta pregunta. $\sum_i^l p_i w_i +\sum_i^l p_i x_i$ debe cambiarse como $\sum_i^l p_i w_i -\sum_i^l p_i x_i$

5voto

brian Puntos 124

Es cuestión de elegir cómo se escribe el lagrangiano en el contexto de Lagrange/KKT. Dependiendo de cómo se escriba, los gradientes de las funciones objetivo y de restricción son paralelos o antiparalelos en un óptimo (adecuado), y el multiplicador de Lagrange no es negativo ni positivo. A fin de cuentas, es el mismo (subconjunto de) óptimos el que cubre la FOC lagrangiana.

Sin embargo, existe una opción estándar, a veces llamada formulario estándar en la literatura de optimización---que asegura los multiplicadores de Lagrange $\lambda$ son no negativo . (Véase, por ejemplo, Optimización convexa por Boyd y Vandenberghe).

En la forma estándar, el lagraniano se escribe siempre de forma que mejore la función objetivo.

Esta convención no siempre se señala/sigue en los textos de economía. Cuando se sigue en contextos económicos, los multiplicadores de Lagrange admiten la interpretación habitual como valores marginales de las restricciones correspondientes, una especie de "utilidad marginal indirecta". Por ejemplo, el multiplicador de Lagrange de forma estándar es la derivada de la función de utilidad indirecta con respecto a la riqueza, que debe ser no negativa.

Por ejemplo, consideremos el problema de maximización $$ \max_{g(x) \geq 0} u(x) $$ donde $u : \mathbb{R}^n \rightarrow \mathbb{R}$ y $g : \mathbb{R}^n \rightarrow \mathbb{R}^p$ . Por ejemplo, en un problema de consumo, $u$ es la función de utilidad, $p = 1$ y $g(x) = p^T(w-x)$ .

Entonces la forma estándar del Lagrangiano es $$ L(x, \lambda) = u(x) + \lambda^T g(x). $$ Mejora la función objetivo $u$ cuando $\lambda \geq 0$ . Esto significa que, para los problemas de maximización, $L(x, \lambda) \geq u(x)$ para todos $x$ y todos $\lambda \geq 0$ . Ya que estás tratando de maximizar $u$ mejorando en $u$ significa ser mayor que $u$ .

  1. En la forma estándar, los multiplicadores de Lagrange deben ser no negativos, es decir, en un óptimo (adecuado) $x^*$ Debemos tener $D u(x^*) + \lambda^T D g(x^*) = 0$ para algunos $\lambda$ con no negativo entradas. Esto es fácil de ver, especialmente en el caso de la restricción única $p = 1$ . Si la restricción $g$ es flojo, entonces $\lambda = 0$ . Si $g$ se une, entonces el gradiente $D g(x^*)$ debe apuntar hacia el interior $\{ g > 0 \}$ . Por otro lado, $D u(x^*)$ no puede apuntar hacia el interior de lo contrario habría un óptimo en el interior. Así que $D u(x^*)$ y $D g(x^*)$ son antiparalelas y $\lambda > 0$ .

  2. Si el problema de maximización se formula como $$ \max_{g(x) \leq 0} u(x) $$ entonces la forma estándar del Lagrangiano es $L(x, \lambda) = u(x) - \lambda^T g(x)$ . De nuevo, $L$ está escrito de tal manera que, cuando $\lambda$ es no negativo, $L$ mejora $u$ . Algo similar para un problema de minimización.

  3. La "idoneidad" de un óptimo significa que $D g(x^*)$ debe ser de rango completo. Este tipo de condición se denomina calificación de la restricción . El teorema general de KKT dice que la FOC lagrangiana es una condición necesaria para los óptimos locales en los que se cumple la calificación de la restricción. Cuando la función objetivo es cóncava o cuasi-cóncava (convexa o cuasi-convexa, para la minimización), entonces la calificación de la restricción no es necesaria y la FOC lagrangiana es suficiente para los óptimos globales.

0 votos

'+1' explicación y notación brillante. Me gusta la frase "escrita de tal manera que mejore la función objetivo". Así que para ser perfectamente claro la forma estándar tiene dos requisitos : 1) $\lambda \geq 0$ para los puntos críticos y 2) $L(x,\lambda)$ se escribe para mejorar la función obejtiva, lo que implica que $(+-)\lambda g(x) \geq 0$ para la maximización y $(+-)\lambda g(x) \leq 0$ para la minimización?

1 votos

@JesperHybel Sí re su comentario 2), en particular el $+/-$ frente a $\lambda g(x)$ que señala la elección de $\geq/\leq$ en la restricción de desigualdad. 1) es una consecuencia, más que un requisito. Si se cumple 2), entonces $\lambda^*$ debe ser no negativo en un óptimo adecuado.

1voto

Matthias Benkard Puntos 11264

Las dos formas de correctamente La configuración del lagrangiano es completamente equivalente (aunque tienes errores arriba), así que no importa cómo lo configures.

En realidad tienes un error que hace que las dos formas sean diferentes:

En la primera ecuación has olvidado el signo menos ya que: $ \sum_i^l p_i w_i = \sum_i^l p_i x_i \implies 0 = \sum_i^l p_i w_i - \sum_i^l p_i x_i \neq 0 = \sum_i^l p_i w_i + \sum_i^l p_i x_i $

Por lo tanto, el primer lagrangiano configurado correctamente tendrá el siguiente aspecto

$L_1=u(X)+\lambda ( \sum_i^l p_i w_i - \sum_i^l p_i x_i) = u(X)+\lambda ( \sum_i^l p_i w_i) - \lambda (\sum_i^l p_i x_i)) $

En la segunda ecuación cometes el error de olvidar que en la segunda forma de plantear el lagrangiano el multiplicador tiene signo negativo $-\lambda$ (ver Hammond et al Essential Mathematics for Economic Analysis pp 499 para una explicación completa del porqué)

$L_2=u(X)-\lambda ( \sum_i^l p_i x_i -\sum_i^l p_i w_i) = u(X)+\lambda ( \sum_i^l p_i w_i) - \lambda (\sum_i^l p_i x_i))$

Por lo tanto, es evidente que tanto $L_1$ y $L_2$ son completamente equivalentes, sólo tienes que configurarlos sin cometer errores tipográficos.

0 votos

Hola, @imuflon1, he cometido una errata. En la primera ecuación, pw+px debería cambiarse por pw-px. Ahora, dos ecuación es diferente (diferente sing de lambda). Estás diciendo que la primera ecuación es correcta (en la versión modificada) y la segunda ecuación es incorrecta. ¿Correcto? ¿Por qué la segunda ecuación es incorrecta?

0 votos

@martian03 porque dependiendo de cómo se resuelva la restricción para el cero hay que cambiar el signo de lambda - lambda no puede ser positiva sin más - el signo de lambda lo dicta la restricción, es decir. $g(x,y)=c$ puede resolverse en cero como $0=c-g(x,y)$ y en ese caso lambda tiene que ser positiva $\lambda$ o como $g(x,y)-c=0$ en cuyo caso tiene que ser $-\lambda$ .

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X