Tenemos un modelo principal-agente con acciones ocultas en el que el principal tiene aversión al riesgo y el agente es neutral al riesgo; supongamos también que hay dos niveles de producción, $x$ y $x'$ (con $x'>x$ ) y dos acciones $a,a'$ . Definir $p(a),p(a')$ las probabilidades de $x'$ en las acciones $a,a'$ respectivamente. Además, la desutilidad del agente por la acción $a'$ es $-1$ . Los salarios asociados a $x,x'$ son $w,w'$ respectivamente.
Mi problema es que no estoy seguro de cómo demostrar que el contrato óptimo requiere $x'-w' =x-w$ es decir, que el agente, al ser neutral al riesgo, asume toda la variabilidad asociada al proyecto.
Formalizo el problema (supongamos que el director quiere inducir $a'$ (si no, mi pregunta es trivial)
$\max\limits_{\{w,w'\}} u(x'-w')p(a') + u(x-w)(1-p(a'))$
$w'p(a') + w(1-p(a')) - 1 \geq 0 $
$w'p(a') + w(1-p(a')) - 1 \geq w'p(a) + w(1-p(a))$
En particular, cuando intento resolver el problema maximizando el beneficio esperado del principal sujeto a la racionalidad individual "estándar" (con $\lambda$ multiplicador) y la compatibilidad de los incentivos (con $\mu$ multiplicador) restricciones (supongo que el director está interesado en la acción más costosa $a'$ ) Me salen dos ecuaciones que no son consistentes con el resultado mencionado. En particular:
$ u'(x-w) = \lambda + \mu [1- \frac{(1-p(a))}{(1-p(a'))}]$
$ u'(x'-w') = \lambda + \mu [1- \frac{p(a)}{p(a')}]$
Es evidente que $x-w = x'-w'$ se mantiene si $p(a) =p(a')$ que no es el caso en este problema (aquí tenemos que $p(a') >p(a)$ ). Otra posibilidad sería suponer que la restricción de compatibilidad de incentivos es floja (por lo tanto $\mu = 0$ ); sin embargo, no puedo entender por qué eso debería sostenerse, cuando el principal quiere inducir la acción más costosa $a'$ (ayuda aquí)
He leído en Internet que otro enfoque sería suponer que el principal "vende" el proyecto al agente y éste, después de haber elegido qué nivel de esfuerzo maximiza su utilidad esperada, devuelve una cantidad fija al principal (llámese $\beta_{a}, \beta_{a'}$ )
Así que tendríamos algo como:
$w'p(a') + w(1-p(a')) - 1 -\beta_{a'} \geq 0 $ si el agente opta por realizar un alto esfuerzo y $w'p(a) + w(1-p(a)) -\beta_a \geq 0 $ de lo contrario.
Pero entonces, ¿cómo pasar de ahí? ¿Cómo asegurarse de que el agente va a elegir la acción $a'$ ? ¿Cómo se determinan los importes fijos? ¿Por qué son óptimos?