6 votos

Bayes Correlación de Equilibrio: la obediencia

Me gustaría que me ayuden a entender la definición de la obediencia en un juego de información incompleta en p.7 de este documento.


Permítanme resumir la definición proporcionada en el documento.

Hay $N\in \mathbb{N}$ jugadores, con $i$ denota un genérico jugador.

Hay un conjunto finito de estados $\Theta$, con $\theta$ denota un estado genérico.

Un juego básico $G$ se compone de

  • para cada jugador i $$, un conjunto finito de acciones $A_i$, donde escribimos $A\equiv A_1\times A_2\times ... \times A_N$, y una función de utilidad de $u_i: A\times \Theta \rightarrow \mathbb{R}$.

  • un soporte completo antes de $\psi\en \Delta(\Theta)$.

Una estructura de información $S$ se compone de

  • para cada jugador i $$, un conjunto finito de señales de $T_i$, donde escribimos $T\equiv T_1\times T_2\times ... \times T_N$.

  • una distribución de señales de $\pi: \Theta \rightarrow \Delta(T)$.

Una regla de decisión de la incompleta información de juego de $(G,S)$ es una asignación $$ \sigma: T\times \Theta\rightarrow \Delta(A) $$

Una forma mecánica de comprender la noción de la regla de decisión es vista $\sigma$ como la estrategia de un omnisciente mediador que primero se observa la realización $\theta\en \Theta$ elegidos en función $\psi$ y la realización $t\T$ elegidos en función $\pi\cdot|\theta)$; y, a continuación, elige una distribución de probabilidad a partir de $\Delta(Una)$, y privadas, y anuncia a cada jugador $i$, su lotería para jugar.

Para que los jugadores tengan un incentivo para seguir la recomendación del mediador en este escenario, tendría que ser el caso que el recomendado de la lotería fue siempre preferida a cualquier otra lotería condicional sobre la señal de $t_i$ que el jugador i $$ que había recibido.

Esto se refleja en el siguiente "obediencia" condición.

Definición: La regla de decisión $\sigma$ es obediente por $(G,S)$ si, por cada $i=1,...,N$, $t_i\en T_i$, y $a_i\en A_i$, tenemos $$ \sum_{a_{-i}, t_{-i}, \theta} \psi(\theta) \pi(t_i,t_{-i}| \theta) \sigma(a_i, a_{-i}|t_i, t_{-i}, \theta) u_i(a_i, a_{-i},\theta) $$ $$ \geq \sum_{a_{-i}, t_{-i}, \theta} \psi(\theta) \pi(t_i,t_{-i}| \theta) \sigma(a_i, a_{-i}|t_i, t_{-i}, \theta) u_i(\tilde{a}_i, a_{-i},\theta) $$ $\forall \tilde{a}_i\en A_i$.


Mi pregunta:

No entiendo completamente el LHS (o, equivalentemente, la RHS) la expresión $$\sum_{a_{-i}, t_{-i}, \theta} \psi(\theta) \pi(t_i,t_{-i}| \theta) \sigma(a_i, a_{-i}|t_i, t_{-i}, \theta) u_i(a_i, a_{-i},\theta)$$

Decirlo en palabras, esto es la suma de más de $A_{-i}, T_{-i}, \Theta$de $$ \text{[Prob de que el mediador observa $(\theta, t)$]}\times\\ \text{[Prob de que el mediador sugiere que los jugadores jueguen $a$ en $\sigma$, dado que se observa $(\theta, t)$]}\times\\ \text{[Lucro que jugador $i$ pone de obedecer el mediador, dado que los otros jugadores obedecer también]} $$

Deje que el producto se encuentra escrito se denota por $(\estrella)$.

¿Por qué en el segundo componente de $(\estrella)$ nosotros NO condición en $a_i$ por tomar
$$ \text{[Prob de que el mediador sugiere a los otros jugadores para jugar $a_{-i}$ en $\sigma$, dado que se observa $(\theta, t)$ y dado que él sugiere jugador $i$ a jugar $a_i$]} $$ en lugar de $$ \text{[Prob de que el mediador sugiere que los jugadores jueguen $a$ en $\sigma$, dado que se observa $(\theta, t)$]} $$

5voto

mat_jack1 Puntos 209

Para entender la "Obediencia" de la desigualdad, el aviso de que el jugador es "la integración de fuera" todo lo que ella es inseguro, esta es la razón por la suma ejecuta a través de las acciones de otros jugadores, $a_{-i}$, los tipos de otros jugadores, $t_{-i}$, y el estado del mundo, $\theta$.

El primer término simplemente da la probabilidad de que el mediador observó $\theta$.

Para el segundo término, tenga en cuenta que es proporcional a la probabilidad condicional de los otros jugadores es de tipo $t_{-i}$ cuando son de tipo $t_i$ desde $\pi(t_{-i}|t_i,\theta)=\frac{\pi(t_i,t_{-i}|\theta)}{\sum_{t_{-i}}\pi(t_i,t_{-i}|\theta)}$.

Lo mismo para el tercer término, que probablemente espera allí para ver la probabilidad condicional de $\sigma(a_{-i}|a_i,t_i,t_{-i},\theta)$, pero este término es proporcional a $\sigma(a_i, a_{-i}|t_i,t_{-i},\theta)$.

Técnicamente hablando, el agente debe multiplicar su rentabilidad por la probabilidad de que otros jueguen $a_{-i}$, son de tipo $t_{-i}$ y el estado es $\theta$ condicional en ser dicho para jugar $a_i$ al ser de tipo $t_i$, por lo que el LHS debe leer:

$$\sum_{a_{-i}\en A_{-i}, t_{-i}\en T_{-i}, \theta\en\Theta}u_i((a_i,a_{-i}),\theta) \frac{\sigma((a_i,a_{-i})|(t_i,t_{-i}),\theta)\pi((t_i,t_{-i})|\theta)\psi(\theta)}{\sum_{a'_{-i}\en A_{-i}, t'_{-i}\en T_{-i}, \theta'\in\Theta}\sigma((a_i,a'_{-i})|(t_i,t'_{-i}),\theta')\pi((t_i,t'_{-i})|\theta')\psi(\theta')}$$

Y la RHS serán idénticos, excepto por la sustitución de $a_i$ con $\tilde a_i$ en la función de utilidad. Claramente, el denominador es constante a lo largo de la suma y por lo tanto puede ser simplificado.

Nota: En versiones anteriores en el papel que los autores fueron más explícito acerca de esta derivación.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X