Me gustaría que me ayudaran a entender la definición de Equilibrio correlacionado de Bayes (BCE) en un juego de información incompleta en la p.7 de este papel.
Permítanme resumir la definición que se ofrece en el documento.
Hay $N\in \mathbb{N}$ jugadores, con $i$ que denota un jugador genérico.
Existe un conjunto finito de estados $\Theta$ con $\theta$ que denota un estado genérico.
Un juego básico $G$ consiste en
-
para cada jugador $i$ un conjunto finito de acciones $A_i$ donde escribimos $A\equiv A_1\times A_2\times ... \times A_N$ y una función de utilidad $u_i: A\times \Theta \rightarrow \mathbb{R}$ .
-
un apoyo completo antes $\psi\in \Delta(\Theta)$ .
Una estructura de información $S$ consiste en
-
para cada jugador $i$ un conjunto finito de señales $T_i$ donde escribimos $T\equiv T_1\times T_2\times ... \times T_N$ .
-
una distribución de la señal $\pi: \Theta \rightarrow \Delta(T)$ .
Una regla de decisión del juego de información incompleta $(G,S)$ es un mapeo $$ \sigma: T\times \Theta\rightarrow \Delta(A) $$
Definición de BCE: La regla de decisión $\sigma$ es un BCE para el juego $(G,S)$ si, para cada $i=1,...,N$ , $t_i\in T_i$ y $a_i\in A_i$ tenemos $$ \sum_{a_{-i}, t_{-i}, \theta} \psi(\theta) \pi(t_{-i}|t_i, \theta) \sigma(a_{-i}| a_i,t_i, t_{-i}, \theta) u_i(a_i, a_{-i},\theta) $$ $$ \geq \sum_{a_{-i}, t_{-i}, \theta} \psi(\theta) \pi(t_{-i}|t_i, \theta) \sigma(a_{-i}| a_i,t_i, t_{-i}, \theta) u_i(\tilde{a}_i, a_{-i},\theta) $$ $\forall \tilde{a}_i\in A_i$ .
Pregunta:
1) No entiendo cómo se calcula la expectativa condicional en la definición. Considere, por ejemplo, el lado izquierdo (LHS) y permítame ir a través de cada paso utilizando la notación $Pr(\cdot)$ para denotar genéricamente cualquier distribución de probabilidad.
El LHS es la recompensa esperada del jugador $i$ donde la expectativa se calcula wrto todo lo que no conoce condicionado a lo que conoce. Por lo tanto, $$ \sum_{a_{-i}, \theta, t_{-i}} u_i(a_{-i},a_i, \theta) \times Pr(a_{-i}, \theta, t_{-i}| t_i, a_i)= $$ $$ \sum_{a_{-i}, \theta, t_{-i}} u_i(a_{-i},a_i, \theta) \times Pr(a_{-i}| \theta, t_{-i}, t_i, a_i)\times Pr(\theta, t_{-i}| t_i, a_i)= $$ $$ \sum_{a_{-i}, \theta, t_{-i}} u_i(a_{-i},a_i, \theta) \times \underbrace{Pr(a_{-i}| \theta, t_{-i}, t_i, a_i)}_{\equiv \sigma(a_{-i}| a_i,t_i, t_{-i}, \theta) \text{ [OK!]}}\times \underbrace{Pr(t_{-i}|\theta, t_i, a_i)}_{\equiv \pi(t_{-i}|t_i, \theta)? \text{ Where is $ a_i $?} }\times \underbrace{Pr(\theta| t_i, a_i)}_{\equiv \psi(\theta)?\text{ Where are $ t_i, a_i $?}}= $$
¿Estamos asumiendo
1) $t_{-i}\perp a_i $ condicionado a $\theta, t_i$
2) $\theta \perp t_i, a_i$
?
2) ¿Cómo se simplifica la definición de BCE cuando $N=1$ ?
De la lectura de la página 25 del documento vinculado, parece que un BCE sigue siendo un mapa de estado y señal a una distribución de probabilidad sobre las acciones . De la lectura en la p.26 del documento enlazado, los autores dicen entonces "[...] En ese caso, el conjunto de BCE corresponde a la distribución conjunta de acciones y los estados [...] ". Estoy confundido.
Además, cuando $N=1$ ¿En qué se diferencia la definición de BCE de la definición de Equilibrio Bayesiano de Nash?
3) Sólo como curiosidad, ¿cuál es la razón de incluir el adjetivo " correlacionado "?