Tengo una duda básica sobre la definición de equilibrio Nash bayesiano.
Considere el siguiente juego:
1) $N$ jugadores.
2) Cada jugador $i$ tiene un tipo, asignado por la naturaleza y denotado por $\epsilon_i$ .
$\epsilon_i$ puede considerarse como una variable aleatoria, es decir, un mapa del conjunto de estados del mundo $\Omega$ a algunos números reales. $Pr$ utilizado a continuación denota la "verdadera" medida de probabilidad subyacente utilizada por la naturaleza.
Dejemos que $E_i$ denotan el soporte de $\epsilon_i$
Supuesto de estructura de la información (información mínima): Supongamos que el jugador $i$ sólo sabe cuál es su propio tipo. Supongamos también que las variables aleatorias $\epsilon_1,...,\epsilon_N$ son mutuamente independientes. Esto implica que, al conocer su propio tipo, un jugador no obtiene información útil sobre los tipos de los demás jugadores.
3) Cada jugador $i$ tiene que elegir entre un conjunto finito de acciones $A_i$ .
4) $u_i: E_i\times (A_1\times ... \times A_N)\rightarrow \mathbb{R}$ es la utilidad del jugador $i$ .
5) Una estrategia pura de jugador $i$ es una función $s_i: E_i\rightarrow A_i$ .
¿Cuál es la definición exacta del equilibrio de Nash bayesiano? A continuación se presenta lo que he entendido, con cuatro preguntas.
Dejemos que $\sigma_{a_j}$ sea la creencia del jugador $i$ ese jugador $j$ jugará $a_j$ con la condición de $i$ (es decir $\epsilon_i$ ). Tenga en cuenta que $\sigma_{a_j}$ no está indexado por $i$ : jugador $i$ y el jugador $k$ tienen la misma creencia que el jugador $j$ jugará $a_j$ porque los tipos son mutuamente independientes.
Dejemos que $\sigma$ sea el vector que recoge todas esas creencias.
Dado $\sigma$ , dejemos que $(s^\sigma_1,...,s^\sigma_N)$ sea el vector de estrategias puras tal que
$$ (1)\hspace{1cm}s^\sigma_i=\text{argmax}_{s_i} \mathbb{E}_{\sigma}\Big[u_i(s_i(E_i),A_{-i})\Big|E_i\Big] \hspace{1cm} \forall i $$ donde $\mathbb{E}_{\sigma}$ es la expectativa wrto a $A_{-i}$ calculado mediante $\sigma$ . Aquí supongo que estamos asumiendo que $(s^\sigma_1,...,s^\sigma_N)$ existe. Puede que no exista, en cuyo caso podemos utilizar la noción de estrategia mixta.
Dejemos que $\sigma^*$ sea una solución del siguiente sistema (supongamos que existe, de nuevo)
$$ (2)\hspace{1cm}\sigma_{a_i}=Pr(\text{$ E_i $ takes a value such that $ s_i^\\\Nsigma=a_i $}) \hspace{1cm} \forall a_i\in A_i,\forall i $$
Pregunta A) Decimos que $\sigma^*$ es un equilibrio Nash bayesiano del juego. ¿Es esto correcto? ¿O es $(s^{\sigma^*}_1,...,s^{\sigma^*}_N)$ ?
Pregunta B) Es $\sigma^*$ un "equilibrio de estrategia mixta" (perdón si es incorrecto o descuidado, he puesto "..." a propósito)? Estoy muy confundido con respecto a este punto. Por un lado, $\sigma^*$ es una distribución de probabilidad sobre las acciones; por lo tanto, se podría pensar que cada jugador elige la acción real en una lotería basada en $\sigma^*$ . Por otro lado, $(s^{\sigma^*}_1,...,s^{\sigma^*}_N)$ dice exactamente lo que cada jugador debe jugar en realidad para una realización determinada de $(\epsilon_1,...,\epsilon_N)$ Por lo tanto, ¡no hay lotería!
Pregunta C) A veces, cuando se describe un juego con información incompleta, se asume también que cada jugador $i$ tiene una previa $\mu_i$ con respecto a la distribución de probabilidad de $\epsilon_{-i}$ . ¿Está esto de alguna manera implícita en mi caracterización del vector de creencia $\sigma$ ?
Pregunta D) Supongamos ahora que somos agnósticos en cuanto a la estructura de información del juego: podríamos tener información completa, o información mínima (como la anterior), o casos híbridos entre estos dos extremos. Sabemos que cada jugador $i$ recibe una señal aleatoria más o menos informativa $\tau_i$ sobre $\epsilon_{-i}$ con apoyo $T_i$ . ¿Podemos aún definir un equilibrio bayesiano de dicho juego "relajado"? En un libro que estoy leyendo, un equilibrio bayesiano del juego "relajado" se define como un mapa $$ \sigma \equiv \Pi_{i=1}^n \sigma_i\text{, where $ \N-igma_iequiv (\N-sigma^{a_i}_i \N-texto para todo a_i\Nen A_i) $ and $ |sigma^{a_i}_i: E_i\times T_i \rightarrow [0,1]}_{text{{{para cada realización de $\epsilon_i, \tau_i$ da la probabilidad de que el jugador $i$ juega $a_i$ }} $} $$ ¿Le parece correcto? ¿Escribir $\sigma \equiv \Pi_{i=1}^n \sigma_i$ subyacen algunas suposiciones implícitas sobre la independencia o similares? ¿Cómo podemos encontrar $\sigma$ (es decir, qué debe resolver)?
Actualice la respuesta a continuación: Gracias por la respuesta. Para asegurarme de que he entendido, voy a actualizar mi ejemplo de acuerdo con sus explicaciones.
Supongamos que existe un equilibrio de estrategia pura.
En primer lugar, dada la creencia del jugador $i$ con respecto a las acciones de los otros jugadores ( $\mu_i$ ), defino al jugador $i$ como la función $s_i: E_i \rightarrow A_i$ . También, $s\equiv (s_1,..., s_N)$ .
En segundo lugar, dada la estrategia pura adoptada por los otros jugadores ( $s_{-i}$ ),
Defino la creencia del jugador $i$ con respecto al jugador $j$ como la función $\mu^{j}_{i}: E_i \rightarrow \Delta(A_j)$ . Sea $\mu^{a_j}_i$ denotan el $a_j$ componente de la función de $\mu^{j}_{i}$ .
Asumo que los jugadores forman sus creencias utilizando la verdadera distribución de probabilidad de los tipos adoptados por la naturaleza. Por lo tanto, $\mu^{a_j}_{i}(\epsilon_i)= Pr(s_j(\epsilon_j)=a_j| \epsilon_i)\overbrace{=}^{\epsilon_i\perp \epsilon_j} =Pr(s_j(\epsilon_j)=a_j)\equiv \sigma_{a_j}\in [0,1]$ .
Observe que la función $\mu^{j}_{i}$ es plana en $E_i$ (porque los tipos son independientes entre sí) y $\mu^j_i=\mu^j_k$ (porque todos los jugadores forman sus creencias utilizando la verdadera distribución de probabilidad de los tipos adoptados por la naturaleza). Además, asumo que los jugadores no se coordinan, por lo que $\mu^{-i}_i=\Pi_{j\neq i} \mu^j_i$ .
Ahora defino un equilibrio de Nash bayesiano. Sea $\sigma^*_i\in \Delta(A_i)$ (con $\sigma^*_{a_i}$ que denota la $a_i$ componente) y $\sigma^*\equiv (\sigma^*_1,..., \sigma^*_N)$ . $(\sigma^*,s^*)$ es un equilibrio Nash bayesiano si
$$\begin{cases} s^*_i(\epsilon_i)=argmax_{s_i(\epsilon_i)} \mathbb{E}_{\sigma^*}(u_i(s_i(\epsilon_i), s^*_{-i}(\epsilon_{-i})| \epsilon_i) & \forall i \\ \sigma^*_{a_i}= Pr(s^*_i(\epsilon_i)=a_i) & \forall a_i\in A_i, \forall i\end{cases}$$
(I) ¿Es correcta esta recapitulación?
Ahora, eliminemos la suposición de que los tipos son mutuamente independientes (pero seguimos manteniendo que el equilibrio de estrategia pura existe). Tenemos que modificar ligeramente la definición de creencias.
Dada la estrategia pura adoptada por los otros jugadores ( $s_{-i}$ ), defino la creencia del jugador $i$ con respecto al jugador $j$ como la función $\mu^{j}_{i}: E_i \rightarrow \Delta(A_i)$ , donde $\mu^{a_j}_{i}(\epsilon_i)= Pr(s_j(\epsilon_j)=a_j| \epsilon_i)$ .
Ahora defino un equilibrio de Nash bayesiano. Sea $\sigma^{i,*}_j: E_i\rightarrow \Delta(A_j) $ . Dejemos que $\sigma^{i,*}\equiv (\sigma^{i,*}_1,..., \sigma^{i,*}_N)$ . Sea $\sigma^*\equiv (\sigma^{1,*},..., \sigma^{N,*})$ .
$(\sigma^*,s^*)$ es un equilibrio Nash bayesiano si
$$ \begin{cases} s^*_i=argmax_{s_i} \mathbb{E}_{\sigma^{i,*}}(u_i(s_i(\epsilon_i), s^*_{-i}(\epsilon_{-i})| \epsilon_i) & \forall i \\ \sigma^{i,*}_{a_j}(\epsilon_i)= Pr(s^*_j(\epsilon_j)=a_j|\epsilon_i) & \forall i, \forall a_j\in A_j,\forall j\neq i \end{cases} $$
(II) ¿Se ha analizado correctamente esta segunda hipótesis?
(III) Siguiendo su definición de equilibrio Nash bayesiano, creo que $s^*$ es lo que se llama "CONJUNTO DE ESTRATEGIAS" y $\sigma^*$ es lo que usted llama "CONJUNTO DE CREENCIAS", ¿correcto?
(IV) Tengo una última duda: tomemos un juego en el que permanezcamos agnósticos sobre la estructura de la información, es decir, podríamos tener información completa, o información mínima (como la anterior), o casos híbridos entre estos dos extremos. Sabemos que, antes de tomar una decisión, cada jugador $i$ recibe una realización de señal aleatoria más o menos informativa $\tau_i$ sobre $\epsilon_{-i}$ con apoyo $T_i$ . Al recibir dicha realización, cada jugador $i$ actualiza sus creencias previas. ¿Seguimos asumiendo que, bajo cualquier estructura de información, cada jugador conoce completamente $Pr$ para que pueda actualizar "correctamente" su anterior?