Definición de equilibrio Nash bayesiano

Question

Definición de equilibrio Nash bayesiano

Preguntado el 14 de Abril, 2019: Cuando se hizo la pregunta
436 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Tengo una duda básica sobre la definición de equilibrio Nash bayesiano.

Considere el siguiente juego:

1) $N$ jugadores.

2) Cada jugador $i$ tiene un tipo, asignado por la naturaleza y denotado por $\epsilon_i$ .

$\epsilon_i$ puede considerarse como una variable aleatoria, es decir, un mapa del conjunto de estados del mundo $\Omega$ a algunos números reales. $Pr$ utilizado a continuación denota la "verdadera" medida de probabilidad subyacente utilizada por la naturaleza.

Dejemos que $E_i$ denotan el soporte de $\epsilon_i$

Supuesto de estructura de la información (información mínima): Supongamos que el jugador $i$ sólo sabe cuál es su propio tipo. Supongamos también que las variables aleatorias $\epsilon_1,...,\epsilon_N$ son mutuamente independientes. Esto implica que, al conocer su propio tipo, un jugador no obtiene información útil sobre los tipos de los demás jugadores.

3) Cada jugador $i$ tiene que elegir entre un conjunto finito de acciones $A_i$ .

4) $u_i: E_i\times (A_1\times ... \times A_N)\rightarrow \mathbb{R}$ es la utilidad del jugador $i$ .

5) Una estrategia pura de jugador $i$ es una función $s_i: E_i\rightarrow A_i$ .

¿Cuál es la definición exacta del equilibrio de Nash bayesiano? A continuación se presenta lo que he entendido, con cuatro preguntas.

Dejemos que $\sigma_{a_j}$ sea la creencia del jugador $i$ ese jugador $j$ jugará $a_j$ con la condición de $i$ (es decir $\epsilon_i$ ). Tenga en cuenta que $\sigma_{a_j}$ no está indexado por $i$ : jugador $i$ y el jugador $k$ tienen la misma creencia que el jugador $j$ jugará $a_j$ porque los tipos son mutuamente independientes.

Dejemos que $\sigma$ sea el vector que recoge todas esas creencias.

Dado $\sigma$ , dejemos que $(s^\sigma_1,...,s^\sigma_N)$ sea el vector de estrategias puras tal que

$$ (1)\hspace{1cm}s^\sigma_i=\text{argmax}_{s_i} \mathbb{E}_{\sigma}\Big[u_i(s_i(E_i),A_{-i})\Big|E_i\Big] \hspace{1cm} \forall i $$ donde $\mathbb{E}_{\sigma}$ es la expectativa wrto a $A_{-i}$ calculado mediante $\sigma$ . Aquí supongo que estamos asumiendo que $(s^\sigma_1,...,s^\sigma_N)$ existe. Puede que no exista, en cuyo caso podemos utilizar la noción de estrategia mixta.

Dejemos que $\sigma^*$ sea una solución del siguiente sistema (supongamos que existe, de nuevo)

$$ (2)\hspace{1cm}\sigma_{a_i}=Pr(\text{$ E_i $ takes a value such that $ s_i^\\\Nsigma=a_i $}) \hspace{1cm} \forall a_i\in A_i,\forall i $$

Pregunta A) Decimos que $\sigma^*$ es un equilibrio Nash bayesiano del juego. ¿Es esto correcto? ¿O es $(s^{\sigma^*}_1,...,s^{\sigma^*}_N)$ ?

Pregunta B) Es $\sigma^*$ un "equilibrio de estrategia mixta" (perdón si es incorrecto o descuidado, he puesto "..." a propósito)? Estoy muy confundido con respecto a este punto. Por un lado, $\sigma^*$ es una distribución de probabilidad sobre las acciones; por lo tanto, se podría pensar que cada jugador elige la acción real en una lotería basada en $\sigma^*$ . Por otro lado, $(s^{\sigma^*}_1,...,s^{\sigma^*}_N)$ dice exactamente lo que cada jugador debe jugar en realidad para una realización determinada de $(\epsilon_1,...,\epsilon_N)$ Por lo tanto, ¡no hay lotería!

Pregunta C) A veces, cuando se describe un juego con información incompleta, se asume también que cada jugador $i$ tiene una previa $\mu_i$ con respecto a la distribución de probabilidad de $\epsilon_{-i}$ . ¿Está esto de alguna manera implícita en mi caracterización del vector de creencia $\sigma$ ?

Pregunta D) Supongamos ahora que somos agnósticos en cuanto a la estructura de información del juego: podríamos tener información completa, o información mínima (como la anterior), o casos híbridos entre estos dos extremos. Sabemos que cada jugador $i$ recibe una señal aleatoria más o menos informativa $\tau_i$ sobre $\epsilon_{-i}$ con apoyo $T_i$ . ¿Podemos aún definir un equilibrio bayesiano de dicho juego "relajado"? En un libro que estoy leyendo, un equilibrio bayesiano del juego "relajado" se define como un mapa $$ \sigma \equiv \Pi_{i=1}^n \sigma_i\text{, where $ \N-igma_iequiv (\N-sigma^{a_i}_i \N-texto para todo a_i\Nen A_i) $ and $ |sigma^{a_i}_i: E_i\times T_i \rightarrow [0,1]}_{text{{{para cada realización de $\epsilon_i, \tau_i$ da la probabilidad de que el jugador $i$ juega $a_i$ }} $} $$ ¿Le parece correcto? ¿Escribir $\sigma \equiv \Pi_{i=1}^n \sigma_i$ subyacen algunas suposiciones implícitas sobre la independencia o similares? ¿Cómo podemos encontrar $\sigma$ (es decir, qué debe resolver)?

Actualice la respuesta a continuación: Gracias por la respuesta. Para asegurarme de que he entendido, voy a actualizar mi ejemplo de acuerdo con sus explicaciones.

Supongamos que existe un equilibrio de estrategia pura.

En primer lugar, dada la creencia del jugador $i$ con respecto a las acciones de los otros jugadores ( $\mu_i$ ), defino al jugador $i$ como la función $s_i: E_i \rightarrow A_i$ . También, $s\equiv (s_1,..., s_N)$ .

En segundo lugar, dada la estrategia pura adoptada por los otros jugadores ( $s_{-i}$ ),
Defino la creencia del jugador $i$ con respecto al jugador $j$ como la función $\mu^{j}_{i}: E_i \rightarrow \Delta(A_j)$ . Sea $\mu^{a_j}_i$ denotan el $a_j$ componente de la función de $\mu^{j}_{i}$ .

Asumo que los jugadores forman sus creencias utilizando la verdadera distribución de probabilidad de los tipos adoptados por la naturaleza. Por lo tanto, $\mu^{a_j}_{i}(\epsilon_i)= Pr(s_j(\epsilon_j)=a_j| \epsilon_i)\overbrace{=}^{\epsilon_i\perp \epsilon_j} =Pr(s_j(\epsilon_j)=a_j)\equiv \sigma_{a_j}\in [0,1]$ .

Observe que la función $\mu^{j}_{i}$ es plana en $E_i$ (porque los tipos son independientes entre sí) y $\mu^j_i=\mu^j_k$ (porque todos los jugadores forman sus creencias utilizando la verdadera distribución de probabilidad de los tipos adoptados por la naturaleza). Además, asumo que los jugadores no se coordinan, por lo que $\mu^{-i}_i=\Pi_{j\neq i} \mu^j_i$ .

Ahora defino un equilibrio de Nash bayesiano. Sea $\sigma^*_i\in \Delta(A_i)$ (con $\sigma^*_{a_i}$ que denota la $a_i$ componente) y $\sigma^*\equiv (\sigma^*_1,..., \sigma^*_N)$ . $(\sigma^*,s^*)$ es un equilibrio Nash bayesiano si

$$\begin{cases} s^*_i(\epsilon_i)=argmax_{s_i(\epsilon_i)} \mathbb{E}_{\sigma^*}(u_i(s_i(\epsilon_i), s^*_{-i}(\epsilon_{-i})| \epsilon_i) & \forall i \\ \sigma^*_{a_i}= Pr(s^*_i(\epsilon_i)=a_i) & \forall a_i\in A_i, \forall i\end{cases}$$

(I) ¿Es correcta esta recapitulación?

Ahora, eliminemos la suposición de que los tipos son mutuamente independientes (pero seguimos manteniendo que el equilibrio de estrategia pura existe). Tenemos que modificar ligeramente la definición de creencias.

Dada la estrategia pura adoptada por los otros jugadores ( $s_{-i}$ ), defino la creencia del jugador $i$ con respecto al jugador $j$ como la función $\mu^{j}_{i}: E_i \rightarrow \Delta(A_i)$ , donde $\mu^{a_j}_{i}(\epsilon_i)= Pr(s_j(\epsilon_j)=a_j| \epsilon_i)$ .

Ahora defino un equilibrio de Nash bayesiano. Sea $\sigma^{i,*}_j: E_i\rightarrow \Delta(A_j) $ . Dejemos que $\sigma^{i,*}\equiv (\sigma^{i,*}_1,..., \sigma^{i,*}_N)$ . Sea $\sigma^*\equiv (\sigma^{1,*},..., \sigma^{N,*})$ .

$(\sigma^*,s^*)$ es un equilibrio Nash bayesiano si

$$ \begin{cases} s^*_i=argmax_{s_i} \mathbb{E}_{\sigma^{i,*}}(u_i(s_i(\epsilon_i), s^*_{-i}(\epsilon_{-i})| \epsilon_i) & \forall i \\ \sigma^{i,*}_{a_j}(\epsilon_i)= Pr(s^*_j(\epsilon_j)=a_j|\epsilon_i) & \forall i, \forall a_j\in A_j,\forall j\neq i \end{cases} $$

(II) ¿Se ha analizado correctamente esta segunda hipótesis?

(III) Siguiendo su definición de equilibrio Nash bayesiano, creo que $s^*$ es lo que se llama "CONJUNTO DE ESTRATEGIAS" y $\sigma^*$ es lo que usted llama "CONJUNTO DE CREENCIAS", ¿correcto?

(IV) Tengo una última duda: tomemos un juego en el que permanezcamos agnósticos sobre la estructura de la información, es decir, podríamos tener información completa, o información mínima (como la anterior), o casos híbridos entre estos dos extremos. Sabemos que, antes de tomar una decisión, cada jugador $i$ recibe una realización de señal aleatoria más o menos informativa $\tau_i$ sobre $\epsilon_{-i}$ con apoyo $T_i$ . Al recibir dicha realización, cada jugador $i$ actualiza sus creencias previas. ¿Seguimos asumiendo que, bajo cualquier estructura de información, cada jugador conoce completamente $Pr$ para que pueda actualizar "correctamente" su anterior?

Preguntado el 14 de Abril, 2019 por Joel Salisbury

Answer 1

1 Respuestas

Answer 2

5voto

mat_jack1 Puntos 209

El equilibrio bayesiano de Nash es un conjunto de estrategias $\{\sigma_i\}$ uno para cada jugador y algunas creencias $\{\mu_i\}$ también uno para cada jugador tal que $\sigma_i$ es la mejor respuesta para el jugador $i$ dada su creencia, $\mu_i$ y las creencias son bayesianas para todos los jugadores, dada su información.

Cada estrategia $\sigma_i$ es una función del conjunto de tipos a una estrategia (posiblemente mixta): $\sigma_{a_i}: E_i\rightarrow \Delta(A_i)$ Estoy usando $\Delta$ para denotar que es una distribución de probabilidad sobre las acciones. Así, para cualquier elemento $\epsilon_i$ la función $\sigma_{a_i}(\epsilon_i)$ le da la probabilidad con la que cada acción es jugada por el jugador $i$ (Deja que $\sigma$ denotan el vector de todas esas funciones). Obsérvese que para que los jugadores encuentren sus mejores respuestas necesitan formarse creencias sobre lo que hacen los demás jugadores. En equilibrio, esas creencias son correctas, por lo que saben que los demás jugadores están utilizando las estrategias $\{\sigma_j\}$ De ahí la expectativa en la definición que diste (que sólo funciona para estrategias puras, pero puede extenderse fácilmente a estrategias mixtas).

La expectativa está tomada porque aunque sabes $\sigma$ Los otros jugadores pueden utilizar estrategias mixtas. Además, incluso si todos los jugadores están eligiendo estrategias puras, sólo se sabe que están utilizando $\sigma$ que te indica su mejor respuesta dado su tipo. Pero usted no conoce su tipo, por lo que tiene que tener expectativas sobre eso. Ahí es donde $\mu$ entra porque hay que formar creencias sobre los tipos del otro jugador. En este caso, como los tipos son independientes, el aprendizaje de tu tipo no proporciona información sobre los tipos de los otros jugadores, por lo que el previo es igual al posterior. Así, las creencias son bayesianas si se calcula el valor esperado (en la primera ecuación) según la probabilidad "verdadera" con la que la naturaleza elige los tipos, y las estrategias mixtas elegidas por cada jugador, según $\sigma$ .

Dirigirnos directamente a sus preguntas:

A) $\sigma$ es un equilibrio bayesiano. Sólo si se sabe que es en estrategias puras, entonces se puede decir que $(s_1^\sigma, \dots, s_N^\sigma)$ es un equilibrio bayesiano. Nótese que ambas son funciones de $E_i$ al conjunto de estrategias mixtas y al conjunto de estrategias puras, respectivamente.

B) Espero que mi discusión anterior haya aclarado esto. En general, hay que pensar en $\sigma$ como la estrategia de equilibrio (pura o mixta) y aquí siempre conlleva incertidumbre, porque no se conocen los tipos de los otros jugadores, por lo que se puede desconocer la estrategia pura que están utilizando.

C) Lo de la previa se asume implícitamente en la forma de calcular $E_{\sigma}(u_i(s_i(E_i), \sigma_{-i}(E_{-i})|E_i)$ porque $A_{-i}$ depende de los tipos de los otros jugadores que no conoces, pero tu creencia sobre su tipo puede depender de tu propio tipo.

D)La noción de equilibrio bayesiano de Nash puede utilizarse para estructuras de información generales, La notación $\sigma=\prod_{i=1}^n\sigma_i$ implica que cada jugador elige su estrategia $\sigma_i$ de forma independiente. (los jugadores no se coluden ni se coordinan) esta es una suposición relativamente suave que se hace la mayoría de las veces. A veces es útil pensar que los jugadores correlacionan sus acciones (esto se llama un Equilibrio Correlacionado de Bayes). Aparte de esto, la notación implica simplemente que $\sigma$ es el vector de estrategias de equilibrio para cada jugador, y cada una de ellas es la mejor respuesta de las estrategias de otros jugadores.

Espero que esto ayude

Respondido el 15 de Abril, 2019 por mat_jack1 (209 Puntos )

Definición de equilibrio Nash bayesiano

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

Finanhelp.com

Powered by:

Definición de equilibrio Nash bayesiano

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

Finanhelp.com

Powered by: