2 votos

¿Qué truco se puede utilizar para calcular los equilibrios mixtos?

En los juegos continuos, las distribuciones de probabilidad sobre los espacios de estrategia de los jugadores son infinitas. ¿Cómo es posible entonces derivar un equilibrio nash de estrategia mixta?

Habría que demostrar que la estrategia mixta de un jugador es la mejor respuesta posible de estrategia mixta a la estrategia de otro jugador. En el caso continuo, ¿cómo es posible? ¿Cómo se puede maximizar sobre "todas las distribuciones de probabilidad posibles"?

¿Alguien puede dar una pista?

0 votos

1. Si una estrategia mixta $\sigma_i$ es la mejor respuesta a las estrategias de otros jugadores $\sigma_{-i}$ entonces todas las estrategias puras que se juegan con probabilidad positiva en $\sigma_i$ debe conducir a la misma recompensa cuando se juega contra $\sigma_{-i}$ . 2. Incluso en juegos con un número finito de estrategias puras, las distribuciones de probabilidad sobre ellas son también infinitas.

0 votos

Ver este puesto para un ejemplo de estrategia mixta NE en un juego con espacios de estrategia continuos.

2voto

Greg Puntos 1756

El "truco" consiste en identificar una acción de equilibrio en la que se conoce (o se puede precisar) el resultado. A continuación, se puede imponer la indiferencia entre la retribución conocida de esta acción y las retribuciones de otras acciones (que dependerán de las probabilidades de mezcla) para determinar esas probabilidades de mezcla de equilibrio.

Un buen ejemplo lo encontramos en el libro de Varian " Un modelo de ventas ". Permítanme describir una versión simple de ese modelo antes de discutir lo que nos enseña sobre la búsqueda de equilibrios mixtos continuos.


Preparar

Dos empresas fijan cada una un precio, $p_i$ para un producto homogéneo que producen a coste cero. Existe un continuo de consumidores, cada uno dispuesto a pagar hasta $v$ para el producto.

Una fracción $a$ de los consumidores (llámense "compradores") comprarán a la empresa que fije el precio más bajo (rompiendo los empates al azar). Una fracción $\frac{1-a}{2}$ de los consumidores (llamados "cautivos de 1") siempre compran a la empresa $1$ (siempre y cuando $p_1<v$ ). El último $\frac{1-a}{2}$ de los consumidores (llamados "cautivos del 2") siempre compran a la empresa $2$ (siempre y cuando $p_2<v$ ).

Deberías ser capaz de comprobar rápidamente que este juego no tiene un equilibrio de estrategia pura (piensa en por qué no podemos tener un equilibrio con $0<p_1<p_2$ , $0<p_1=p_2$ o $0=p_1=p_2$ ).

Así, buscamos un equilibrio de estrategia mixta en el que los precios se extraen de la distribución $F$ . Que el apoyo de $F$ (es decir, el rango de precios en el que las empresas se mezclan) sea $[\underline{p},\overline{p}]$ .

Ninguna empresa elegirá $p_i>v$ porque entonces no sirve a los consumidores, pero podría obtener un beneficio de $v(1-a)/2$ sirviendo a sus cautivos a un precio de $v$ . Así, $\overline{p}\leq v$ .

El beneficio de una empresa si fija el precio $p$ es $$\frac{1-a}{2}p+ap[1-F(p)].$$ El primer término es el beneficio de los cautivos (a los que la empresa sirve con seguridad). El segundo término es el beneficio de los compradores, a los que se sirve sólo si la empresa rival fija un precio más alto (lo que ocurre con probabilidad $1-F(p)$ ).

Encontrar el equilibrio de estrategia mixta

Sabemos que si la empresa va a mezclar sobre los precios $p$ y $\overline{p}$ entonces debe ser indiferente: $$\frac{1-a}{2}p+ap[1-F(p)]=\frac{1-a}{2}\overline{p}+a\overline{p}[1-F(\overline{p})].$$ Obsérvese que si pudiéramos eliminar el $\overline{p}$ términos del lado derecho, entonces tendríamos una ecuación que podría resolverse para la estrategia de equilibrio, $F$ .

La siguiente parte es la clave para poder encontrar el equilibrio, así que la pondré en un recuadro:

Pensemos en lo que ocurre cuando una empresa establece $p_i=\overline{p}$ . Porque $\overline{p}$ es el precio más alto que se cobra en equilibrio, sabemos que la empresa nunca sirve a los compradores a ese precio (es decir, $F(\overline{p})=1$ ). Además, como la empresa sólo sirve a sus cautivos, que comprarán a cualquier precio inferior a $v$ debe ser el caso que $\overline{p}=v$ .

Por lo tanto, sabemos que:

  • $\overline{p}$ es en apoyo de $F$ lo que significa que las empresas deben ser indiferentes entre $\overline{p}$ y cualquier otro precio
  • $\overline{p}$ resultados de los beneficios $\frac{1-a}{2}\overline{p}$
  • $\overline{p}=v.$

Uniendo estos hechos a la condición de indiferencia, tenemos $$\frac{1-a}{2}p+ap[1-F(p)]=\frac{1-a}{2}v,$$ lo que implica $$F(p)=1-\frac{\frac{1-a}{2}(v-p)}{ap},$$ que es nuestro equilibrio de estrategia mixta. La única parte del equilibrio que no hemos resuelto es el valor de $\underline{p}$ . Pero esto se encuentra fácilmente resolviendo $F(\underline{p})=0$ para $\underline{p}$ ahora que sabemos $F(\cdot)$ .


Observaciones finales

El truco utilizado en el ejemplo anterior es bastante útil en general.

A menos que la estrategia de equilibrio, $F$ tiene un átomo, sabemos por definición que $F(\underline{p})=0$ y $F(\overline{p})=1$ . Por lo tanto, si podemos utilizar razonamiento económico para determinar el valor de $\overline{p}$ o $\underline{p}$ (como en el cuadro anterior) entonces podemos eliminar todos los términos que dependen de $\overline{p}$ (o $\underline{p}$ ) en el lado derecho de nuestra ecuación de indiferencia y luego resolver para $F$ .

0voto

Neil Foley Puntos 1313

No estoy seguro de si estás buscando un truco muy abstracto e intuitivo para encontrar un equilibrio de Nash mixto, o simplemente un ejemplo de cómo encontrar uno.

Asumiré esto último.

Supongamos que tenemos el siguiente juego:

$$ L \ \ \ \ \ \ |\ \ R \\ U (1,1) | (0,0) \\ D (0,0) | (1,1) $$

Claramente $(U,L)$ y $(D,R)$ son NE (son NE puros). Sin embargo, también existe una estrategia mixta NE. ¿Cómo podemos encontrarlo?

Hacemos lo siguiente:

Supongamos que el jugador 1 mezcla, yendo $U$ con probabilidad $\alpha$ y $D$ con probabilidad $1-\alpha$ . (Así que $\alpha \in [0,1]$ ) Esto significa que el jugador 2 debe tener el mismo resultado esperado si van $L$ o $R$ .

Por lo tanto, podemos expresar la estrategia del jugador 2 así:

Si fueron $L$ su pago esperado es:

$$1\times \alpha + 0 \times (1-\alpha) = \alpha$$

Si fueron $R$ su pago esperado es:

$$0 \times \alpha + 1 \times (1-\alpha) = 1 -\alpha$$

Recuerde, su resultado esperado de $L$ y $R$ deben ser iguales, por lo tanto:

$$\alpha = 1-\alpha \Rightarrow 2\alpha = 1 \Rightarrow \alpha = \frac{1}{2}$$

Lo que acabamos de hacer es resolver la estrategia mixta del jugador 1: ir $U$ con probabilidad $\frac{1}{2}$ y $D$ con probabilidad $1-\frac{1}{2} = \frac{1}{2}$ .

Podemos encontrar las probabilidades del jugador 2 de forma similar. Tenga en cuenta que el proceso para hacer esto es diferente dependiendo del tipo de juego, pero su principal "truco" aquí es notar que en el equilibrio de estrategia mixta, los resultados esperados sobre las estrategias deben ser iguales.

1 votos

El PO pregunta específicamente sobre continuo juegos, pero su ejemplo presenta un juego con finito espacios de estrategia.

0 votos

Lo siento, leí mal, pensé que se referían a un espacio de probabilidad continua, mi error.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X