El "truco" consiste en identificar una acción de equilibrio en la que se conoce (o se puede precisar) el resultado. A continuación, se puede imponer la indiferencia entre la retribución conocida de esta acción y las retribuciones de otras acciones (que dependerán de las probabilidades de mezcla) para determinar esas probabilidades de mezcla de equilibrio.
Un buen ejemplo lo encontramos en el libro de Varian " Un modelo de ventas ". Permítanme describir una versión simple de ese modelo antes de discutir lo que nos enseña sobre la búsqueda de equilibrios mixtos continuos.
Preparar
Dos empresas fijan cada una un precio, $p_i$ para un producto homogéneo que producen a coste cero. Existe un continuo de consumidores, cada uno dispuesto a pagar hasta $v$ para el producto.
Una fracción $a$ de los consumidores (llámense "compradores") comprarán a la empresa que fije el precio más bajo (rompiendo los empates al azar). Una fracción $\frac{1-a}{2}$ de los consumidores (llamados "cautivos de 1") siempre compran a la empresa $1$ (siempre y cuando $p_1<v$ ). El último $\frac{1-a}{2}$ de los consumidores (llamados "cautivos del 2") siempre compran a la empresa $2$ (siempre y cuando $p_2<v$ ).
Deberías ser capaz de comprobar rápidamente que este juego no tiene un equilibrio de estrategia pura (piensa en por qué no podemos tener un equilibrio con $0<p_1<p_2$ , $0<p_1=p_2$ o $0=p_1=p_2$ ).
Así, buscamos un equilibrio de estrategia mixta en el que los precios se extraen de la distribución $F$ . Que el apoyo de $F$ (es decir, el rango de precios en el que las empresas se mezclan) sea $[\underline{p},\overline{p}]$ .
Ninguna empresa elegirá $p_i>v$ porque entonces no sirve a los consumidores, pero podría obtener un beneficio de $v(1-a)/2$ sirviendo a sus cautivos a un precio de $v$ . Así, $\overline{p}\leq v$ .
El beneficio de una empresa si fija el precio $p$ es $$\frac{1-a}{2}p+ap[1-F(p)].$$ El primer término es el beneficio de los cautivos (a los que la empresa sirve con seguridad). El segundo término es el beneficio de los compradores, a los que se sirve sólo si la empresa rival fija un precio más alto (lo que ocurre con probabilidad $1-F(p)$ ).
Encontrar el equilibrio de estrategia mixta
Sabemos que si la empresa va a mezclar sobre los precios $p$ y $\overline{p}$ entonces debe ser indiferente: $$\frac{1-a}{2}p+ap[1-F(p)]=\frac{1-a}{2}\overline{p}+a\overline{p}[1-F(\overline{p})].$$ Obsérvese que si pudiéramos eliminar el $\overline{p}$ términos del lado derecho, entonces tendríamos una ecuación que podría resolverse para la estrategia de equilibrio, $F$ .
La siguiente parte es la clave para poder encontrar el equilibrio, así que la pondré en un recuadro:
Pensemos en lo que ocurre cuando una empresa establece $p_i=\overline{p}$ . Porque $\overline{p}$ es el precio más alto que se cobra en equilibrio, sabemos que la empresa nunca sirve a los compradores a ese precio (es decir, $F(\overline{p})=1$ ). Además, como la empresa sólo sirve a sus cautivos, que comprarán a cualquier precio inferior a $v$ debe ser el caso que $\overline{p}=v$ .
Por lo tanto, sabemos que:
- $\overline{p}$ es en apoyo de $F$ lo que significa que las empresas deben ser indiferentes entre $\overline{p}$ y cualquier otro precio
- $\overline{p}$ resultados de los beneficios $\frac{1-a}{2}\overline{p}$
- $\overline{p}=v.$
Uniendo estos hechos a la condición de indiferencia, tenemos $$\frac{1-a}{2}p+ap[1-F(p)]=\frac{1-a}{2}v,$$ lo que implica $$F(p)=1-\frac{\frac{1-a}{2}(v-p)}{ap},$$ que es nuestro equilibrio de estrategia mixta. La única parte del equilibrio que no hemos resuelto es el valor de $\underline{p}$ . Pero esto se encuentra fácilmente resolviendo $F(\underline{p})=0$ para $\underline{p}$ ahora que sabemos $F(\cdot)$ .
Observaciones finales
El truco utilizado en el ejemplo anterior es bastante útil en general.
A menos que la estrategia de equilibrio, $F$ tiene un átomo, sabemos por definición que $F(\underline{p})=0$ y $F(\overline{p})=1$ . Por lo tanto, si podemos utilizar razonamiento económico para determinar el valor de $\overline{p}$ o $\underline{p}$ (como en el cuadro anterior) entonces podemos eliminar todos los términos que dependen de $\overline{p}$ (o $\underline{p}$ ) en el lado derecho de nuestra ecuación de indiferencia y luego resolver para $F$ .
0 votos
1. Si una estrategia mixta $\sigma_i$ es la mejor respuesta a las estrategias de otros jugadores $\sigma_{-i}$ entonces todas las estrategias puras que se juegan con probabilidad positiva en $\sigma_i$ debe conducir a la misma recompensa cuando se juega contra $\sigma_{-i}$ . 2. Incluso en juegos con un número finito de estrategias puras, las distribuciones de probabilidad sobre ellas son también infinitas.
0 votos
Ver este puesto para un ejemplo de estrategia mixta NE en un juego con espacios de estrategia continuos.