0 votos

¿Cómo encontrar estrategias óptimas mixtas en este juego de suma cero?

Estoy tratando de resolver este problema del examen final del año pasado en teoría de juegos:

Considere el juego de suma cero $G=(X, Y, g)$ donde $X=Y=[0,1]$ y $$\forall (x,y) \in X \times Y: g(x, y)=\max \{x(1-2 y), y(1-2 x)\}$$

Encuentre una estrategia óptima mixta para cada jugador. (Sugerencia: se pueden considerar estrategias mixtas estrategias del jugador $1$ que juega $x=0$ con cierta probabilidad y $x=1$ con la probabilidad restante).

Mi intento:

Dejemos que $\sigma$ sea una estrategia óptima mixta en la que el jugador $1$ jugar $x=0$ con probabilidad $p$ y $x=1$ con probabilidad $1-p$ . Una estrategia óptima mixta $\tau$ del jugador $2$ es una medida de probabilidad sobre $[0,1]$ .


Entonces estoy atascado para proceder. ¿Podrían ayudarme a terminar este ejercicio? Muchas gracias.

2voto

Trevel Puntos 501

En primer lugar, una advertencia: este año estoy en el mercado de trabajo en medio de las dos semanas en las que las convocatorias se suceden. Por lo tanto, esto parecía una buena manera de matar algo de tiempo (semi)productivo. Esto es también una advertencia en caso de que haya cometido un error :)

Ahora, veamos la que se le sugiere que intente, donde el jugador $1$ elige $0$ con $p$ y $1$ con $1-p$ . De nuevo, que el jugador $2$ elija $G$ con todo el apoyo.

Si el jugador $1$ elige $0$ y el jugador $2$ elige $y$ , Pl $1$ consigue $$\int_{0}^{1}yg(y)dy = \mu$$ y si elige $1$ , se pone $$\int_{0}^{1}(1-2y)g(y)dy = 1 - 2\mu$$ donde $\mu := \mathbb{E}_{G}[y]$ Por lo tanto, para la indiferencia necesitamos $\mu = 1/3$ . Ah, pero también necesitamos que esto sea robusto a cualquier otra desviación. Es decir, necesitamos. $$\frac{1}{3} \geq x\int_{0}^{x}(1-2y)g(y) + (1-2x)\int_{x}^{1}yg(y)$$ para todos $x \in [0,1]$ .

Sabiendo que $\mathbb{E}_{G}(y) = 1/3$ para $G(y) = \sqrt{y}$ , supongamos que esa es la solución. El lado derecho se reduce a $$\dfrac{2x^\frac{3}{2}-2x+1}{3}$$ que se maximiza en $x = 0$ y $x = 1$ y es igual a $1/3$ allí, según sea necesario.

Por último, para el jugador $2$ Es indiferente a cualquier $y$ si $$p(-y) - (1-p)(1-2y)$$ no depende de $y$ . Esto es así si $p = 2/3$ .

Por lo tanto, el equilibrio se da de la siguiente manera: el jugador $1$ elige $0$ con probabilidad $2/3$ y $1$ con probabilidad $1/3$ ; y el jugador $2$ elige cdf $G(y) = \sqrt{y}$ en $[0,1]$ . El valor del juego es $1/3$ para el jugador $1$ y $-1/3$ para el jugador $2$ .

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X