Tenemos lo siguiente superjuego : \begin{array}{cc} & a_1 & a_2 \\ a_1 & 0,0 & -1,1 \\ a_2 & 1,-1 & -2,-2 \end{array} Quiero demostrar que tanto el desencadenar (o lúgubre ) y el castigo mutuo, dan la solución cooperativa $(a_1,a_1)=(0,0)$ para el factor de descuento $\delta>\dfrac{1}{2}$ . En el caso del castigo mutuo, si los jugadores han observado $(a_1,a_1)$ o $(a_2,a_2)$ en la ronda previa, eligen $a_1$ . En caso de que hayan observado $(a_1,a_2)$ o $(a_2,a_1)$ eligen $a_2$ durante una ronda y luego suponemos que vuelven a cooperar.
Mis ideas para la segunda son (el jugador 1 (p1) es el jugador de línea y el jugador 2 el de columna (p2)): Estrategia: Mientras cooperamos ambos ganamos una recompensa cero, por lo que la función de valor es: $$V_1^{C}= 0 + 0 \cdot \delta + 0 \cdot \delta^{2} + ... = 0$$ Supongamos que p2, se desvía unilateralmente de la estrategia de cooperación en la ronda 1 jugando $a_2$ Así que ambos jugadores en la segunda ronda juegan la estrategia de castigo mutuo, es decir, $-2$ pierde para todos. A partir de ahí, suponemos que ambos juegan según la estrategia cooperativa, es decir, la función de valor es: $$V_2^{NC}=1 - 2 \cdot \delta + 0 \cdot \delta + 0 \cdot \delta^{2} + ... = 1 - 2 \cdot \delta$$ Cooperarán si: $$V_1^{C}>V_2^{NC}\Rightarrow \delta>\dfrac{1}{2}$$ En el caso de la estrategia grim/trigger, los jugadores dejan de cooperar a perpetuidad, ¿en qué difiere la solución?
Nota: El juego es el halcón-paloma tipo superjuego.