Tenemos lo siguiente superjuego : a1a2a10,0−1,1a21,−1−2,−2 Quiero demostrar que tanto el desencadenar (o lúgubre ) y el castigo mutuo, dan la solución cooperativa (a1,a1)=(0,0) para el factor de descuento δ>12 . En el caso del castigo mutuo, si los jugadores han observado (a1,a1) o (a2,a2) en la ronda previa, eligen a1 . En caso de que hayan observado (a1,a2) o (a2,a1) eligen a2 durante una ronda y luego suponemos que vuelven a cooperar.
Mis ideas para la segunda son (el jugador 1 (p1) es el jugador de línea y el jugador 2 el de columna (p2)): Estrategia: Mientras cooperamos ambos ganamos una recompensa cero, por lo que la función de valor es: VC1=0+0⋅δ+0⋅δ2+...=0 Supongamos que p2, se desvía unilateralmente de la estrategia de cooperación en la ronda 1 jugando a2 Así que ambos jugadores en la segunda ronda juegan la estrategia de castigo mutuo, es decir, −2 pierde para todos. A partir de ahí, suponemos que ambos juegan según la estrategia cooperativa, es decir, la función de valor es: VNC2=1−2⋅δ+0⋅δ+0⋅δ2+...=1−2⋅δ Cooperarán si: VC1>VNC2⇒δ>12 En el caso de la estrategia grim/trigger, los jugadores dejan de cooperar a perpetuidad, ¿en qué difiere la solución?
Nota: El juego es el halcón-paloma tipo superjuego.