Estoy haciendo este dilema del prisionero finitamente repetido con costes de cambio, pero tengo problemas para mostrar el hecho de que $\varepsilon$ tuvo que ser $1 < \varepsilon < 2$ . Veo por qué y que es un equilibrio de Nash subjuego perfecto, pero cómo lo demuestro.
Mi enfoque: Consideremos las desviaciones del jugador 1, dado que el jugador 2 se ciñe a sus estrategias en sus subjuegos siguiendo historias que terminan en cada uno de los cuatro resultados del juego. (Por simetría, lo que sigue también tendría en cuenta las desviaciones del jugador 2 si el jugador 1 se ciñe a sus estrategias).
Sabemos que este juego se juega $T$ tiempos. Dejemos que $m$ denotan el número de etapas de cooperación (es decir, el número de veces que el perfil estratégico $(C,C)$ ha sido tocado), dejemos que $n$ denotan el número de etapas de castigo (número de veces que el perfil de la estrategia $(D,D)$ ha sido tocado), y deja que $T = m + n +1$ . Si los jugadores cooperan $T$ veces que consiguen $3$ en los pagos. Así, podemos escribir $$3T=3(m+n+1)$$ Si el jugador 1 se desvía en cualquier fase del juego, obtendrá un pago de $$3 \cdot m + (4 - \varepsilon) + 2 \cdot n$$ Para que la desviación sea rentable para el jugador 1, el pago de la desviación tiene que ser mayor o igual que el pago de la cooperación. Es decir, $$3 \cdot m + (4 - \varepsilon) + 2 \cdot n \geq 3m + 3n + 3$$ Podemos simplificar esto $$n \leq 1 - \varepsilon$$
Y aquí es donde estoy atascado. ¿Qué debo interpretar de esto? Que cuando $\varepsilon \in (1,2)$ entonces el número de etapas de castigo es negativo?
Otra pregunta que tengo es: Supongamos que la pregunta anterior fue respondida. ¿Es suficiente? ¿O necesito mostrar algo más? Porque soy muy consciente de que jugar $(C,C)$ $T$ veces es un SPNE y jugando $(D,D)$ $T$ veces también es un SPNE y de cualquier manera no hay desviaciones rentables.
Así que, para resumir: Me gustaría saber si estoy enfocando este problema de forma correcta. Me gustaría recibir ayuda sobre cómo avanzar desde el punto en el que me he quedado atascado. Y si lo anterior sería suficiente para mostrar lo que pide el problema.
Muchas gracias de antemano.
[Update]---------------- Abajo está mi intento actualizado de una solución con algo de inspiración de M.J. Osbourne y los comentarios que recibí de @Herr K..
0 votos
Esto no cambia tu conclusión cualitativamente, pero sugeriría ser más explícito sobre el vapor de los pagos después de una desviación. Por ejemplo, supongamos que el jugador 1 se desvía en el momento $t$ y el resultado en $t-1$ fue $(C,C)$ . Entonces el pago de continuación de $t$ en adelante sería $4-\epsilon+2(T-t)$ . En comparación con el beneficio de la continuación de no desviarse en $t$ que es $3(T-t+1)$ La desviación no es rentable para ningún $t\le T$ siempre y cuando $\epsilon >1$ .
0 votos
Ah, creo que lo entiendo. Si digamos que aplico el mismo método que usted utilizó para por ejemplo ( $C,D$ ). Si suponemos que el jugador 1 se desvía en el momento $t$ y el resultado en el momento $t-1$ fue ( $C,D$ ). Entonces el pago de continuación de $t$ en adelante sería $2-\varepsilon + 2(T-t)$ . Si no se desvía sería una corriente de 0 de vez en cuando $t$ que es $0(T-t+1)$ . Así, tenemos que la desviación es rentable si $2-\varepsilon 2(T-t) \geq 0T \quad \Rightarrow \quad 0 \leq 2 - \varepsilon + 2T - 2t$ . Es decir, una desviación será rentable para cualquier $t \leq T$ siempre y cuando $\varepsilon < 2$ .
0 votos
Bueno, si el resultado en $t-1$ es $(C,D)$ entonces la estrategia dada prescribe jugar $D$ en $t$ para el jugador 1. Así que jugando $C$ se está desviando, mientras que jugar $D$ no lo es. Además, como sólo necesitamos considerar las desviaciones de una sola jugada, si el jugador 1 se desvía para jugar $C$ en $t$ debería volver a la estrategia original de $t+1$ en adelante, es decir, jugar $D$ de $t+1$ hasta $T$ .
0 votos
Puede que sea una pregunta tonta, pero ¿el resultado no es $(C,D)$ en $t-1$ ¿Cuenta como una desviación? Si la jugada fue $(C,D)$ en el momento $t-1$ y de nuevo en el momento $t$ ¿no serían entonces dos desviaciones?
0 votos
La desviación de una etapa es para cada subjuego . Así que en cualquier subjuego que venga después del resultado $(C,D)$ verificamos que no hay ninguna desviación rentable de una sola vez dentro de ese subjuego, aunque el subjuego en cuestión esté claramente fuera de la trayectoria de equilibrio.
0 votos
Aaah vale, eso era lo que me molestaba y confundía. Muchas gracias. Su ayuda es muy apreciada.