4 votos

Dilema del prisionero finitamente repetido con coste de cambio

enter image description here

Estoy haciendo este dilema del prisionero finitamente repetido con costes de cambio, pero tengo problemas para mostrar el hecho de que $\varepsilon$ tuvo que ser $1 < \varepsilon < 2$ . Veo por qué y que es un equilibrio de Nash subjuego perfecto, pero cómo lo demuestro.

Mi enfoque: Consideremos las desviaciones del jugador 1, dado que el jugador 2 se ciñe a sus estrategias en sus subjuegos siguiendo historias que terminan en cada uno de los cuatro resultados del juego. (Por simetría, lo que sigue también tendría en cuenta las desviaciones del jugador 2 si el jugador 1 se ciñe a sus estrategias).

Sabemos que este juego se juega $T$ tiempos. Dejemos que $m$ denotan el número de etapas de cooperación (es decir, el número de veces que el perfil estratégico $(C,C)$ ha sido tocado), dejemos que $n$ denotan el número de etapas de castigo (número de veces que el perfil de la estrategia $(D,D)$ ha sido tocado), y deja que $T = m + n +1$ . Si los jugadores cooperan $T$ veces que consiguen $3$ en los pagos. Así, podemos escribir $$3T=3(m+n+1)$$ Si el jugador 1 se desvía en cualquier fase del juego, obtendrá un pago de $$3 \cdot m + (4 - \varepsilon) + 2 \cdot n$$ Para que la desviación sea rentable para el jugador 1, el pago de la desviación tiene que ser mayor o igual que el pago de la cooperación. Es decir, $$3 \cdot m + (4 - \varepsilon) + 2 \cdot n \geq 3m + 3n + 3$$ Podemos simplificar esto $$n \leq 1 - \varepsilon$$

Y aquí es donde estoy atascado. ¿Qué debo interpretar de esto? Que cuando $\varepsilon \in (1,2)$ entonces el número de etapas de castigo es negativo?

Otra pregunta que tengo es: Supongamos que la pregunta anterior fue respondida. ¿Es suficiente? ¿O necesito mostrar algo más? Porque soy muy consciente de que jugar $(C,C)$ $T$ veces es un SPNE y jugando $(D,D)$ $T$ veces también es un SPNE y de cualquier manera no hay desviaciones rentables.

Así que, para resumir: Me gustaría saber si estoy enfocando este problema de forma correcta. Me gustaría recibir ayuda sobre cómo avanzar desde el punto en el que me he quedado atascado. Y si lo anterior sería suficiente para mostrar lo que pide el problema.

Muchas gracias de antemano.

[Update]---------------- Abajo está mi intento actualizado de una solución con algo de inspiración de M.J. Osbourne y los comentarios que recibí de @Herr K.. enter image description here enter image description here enter image description here

0 votos

Esto no cambia tu conclusión cualitativamente, pero sugeriría ser más explícito sobre el vapor de los pagos después de una desviación. Por ejemplo, supongamos que el jugador 1 se desvía en el momento $t$ y el resultado en $t-1$ fue $(C,C)$ . Entonces el pago de continuación de $t$ en adelante sería $4-\epsilon+2(T-t)$ . En comparación con el beneficio de la continuación de no desviarse en $t$ que es $3(T-t+1)$ La desviación no es rentable para ningún $t\le T$ siempre y cuando $\epsilon >1$ .

0 votos

Ah, creo que lo entiendo. Si digamos que aplico el mismo método que usted utilizó para por ejemplo ( $C,D$ ). Si suponemos que el jugador 1 se desvía en el momento $t$ y el resultado en el momento $t-1$ fue ( $C,D$ ). Entonces el pago de continuación de $t$ en adelante sería $2-\varepsilon + 2(T-t)$ . Si no se desvía sería una corriente de 0 de vez en cuando $t$ que es $0(T-t+1)$ . Así, tenemos que la desviación es rentable si $2-\varepsilon 2(T-t) \geq 0T \quad \Rightarrow \quad 0 \leq 2 - \varepsilon + 2T - 2t$ . Es decir, una desviación será rentable para cualquier $t \leq T$ siempre y cuando $\varepsilon < 2$ .

0 votos

Bueno, si el resultado en $t-1$ es $(C,D)$ entonces la estrategia dada prescribe jugar $D$ en $t$ para el jugador 1. Así que jugando $C$ se está desviando, mientras que jugar $D$ no lo es. Además, como sólo necesitamos considerar las desviaciones de una sola jugada, si el jugador 1 se desvía para jugar $C$ en $t$ debería volver a la estrategia original de $t+1$ en adelante, es decir, jugar $D$ de $t+1$ hasta $T$ .

6voto

Coincoin Puntos 12823

Un par de consejos.

  1. En cuanto al límite inferior de $\epsilon$ : ¿Qué ocurre si se produce una desviación en la etapa $T$ ? En otras palabras, no hay oportunidad para sus llamadas "etapas de castigo".
  2. En cuanto al límite superior de $\epsilon$ : Supongamos que el jugador 2 se desvía en la etapa $T-1$ pero el jugador 1 no. Lo que debe ser cierto sobre $\epsilon$ para que el jugador 1 tenga un incentivo para cambiar a $D$ ¿en la última etapa?

En general, para demostrar que el perfil de estrategia dado es subjuego perfecto, hay que argumentar que jugar $C$ después de $(C,C)$ y $D$ después de $(C,D),(D,C),(D,D)$ son óptimas.

0 votos

Corrígeme si me equivoco. Primero, en la última etapa, $T$ Si cualquiera de los jugadores se desvía, el jugador que se desvía cede. $4-\varepsilon$ que es inferior a 3 para $\varepsilon > 1$ . Por lo tanto, no será una desviación rentable en la última etapa. En segundo lugar, si el jugador 2 se desvía en $T-1$ entonces ganará $4-\epsilon$ y $2$ en $T$ es decir, el pago total de las dos últimas etapas para el jugador 2 es $4-\varepsilon + 2$ . Por otro lado, si el jugador 2 se desvía de tal manera que $(C,D)$ se reproduce en el momento $T-1$ entonces el jugador 1 querrá desviarse en la última etapa, $T$ . Así, ganará $0+2-\varepsilon$ .

2 votos

@JustinMalik: Sí, estás en el camino correcto. Para asegurar que el jugador 1 cambie a $D$ después de la desviación del jugador 2 en $T-1$ , necesitarías $0+2-\varepsilon > 0+0$ la ganancia de no cambiar. Por supuesto, para llegar a la conclusión de que el perfil de estrategia dado es subjuego perfecto, habría que argumentar que cualquier desviación de una sola vez en etapas anteriores, ya sea dentro o fuera de la trayectoria de equilibrio, no es rentable.

1 votos

Muchas gracias. Creo que ahora lo entiendo. He actualizado el post. ¿Podrías echar un vistazo a la solución que propuse para ver si efectivamente lo entendí de la manera correcta?

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X