He abordado esta cuestión de la siguiente manera: $(P_1,P_2), (R_1,R_2), (S_1,S_2)$ son los Equilibrios de Nash del juego de la Etapa 1. Para que la estrategia dada se sostenga como SPNE, no debe haber forma de que las desviaciones unilaterales aumenten los pagos de los individuos. Cuando $(Q_1,Q_2)$ se juega en la etapa 1, el pago al final de la etapa 2 sería $4+2=6$ cada uno. Ahora bien, si el jugador 1 se desvía hacia un pago mayor, jugando $P1$ la remuneración total que obtendrá después de dos etapas sería $x+0$ La desviación sería inútil si $x \leq 6$ . Además, se da que $x>4$ Así, un valor de $x$ que puede sostener la estrategia anterior ya que el SPNE es $5$ . Por favor, corríjanme si me equivoco. Gracias.
Gracias por la respuesta. ¿El hecho de que x tenga que ser estrictamente inferior a 6 garantiza que el castigo sea "duro"?