Mira la siguiente matriz de recompensas, existen dos etapas Nash equlibria, y consideramos un juego repetido infinitamente con factor de descuento $\delta\en(0,1)$, los jugadores pueden mantener un promedio de rentabilidad de (2,2) en virtud de cualquier estrategia? (Estoy confundido porque individualmente racionales(es decir, mín-máx) rentabilidad es (3,3)) Si no, ¿por qué?
Respuestas
¿Demasiados anuncios?Creo que el resultado que se busca es la Lema 2 (p.7) de estas notas de la conferencia por Johannes Hörner. Consulte también la documentación de referencias en la final. Existe una prueba formal, pero la idea es exactamente lo que Herr K. escribió en su post. En su reiterada juego, todos los jugadores deben tener un promedio de rentabilidad de al menos 3 en el equilibrio de Nash.
Me inclino a decir que $(2,2)$ no es sostenible, a pesar de que no tengo una prueba formal por el momento.
Para lograr una media de rentabilidad de $(2,2)$, los jugadores deben jugar $(H,H)$ en algunas etapas. Pero entonces un jugador puede desviarse a jugar $L$ y evitar posteriores sanciones por asegurar que siempre se puede obtener al menos $3$, que es mejor que $2$.