2 votos

Sobre la noción (bastante extraña) de estrategias en juegos repetidos

Como suelen observar los estudiantes, la definición de una estrategia parece bastante extraña en el contexto de los juegos repetidos. Para ilustrarlo, consideremos un juego muy sencillo en el que un jugador tiene que tomar una decisión dos veces. Cada vez que tiene que tomar una decisión, dispone de dos opciones posibles, denominadas A o B. Normalmente, pensaríamos que esta persona tiene $4$ posibles estrategias (puras): elegir A dos veces, elegir B dos veces, elegir A y luego B, o elegir B y luego A. Sin embargo, según la definición estándar, diríamos que hay 2 historias posibles (A o B); y que una estrategia debe especificar lo que ocurre tras cada historia posible. En consecuencia, el jugador tiene realmente $2^3 = 8$ ¡puras estrategias! Además, cada una de estas estrategias especifica lo que sucedería en una situación imposible, es decir, si la persona hubiera hecho una elección diferente en la primera etapa a la que tenía previsto hacer.

En caso de que esto no le parezca extraño, permítame proporcionarle un ejemplo de estrategia pura (lo diré verbalmente para transmitir toda la fuerza de la extrañeza):

En la primera ronda, elegiré la acción A. Después de elegir A, volveré a elegir A. Sin embargo, si hubiera elegido B en la primera ronda, entonces habría vuelto a elegir B en la segunda ronda.

Mi pregunta es por qué hay que incluir esta última frase.

Antes de plantear finalmente mi pregunta, también quiero señalar que esta pregunta no es específica para el juego bastante trivial anterior. Evidentemente, se pueden idear ejemplos similares para juegos multijugador más complejos.

Pregunta: ¿Por qué la noción estándar de "estrategia" obliga a los jugadores a especificar lo que harían en situaciones que saben que nunca se presentarán dadas sus elecciones anteriores en el juego? ¿Y podemos demostrar resultados estándar (por ejemplo, la existencia de un equilibrio de Nash en juegos extensivos) sin recurrir a este concepto poco natural de estrategia?

9voto

henrikpp Puntos 340

La noción que propones de lo que debe ser una estrategia en un juego repetido se puede adaptar a todos los juegos de forma extensiva ha sido llamada plan de acción por Ariel Rubinstein, quien discute esto y temas relacionados en el documento

Rubinstein, Ariel. " Comentarios sobre la interpretación de la teoría de los juegos. " Econometrica: Journal of the Econometric Society (1991): 909-924.

Algunos conceptos son más difíciles de definir, como la inducción hacia atrás en juegos de información perfecta. Sin embargo, todavía se puede hacer casi toda la teoría de juegos. El libro "Rationality in extensive form games", de Andrés Perea, utiliza la definición como plan de acción en todo momento.

4voto

Alexandros B Puntos 131

El definición estándar de una estrategia asigna una acción a cada nodo de decisión/conjunto de información. Esta definición es, como mínimo, un comodín; funciona bien en la mayoría de los casos y a veces da lugar a notaciones ligeramente molestas que parecen demasiado complicadas. Yo sostengo que cambiar la definición de estrategia caso por caso probablemente llevaría a más confusión. (Puedes refutarme proponiendo una definición exacta pero general que se adapte a tu concepto).

Tenga también en cuenta que si no asigna una acción a cada nodo de decisión/conjunto de información, en un juego más complicado puede tener problemas cuando examine las diferentes estrategias de los otros jugadores y, de repente, llegue a un nodo de decisión que por error creía inalcanzable. (Este es también un error común que cometen los estudiantes.) Asignar una acción en todas partes es una apuesta segura.

Por último, también habría que ajustar otras definiciones, como la de perfección de subjuegos, para que se ajusten a su nuevo concepto de estrategia, ya que dejaría a los subjuegos sin ninguna acción asignada.

4voto

GrZeCh Puntos 320

La definición de estrategia no me parece en absoluto extraña. Por el contrario, parece ser la forma más natural y otras formas parecen tener problemas una vez aplicadas a los juegos en general.

Como ha dicho Giskard, una estrategia convierte un nodo de decisión/conjunto de información en una acción. En los juegos repetidos, esto corresponde a la asignación de una historia (lo que ha sucedido hasta ahora) a una acción. Para evaluar la rentabilidad de una desviación es necesario especificar el comportamiento fuera de la trayectoria.

Dibuja un árbol de juego como este: El jugador 1 puede jugar A y el pago es (2,0), o jugar B después de lo cual el jugador 2 puede elegir a o b. Después de B-a el pago es (0,2), después de B-b, el jugador 1 puede elegir C o D con los pagos (5,2) y (0,0). ¿Ahora dirías que "el jugador 1 juega A" es una estrategia completa? Después de todo, el juego ha terminado y todo el comportamiento fuera del camino es irrelevante. Por supuesto, esto no tiene sentido, porque 1 necesita saber qué hace 2 en caso de que 1 juegue B. De lo contrario, ¿quién sabe si un desvío hacia B da resultado? Tal vez 1 obtendría 5 en lugar de sólo 2, o bien obtendría 0. Así que especifiquemos que 2 juega a. Entonces 1 sabe que desviarse a 2 B no compensa.... pero, ¿qué pasa con 2? Ahora, 2 no sabe qué pasaría si jugara b. Así que necesitamos especificar eso también, y así sucesivamente.

Tu ejemplo de una partida repetida de un jugador es raro para empezar. ¿Por qué debería haber una partida repetida de un solo jugador? Es sólo una repetición del mismo juego y el comportamiento pasado no influye en el juego futuro. Pero incluso en este juego una estrategia debería ser un plan completo de acciones. Supongamos que te has equivocado y has jugado B en el primer periodo, entonces ¿qué haces en el segundo periodo? La estrategia que propones también se puede plasmar verbalmente: "Juega siempre la acción realizada en el periodo anterior. Juega A en el primer periodo". ¿Le parece extraño? En los juegos repetidos, normalmente no se escribe una acción para cada historia una por una, porque el interés principal está en los juegos infinitamente repetidos y hay infinitas historias.

Tomemos un dilema del prisionero infinitamente repetido. ¿Cómo especificarías una estrategia? Si sólo especifica que ambos jugadores cooperen (C) si ambos cooperaron antes, no puede evaluar si una desviación para desertar (D) es rentable. ¿Cómo resolvería esto su "enfoque más natural"? ¿Cuál sería la noción de perfección del subjuego? Por ejemplo, la estrategia de "jugar C al principio, jugar C si el oponente siempre ha jugado C hasta ahora, si no, jugar D para siempre" es un equilibrio de Nash para factores de descuento altos $\delta$ . Sin embargo, no es un equilibrio de Nash subjuego perfecto para cualquier $\delta$ . Por el contrario, la estrategia del gatillo sombrío "Juega C al principio, juega C si todo el mundo ha jugado siempre C hasta ahora, si no, juega D para siempre" sería sub-perfecta para grandes $\delta$ .

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X