14 votos

Explicando estrategias mixtas para juegos de una sola jugada

En la introducción clásica a la teoría de juegos no cooperativos, la estrategia mixta de un jugador se enseña como una distribución sobre el espacio de estrategias del jugador. La distribución básicamente nos da las probabilidades (digamos, un conjunto de estrategias discretas) con las cuales un jugador debería jugar las estrategias en un equilibrio de Nash.

Sin embargo, las probabilidades llevan la noción de ser frecuencias y esencialmente significan la fracción a largo plazo de juegos en los cuales el jugador debería jugar la estrategia. Sin embargo, la situación es un juego de una sola vez y esto es una contradicción.

¿Cómo resolvemos la contradicción al explicar qué es una estrategia mixta?

2 votos

No es una contradicción para quien adopta la interpretación de propensidad de probabilidad, que considera el comportamiento a largo plazo como la manifestación de las probabilidades de casos individuales.

11voto

Adam Puntos 343

Ariel Rubinstein tiende a ser perspicaz con respecto a este tipo de preguntas.

Aborda la interpretación de estrategias mixtas en la sección 3 de este artículo.

Algunas posibles interpretaciones aparte de la aleatorización deliberada:

  1. Purificación: Una estrategia mixta es un plan de acción basado en información no especificada en el modelo.
  2. Una historia ficticia a largo plazo.
  3. Medias poblacionales, por lo que imagine que los jugadores son extraídos de alguna distribución poblacional donde diferentes tipos juegan diferentes estrategias puras. La distribución poblacional es la distribución de estrategia mixta.

Una cita interesante sobre la estrategia mixta del jugador $i$ reflejando la incertidumbre entre los $-i$ acerca de lo que hará $i$:

La estrategia mixta puede verse alternativamente como la creencia sostenida por todos los demás jugadores sobre las acciones de un jugador. Un equilibrio de estrategia mixta es entonces una n-tupla de expectativas de conocimiento común, que tiene la propiedad de que todas las acciones a las cuales se asigna una probabilidad estrictamente positiva son óptimas, dado las creencias. El comportamiento de un jugador puede ser percibido por todos los demás jugadores como resultado de un dispositivo aleatorio aunque este no sea el caso. Adoptar esta interpretación requiere la reevaluación de gran parte de la teoría de juegos aplicada. En particular, implica que un equilibrio no conduce a una predicción (estadística o de otro tipo) del comportamiento de los jugadores. Cualquier acción del jugador i que sea una mejor respuesta dada su expectativa sobre el comportamiento de los demás jugadores (las otras n - 1 estrategias) es coherente como predicción para la acción de i (esto podría incluir acciones que están fuera del soporte de la estrategia mixta). Esto hace que cualquier análisis de estática comparativa o de bienestar del equilibrio de estrategia mixta sea insignificante y cuestiona la enorme literatura económica que utiliza el equilibrio de estrategia mixta.

6voto

Justin Puntos 1169

Sea $s_i = \{p_A^i, p_B^i\}$ una estrategia que asigna probabilidades para jugar $A,B$, y sea $s = \{s_i, s_i\}_i$ el conjunto de tales estrategias que resultan en un equilibrio en un juego simétrico de dos jugadores.

Como mencionas, pensamos en $s_i$ como probabilidades con las cuales se juega una acción específica. Cuando $s$ no es un singleton, tenemos múltiples equilibrios, algo que la mayoría de las ramas de la economía desprecian, ya que hace que resolver modelos sea bastante difícil y la falta de unicidad es difícil de manejar: ¿Cómo deberíamos simular el modelo? ¿Cuál de los equilibrios en realidad se está jugando?

Al menos, con equilibrios de estrategias mixtas, conocemos la probabilidad de que ocurra cada uno de los equilibrios. No te gustan las probabilidades en la medida en que implican frecuencias, las cuales dices que son contradichas por la noción de que el juego es de una sola vez.

Simultáneamente Sin embargo, que el juego sea de una sola vez no significa que el juego se juegue solo una vez. En un mundo con muchos individuos, todos pueden encontrar un compañero y jugar una de las estrategias en $s$, hasta el punto de que (¡al mismo tiempo!) encontramos $p_A$ de ellos en el equilibrio $\{A, A\}$, y la fracción $p_B$ de individuos jugando el siguiente equilibrio, etc.

No Simultáneamente Como alternativa, podrías argumentar que en un mundo muy anónimo, las personas olvidan a los compañeros con los que jugaron antes. Tenemos muchas personas jugando estrategias en $s$ en el tiempo $t$, luego las desvinculamos, les damos nuevos compañeros y los dejamos jugar nuevamente. Incluso si existe la posibilidad de encontrarse con la misma persona nuevamente: Dado que esa posibilidad tiende a cero, podrías modelar esto como un juego repetido con un factor de descuento $\delta\rightarrow 0$.

Falta de Compromiso Finalmente, piensa en situaciones que en realidad son juegos repetidos, como las interacciones entre el gobierno y los consumidores. Aunque esto podría modelarse como un juego repetido, podríamos pensar que el gobierno no puede comprometerse con una secuencia de estrategias. Por lo tanto, en lugar de modelarlo como un juego repetido, lo modelamos como repeticiones del equilibrio de una sola vez: Dado un horizonte de tiempo $T$, veremos que $T\cdot p_A$ de las veces, el gobierno y los consumidores juegan el equilibrio $\{A, A\}$, etc.

2voto

Joe Fontana Puntos 703

Este es un suplemento de la cita de Pburg:

Una opinión en Aumann y Brandenburger(1995) es que la estrategia mixta solo está en los ojos de los oponentes. En un juego de $N$ jugadores, el conjunto de estados del mundo es $\mathbf {S} : = \times_{i \in N} S_i$. Para un estado $s \in \mathbf S$, satisface la siguiente especificación:

  1. Para un jugador $i$, sea $\pi_i : \mathbf {S} \to S_i$ la proyección en el $i$-ésimo componente de un estado. Cuando un estado se realiza, el jugador $i$ está absolutamente seguro de su propio tipo $s_i$, pero no está seguro sobre el estado exacto. En otras palabras, ella no sabe qué estado en $\pi_i^{-1}(s_i)$ se obtiene. En cambio, sostiene una creencia sobre $\pi_i^{-1}(s_i)$, que está especificada por $s_i$.
  2. Sea $A_i$ el espacio de acciones del jugador $i$. Su acción es una variable aleatoria $a_i : \mathbf{S} \to A_i$, mientras que su restricción $\left.a_i\right|_{\pi_i^{-1}(s_i)}$ es constante.
  3. La función de utilidad de jugador $i$, $g_i$, está definida de la misma manera que $a_i$, lo que significa que $g(s) : \mathbf{A} \to \mathbb{R}$ se refiere a la misma función de utilidad, para todos los $s \in \pi_i^{-1}(s_i)$ para todos los $s_i$.

1voto

Callum Rogers Puntos 161

Bueno, aquí está mi intento de responder, siguiendo este documento en Física http://bayes.wustl.edu/etj/articles/prob.in.qm.pdf. Creo que la propensión es una buena interpretación de las estrategias mixtas, pero más formalmente deberíamos decir que captura la ignorancia del modelador. Decimos, todo vale, de hecho todas las estrategias podrían ser tomadas (si el soporte es en todas partes positivo) pero el concepto de solución dice que ciertas son más probables. Las probabilidades aquí miden la ignorancia del modelador y son el resultado de la falta de información del teórico del juego sobre el juego. Para aclarar esto, piense en un conjunto de datos mejorado donde conocemos información adicional sobre el juego, digamos que hablamos con uno de los jugadores y nos asegura que va a tomar una estrategia sin importar qué, entonces podemos hacer una predicción más precisa en forma de una estrategia pura. Las frecuencias surgen cuando pensamos en el juego como un juego típico, y vemos varias situaciones independientes donde jugadores con las mismas preferencias juegan este juego varias veces, entonces las estrategias mixtas corresponderán de hecho en el límite (argumento asintótico) a la frecuencia de las estrategias observadas si nuestro modelo es realmente correcto.

0voto

Jader Dias Puntos 714

No se aplica a todos los juegos, pero también existen situaciones en las que (al menos algunos de) los jugadores realmente utilizan dispositivos de aleatorización en juegos que podrían considerarse de un solo disparo. Aquí, las distribuciones de probabilidad no son frecuencias, son las distribuciones que utiliza el dispositivo de aleatorización. Cualquier equilibrio de estrategia mixta es entonces un equilibrio en un sentido ex-ante (aunque los jugadores bien pueden sacar del dispositivo de aleatorización una sola vez, y puede que no haya ningún sentido en el que la situación ex-post sea un equilibrio).

Ejemplos incluyen:

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X