Tengo problemas para entender la definición de un juego bayesiano basándome en la siguiente definición de clase. Le agradecería que me explicara las notaciones y el significado general de los puntos 2, 3, 4 y 5. Estoy seguro de que es bastante sencillo una vez que se conoce, pero no tienen ningún sentido para mí. Estoy seguro de que es bastante sencillo una vez que lo sabes, pero no tienen ningún sentido para mí. Gracias, y avísame si necesitas algo más.
Respuesta
¿Demasiados anuncios?- Conjunto de jugadores, supongo que esto está bastante claro. Como ejemplo, tomemos al jugador $A$ y $B$
- Acciones. Esto sólo te dice lo que los dos jugadores pueden hacer. Por ejemplo $A$ puede elegir $U$ (p) o $D$ (propio) y $B$ puede elegir $L$ (eft) o $R$ (derecha).
- Tipos: Un tipo se asocia a un jugador. Por ejemplo, jugador $A$ pueden ser de dos tipos diferentes, a saber $A_1$ o $A_2$ . El tipo que el jugador $A$ suele ser conocida por la propia jugadora, pero normalmente no por los demás jugadores (por eso necesitamos una distribución de probabilidad). Del mismo modo, supongamos que el jugador 2 puede tener dos tipos $B_1$ o $B_2$ . De nuevo, normalmente se asume que el jugador 2 conoce su propio tipo pero $A$ no conoce el tipo de jugador $B$ .
- Una creencia sobre las combinaciones de tipos, que en nuestro caso da probabilidades de que la naturaleza extraiga los tipos particulares para $A$ y $B$ . En nuestro ejemplo, esto da 4 números que suman 1. Por ejemplo $\pi(A_1, B_1) = 1/8, \pi(A_2, B_1) = 2/8, \pi(A_1, B_2) = 3/8, \pi(A_2, B_2)= 4/8$ . A partir de estas creencias podemos determinar las creencias posteriores utilizando el teorema de Bayes. Supongamos, por ejemplo, que el jugador $A$ sabe que es de tipo $A_1$ entonces la probabilidad de que crea que el jugador 2 es del tipo $B_1$ viene dado por: $$ \pi(B_1|A_1) = \frac{\pi(A_1, B_1)}{\pi(A_1, B_1) + \pi(A_1, B_2)} = \frac{1/8}{4/8} = \frac{1}{4}. $$
- Una función de retribución $u$ que especifica para cada tipo y para todas las combinaciones posibles de acciones y combinaciones de tipos la retribución que recibirá el tipo concreto. En nuestro caso, esto da 16 números. Por ejemplo, el número $u_{A_1}(U,L, B_2)$ da el resultado del jugador $A$ cuando es del tipo $A_1$ cuando elige la acción $U$ cuando se enfrenta a un tipo $B_2$ adversario y cuando este adversario elige $L$ .
Una estrategia de un determinado jugador especifica para cada tipo una acción a jugar. Por ejemplo, una estrategia para el jugador $B$ podría ser elegir $L$ si es del tipo $B_1$ y elegir $R$ cuando es del tipo $B_2$ . Jugador $B$ tiene por tanto 4 estrategias posibles $(L, L)$ , $(L,R)$ , $(R,L)$ y $(R,R)$ donde cada tupla especifica que hacer cuando es de tipo $B_1$ y qué hacer si es del tipo $B_2$ .
Jugador $A$ también tiene 4 estrategias $(U,U)$ , $(U,D)$ , $(D,U)$ , $(D,D)$ . Por ejemplo, la estrategia $(U,D)$ dice que elija $U$ si es del tipo $A_1$ y elegir $D$ si es del tipo $A_2$ también.
En total hay 16 perfiles estratégicos posibles (4 para $A$ por 4 para $B$ ). Podríamos resumir este perfil por cuádruples, por ejemplo $((L, R), (U, D))$
Cada uno de estos perfiles estratégicos proporciona una retribución esperada para cada tipo de jugador. Por ejemplo, el resultado esperado de $((L,R), (U,D))$ para el tipo de jugador $A_1$ viene dada entonces por: $$ V_{A_1}((L,R),(U,D)) = \pi(B_1|A_1) u_{A_1}(U, L, B_1) + \pi(B_2|A_1) u_{A_1}(U,R,B_2). $$ El primer término da la probabilidad de enfrentarse a un tipo $B_1$ adversario multiplicado por el beneficio que genera (es decir. $A_1$ juega $U$ y $B_1$ juega $L$ ). El segundo término da la probabilidad de enfrentarse a un tipo $B_2$ adversario y recibiendo la recompensa que esto genera (es decir, cuando $A_1$ juega $U$ y $B_2$ juega $R$ ).
Estos pagos, a su vez, determinan las mejores respuestas (como las estrategias de un tipo particular de jugador que maximizan el pago esperado dadas las estrategias del otro jugador), y esto, a su vez, da la definición de un equilibrio de Nash (bayesiano) como los perfiles de estrategia que son las mejores respuestas mutuas.