3 votos

Ejemplo de estructura de información en un equilibrio correlacionado de Bayes de un jugador

Modelo

Consideremos un juego en el que un decisor (DM) tiene que elegir una acción $y\in \mathcal{Y}$ posiblemente sin ser plenamente consciente del estado del mundo.

El estado del mundo tiene apoyo $\mathcal{V}$ .

Cuando el DM elige la acción $y\in \mathcal{Y}$ y el estado del mundo es $v\in \mathcal{V}$ recibe la recompensa $u(y,v)$ .

Dejemos que $P_V\in \Delta(\mathcal{V})$ sea el previo del DM.

El DM también procesa algunas señales $T$ con apoyo $\mathcal{T}$ distribución $P_{T|V}$ para perfeccionar su anterior y conseguir un posterior en $V$ , denotado por $P_{V|T}$ mediante la regla de Bayes.

Dejemos que $S\equiv \{\mathcal{T}, P_{T|V}\}$ se llame "estructura de la información".

Una estrategia para el DM es $P_{Y|T}$ . Dicha estrategia es óptima si maximiza su beneficio esperado, donde la expectativa se calcula utilizando la posterioridad, $P_{V|T}$ .


Pregunta

Supongamos que el DM descubre que el estado del mundo, $v$ es un número en $[a,b]\subset \mathcal{V}$ . ¿Se puede escribir esto como una estructura de información (es decir, una distribución de una señal)?

1voto

mat_jack1 Puntos 209

La estructura de la señal debe especificar lo que el DM aprende en todos los estados posibles del mundo, por lo que creo que tu pregunta debería decir:

"Supongamos que el DM descubre si el estado del mundo $v\in V$ está en $[a,b]\subset V$ o no. ¿Se puede escribir esto como una estructura de información?"

o debería decir:

"Supongamos que el DM descubre el estado del mundo $v\in V$ siempre que esté en $[a,b]\subset V$ y aprende el mínimo en caso contrario. ¿Se puede escribir esto como una estructura de información?".

Por los comentarios de la pregunta, creo que te interesa más la primera. Independientemente de ello, un par de comentarios son importantes:

  1. Quieres que el DM asigne una probabilidad positiva a un intervalo, y hay muchas maneras de hacerlo. Hay algunas restricciones que provienen de su previa, pero son relativamente suaves. La más importante es que $P_V(v)>0$ para todos $v\in [a,b]$ . Es decir, la prioridad debe asignar una probabilidad positiva a todos los números del intervalo.

  2. Incluso cuando se decide cuánta probabilidad se quiere asignar a cada punto (suponiendo que sea factible dadas las restricciones mencionadas anteriormente), hay muchas estructuras de señales que pueden lograr esto (por lo tanto, voy a proporcionar sólo un par de ejemplos).

Ejemplo 1:

Supongamos que $V=\mathbb{R}$ (la línea real), y $P_V$ es la distribución normal sobre los reales, supongamos que nos interesa encontrar una señal tal que la posterior $P_{V|T}$ es la distribución normal estándar truncada a $[a,b]$ . Entonces la estructura de la señal puede ser simplemente la siguiente:

Dejemos que $\mathcal{T}=\{blue,red\}$ $$P_{T|V}(blue|v)=\left\{\begin{array}{c c} 1 & ; v\in[a,b]\\ 0 & ; v\notin [a,b] \end{array}\right. \ \ \ \forall v\in V $$

Por supuesto $P_{T|V}(red|v)=1-P_{T|V}(blue|v)$ .

Obsérvese que si el DM recibe una señal "azul", infiere que el estado está en $[a,b]$ y porque la señal "azul" tiene la misma probabilidad de ser recibida para cualquier estado en $[a,b]$ entonces la posterior tiene la misma forma que la anterior (es decir, será la normal truncada). Contrasta esto con la siguiente señal: (para simplificar, supongamos que $[a,b]=[1,2]$ :

$$P_{T|V}(blue|v)=\left\{\begin{array}{c c} \frac{1+v}{3} & ; v\in[a,b]\\ 0 & ; v\notin [a,b] \end{array}\right. \ \ \ \forall v\in V $$

y $P_{T|V}(red|v)=1-P_{T|V}(blue|v)$

Ahora, recibir la señal "azul" también hace que el DM infiera que el estado está en $[a,b]$ pero la estructura de la señal envía el mensaje "azul" más a menudo cuando el estado está más cerca de $b$ por lo que la posterior asignará una mayor probabilidad a los estados más cercanos a $b$ que lo que haría la normal truncada, y menos probabilidad a los estados más cercanos a $a$ .

Ejemplo 2:

Si en cambio, lo que querías de tu señal era la segunda interpretación. A saber, "Supongamos que el DM descubre el estado del mundo, $v\in V$ siempre que esté en $[a,b]\subset V$ y aprende el mínimo en caso contrario. ¿Se puede escribir esto como una estructura de información?"

Puede simplemente dejar que $T=\mathbb{R}$ y definir la estructura de la señal como sigue (para simplificar, supongamos de nuevo que $[a,b]=[1,2]$ )

$$P_{T|V}(t|v)=\left\{\begin{array}{c l} 1 & ; \ t=v \ \& \ v\in[a,b]\\ 1 & ; \ t=0 \ \& \ v\notin[a,b]\\ 0 & ; \ otherwise. \end{array}\right. \ \ \ \forall v\in V $$ (Aquí el mensaje "0" puede ser cualquier otro número aleatorio que no esté en $[a,b]$ .)

Por lo tanto, el DM recibe la señal "0" siempre que el estado está fuera del intervalo [a,b] (por lo que aprenden el mínimo posible) o aprenden el estado del mundo (recibiendo el mensaje "v") cuando el estado está en el intervalo.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X