Modelo
Consideremos un juego en el que un decisor (DM) tiene que elegir una acción $y\in \mathcal{Y}$ posiblemente sin ser plenamente consciente del estado del mundo.
El estado del mundo tiene apoyo $\mathcal{V}$ .
Cuando el DM elige la acción $y\in \mathcal{Y}$ y el estado del mundo es $v\in \mathcal{V}$ recibe la recompensa $u(y,v)$ .
Dejemos que $P_V\in \Delta(\mathcal{V})$ sea el previo del DM.
El DM también procesa algunas señales $T$ con apoyo $\mathcal{T}$ distribución $P_{T|V}$ para perfeccionar su anterior y conseguir un posterior en $V$ , denotado por $P_{V|T}$ mediante la regla de Bayes.
Dejemos que $S\equiv \{\mathcal{T}, P_{T|V}\}$ se llame "estructura de la información".
Una estrategia para el DM es $P_{Y|T}$ . Dicha estrategia es óptima si maximiza su beneficio esperado, donde la expectativa se calcula utilizando la posterioridad.
Definamos ahora el concepto de Equilibrio Correlacionado Bayesiano de 1 jugador proporcionado en Bergemann y Morris (2013,2016,etc.).
$P_{Y,V}\in \Delta(\mathcal{Y}\times \mathcal{V})$ es un Equilibrio Correlacionado Bayesiano de 1 jugador si
1) $\sum_{y\in \mathcal{Y}}P_{Y,V}(y,v)=P_V(v)$ para cada $v\in \mathcal{V}$
2) $\sum_{v\in \mathcal{V}}u(y,v) P_{Y,V}(y,v)\geq \sum_{v\in \mathcal{V}}u(k,v) P_{Y,V}(y,v)$ para cada $y$ y $k\neq y$ .
El teorema 1 de Bergemann y Morris (2016) afirma que $P_{Y,V}$ es un Equilibrio Correlacionado Bayesiano de 1 jugador si y sólo si existe una estructura de información $S\equiv \{\mathcal{T}, P_{T|V}\}$ y una estrategia óptima $P_{Y|T}$ para el DM de forma que $P_{Y,V}$ es inducido por $P_{Y|T}$ es decir, para cada $(y,v)\in \mathcal{Y}\times \mathcal{V}$ $$ (\star) \hspace{1cm}P_{Y,V}(y,v)=\sum_{t\in \mathcal{T}}P_{Y|T}(y|t)P_{T|V}(t|v)P_V(v) $$ [para simplificar, he asumido que $\mathcal{T}$ es finito]
Pregunta 1:
¿Cómo es el Equilibrio Correlacionado Bayesiano de 1 jugador inducido por la estructura de información completa?
Este es mi intento de respuesta.
La forma en que represento la estructura de información completa es $$ S^{c}\equiv \{\mathcal{T}\equiv \mathcal{V}, P_{T|V}(t|v)=1\text{ if $ t=v $ and $ 0 $ otherwise}\} $$ En $S^c$ , $P_{Y|T}$ es una estrategia óptima si para cada $t\in \mathcal{T}$ y para cada $y\in \mathcal{Y}$ tal que $P_{Y|T}(y|t)>0$ tenemos que $$ u(y,t)\geq u(k,t) \text{ }\forall k\neq y $$ [Obsérvese que, incluso bajo la estructura de información completa, la estrategia óptima puede ser mixta, si dos acciones conducen a la misma recompensa $u$ .]
Por lo tanto, a partir de ( $\star$ ) y para cada $(y,v)$ $$ P^{c}_{Y,V}(y,v)=\sum_{t\in \mathcal{T}}P_{Y|T}(y|t)P_{T|V}(t|v)P_V(v)= \sum_{t\in \mathcal{V}}P_{Y|T}(y|t)P_{T|V}(t|v)P_V(v)= P_{Y|T}(y|v)P_V(v) $$
Por ejemplo, supongamos que $\mathcal{Y}\equiv \{1,2,3\}$ , $\mathcal{V}\equiv \{1,2,3\}$ , $P_V(1)=P_V(2)=P_V(3)=1/3$ y y $$ u(1,1)=2, u(1,2)=4, u(1,3)=3\\ u(2,1)=2, u(2,2)=3, u(2,3)=3\\ u(3,1)=1, u(3,2)=3, u(3,3)=3\\ $$ Entonces, un posible óptimo $P_{Y|T}$ en $S^c$ es $$ P_{Y|T}(1|1)=1/2, P_{Y|T}(1|2)=0, P_{Y|T}(1|3)=1/3\\ P_{Y|T}(2|1)=1/2, P_{Y|T}(2|2)=1/3, P_{Y|T}(2|3)=1/3\\ P_{Y|T}(3|1)=0, P_{Y|T}(3|2)=1/3, P_{Y|T}(3|3)=1/3\\ $$ y el correspondiente equilibrio correlativo de Bays de 1 jugador es $$ P^c_{Y,V}(1,1)=1/6, P^c_{Y,V}(1,2)=0, P^c_{Y,V}(1,3)=1/9\\ P^c_{Y,V}(2,1)=1/6, P^c_{Y,V}(2,2)=1/9, P^c_{Y,V}(2,3)=1/9\\ P^c_{Y,V}(3,1)=0, P^c_{Y,V}(3,2)=2/9, P^c_{Y,V}(3,3)=1/9\\ $$
Pregunta 2:
¿Es cierto que, para cada $v\in \mathcal{V}$ , $P^{c}_{Y|V}(y|v)\equiv \frac{P^{c}_{Y,V}(y,v)}{P_V(v)}$ debe ser igual a $1$ para un $y\in \mathcal{Y}$ y cero en caso contrario?
¿Es cierto que, para cada $y\in \mathcal{Y}$ , $P^{c}_{V|Y}(v|y)\equiv \frac{P^{c}_{Y,V}(y,v)}{\sum_{v\in \mathcal{V}}P^c_{Y,V}(y,v)}$ debe ser igual a $1$ para un $v\in \mathcal{V}$ y cero en caso contrario?
Pregunta 3: ¿Es cierto que al añadir la restricción $P_{Y,V}(y,v)>0$ ( estrictamente ) para todos los $(y,v)\in \mathcal{Y}\times \mathcal{V}$ en la definición de Equilibrio Correlacionado de Bayes de 1 jugador anterior excluimos $P^c_{Y,V}$ ? ¿Por qué?