Me gustaría que me ayudaran a entender la definición de Equilibrio correlacionado de Bayes (BCE) en un juego de información incompleta en la p.7 de este papel.
Permítanme resumir la definición que se ofrece en el documento.
Hay N∈N jugadores, con i que denota un jugador genérico.
Existe un conjunto finito de estados Θ con θ que denota un estado genérico.
Un juego básico G consiste en
-
para cada jugador i un conjunto finito de acciones Ai donde escribimos A≡A1×A2×...×AN y una función de utilidad ui:A×Θ→R .
-
un apoyo completo antes ψ∈Δ(Θ) .
Una estructura de información S consiste en
-
para cada jugador i un conjunto finito de señales Ti donde escribimos T≡T1×T2×...×TN .
-
una distribución de la señal π:Θ→Δ(T) .
Una regla de decisión del juego de información incompleta (G,S) es un mapeo σ:T×Θ→Δ(A)
Definición de BCE: La regla de decisión σ es un BCE para el juego (G,S) si, para cada i=1,...,N , ti∈Ti y ai∈Ai tenemos ∑a−i,t−i,θψ(θ)π(t−i|ti,θ)σ(a−i|ai,ti,t−i,θ)ui(ai,a−i,θ) ≥∑a−i,t−i,θψ(θ)π(t−i|ti,θ)σ(a−i|ai,ti,t−i,θ)ui(˜ai,a−i,θ) ∀˜ai∈Ai .
Pregunta:
1) No entiendo cómo se calcula la expectativa condicional en la definición. Considere, por ejemplo, el lado izquierdo (LHS) y permítame ir a través de cada paso utilizando la notación Pr(⋅) para denotar genéricamente cualquier distribución de probabilidad.
El LHS es la recompensa esperada del jugador i donde la expectativa se calcula wrto todo lo que no conoce condicionado a lo que conoce. Por lo tanto, ∑a−i,θ,t−iui(a−i,ai,θ)×Pr(a−i,θ,t−i|ti,ai)= ∑a−i,θ,t−iui(a−i,ai,θ)×Pr(a−i|θ,t−i,ti,ai)×Pr(θ,t−i|ti,ai)= ∑a−i,θ,t−iui(a−i,ai,θ)×Pr(a−i|θ,t−i,ti,ai)⏟≡σ(a−i|ai,ti,t−i,θ) [OK!]×Pr(t−i|θ,ti,ai)⏟≡π(t−i|ti,θ)? Where is ai?×Pr(θ|ti,ai)⏟≡ψ(θ)? Where are ti,ai?=
¿Estamos asumiendo
1) t−i⊥ai condicionado a θ,ti
2) θ⊥ti,ai
?
2) ¿Cómo se simplifica la definición de BCE cuando N=1 ?
De la lectura de la página 25 del documento vinculado, parece que un BCE sigue siendo un mapa de estado y señal a una distribución de probabilidad sobre las acciones . De la lectura en la p.26 del documento enlazado, los autores dicen entonces "[...] En ese caso, el conjunto de BCE corresponde a la distribución conjunta de acciones y los estados [...] ". Estoy confundido.
Además, cuando N=1 ¿En qué se diferencia la definición de BCE de la definición de Equilibrio Bayesiano de Nash?
3) Sólo como curiosidad, ¿cuál es la razón de incluir el adjetivo " correlacionado "?