Modelo
Considere una problema de decisión de un solo agente con incertidumbre.
Un responsable de la toma de decisiones (DM) tiene que elegir la acción y∈Y posiblemente sin ser plenamente consciente del estado del mundo. Y es un conjunto finito. El estado del mundo es una variable aleatoria V con apoyo V . Cuando el DM elige la acción y∈Y y el estado del mundo es v∈V recibe la recompensa u(y,v) . Sea PV∈Δ(V) es la idea previa del DM sobre el estado del mundo V .
El DM también procesa algunas señales T con apoyo T y distribución PT|V con la condición de V para perfeccionar su anterior y conseguir un posterior en V , denotado por PV|T mediante la regla de Bayes.
Una estrategia para el DM es una distribución de acciones condicionada a la señal, que denotamos por PY|T . Dicha estrategia es óptima si maximiza su beneficio esperado, donde la expectativa se calcula usando la posterior PV|T .
En lo sucesivo, llamaremos S≡(T,PT|V) como la estructura de información del DM.
Pregunta
En el peor de los casos, la señal es poco informativa sobre V (estructura de información nula). En este escenario, el DM con estado asignado v elegirá en función de la previa PV y obtener la utilidad ˉu(v)≡u(argmaxy∈Y∫Vu(y,x)dPV(x),v). ¿Podemos demostrar que ˉu(v) es el más bajo utilidad que el DM puede alcanzar a través de todas las estructuras de información posibles? En otras palabras, tome cualquier estructura de información que sea al menos tan informativa como la estructura de información nula ; supongamos que el DM recibe alguna señal t de dicha estructura de información; ¿se sostiene que
u(argmaxy∈Y∫Vu(y,x)dPV|T(x|t),v)≥ˉu(v)?