2 votos

¿Por qué los teóricos de los juegos utilizan un pago descontado de esta forma?

Disculpen el título. Me he dado cuenta de que el pago descontado en la literatura de la teoría de juegos suele adoptar la forma

$$\sum_{t=1}^\infty\lambda(1-\lambda)^{t-1}R_t$$

Esto difiere de la retribución descontada en los otros escenarios de optimización dinámica, por ejemplo, véase la Ecuación de Bellman en la teoría del control.

¿A qué se debe esta diferencia?

2voto

Eric L Puntos 86

Según mi experiencia, se trata sobre todo de limpieza para obtener resultados.

Consideremos un juego repetido de horizonte infinito, con representación de pagos descontados (donde utilizo $\delta = (1-\lambda)$ en su notación) $$ (1-\delta)\sum_{t=0}^{\infty}\delta^t R_t $$ donde $0 < \delta < 1$ .

Supongamos que juego una estrategia que me da la misma ganancia, digamos $a$ para cada período $t$ . Entonces, $$ (1-\delta)\sum_{t=0}^{\infty}\delta^t a = (1-\delta)\frac{a}{1-\delta} = a $$ que es más limpio que $$ \frac{a}{1-\delta} $$ Como nota al margen, multiplicar la utilidad por una constante no cambia las preferencias, por lo que mantenemos las preferencias inherentes iguales.

1 votos

De hecho, podría decirse que la utilidad debería considerarse una clase de equivalencia, y una fórmula concreta simplemente un representante de esa clase. Dos fórmulas de la misma clase de equivalencia son esencialmente la misma utilidad.

1voto

Trevel Puntos 501

¿Se refiere a partidas repetidas, en las que el jugador $i$ obtiene un pago de la forma $$(1-\delta)\sum_{t=0}^{\infty}\delta^{t}u_{i}(x_{i}^{t})$$

de la secuencia de pagos $\left\{x_{i}^{t}\right\}$ ? En $(1-\delta)$ se añade a la parte delantera para dar el media por periodo de pago.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X