2 votos

¿Cómo se calculan/estiman los valores de los pagos en las teorías de juegos?

En las teorías de juegos como la del equilibrio de Nash, ¿cómo se crean exactamente los valores de los pagos de cada uno de los jugadores para cada una de sus estrategias potenciales? En las matrices comunes de 2x2 que he visto en artículos académicos, los distintos valores de los resultados parecen simplemente "aparecer" en las matrices sin una explicación de cómo se derivan / calculan / estiman, si esos valores tienen (o necesitan) un nivel de confianza asociado a ellos, etc. ¿Es posible, por ejemplo, tener una gama de valores de rentabilidad en lugar de un único número para una elección de jugador/estrategia determinada?

2voto

arclight Puntos 499

Aunque te pediría que me aclarases un poco más a qué artículos te refieres para darte una respuesta más específica, en general la respuesta depende un poco de cuál sea el objetivo del artículo/juego y de las compensaciones que se propongan.

Documentos como La paradoja de la cadena de tiendas de 1978 de Selten utilizan retribuciones que son importantes en su magnitud relativa (no en su valor absoluto) como medio de crear una desconexión percibida entre la Organización Industrial y la Teoría de Juegos. Del mismo modo, en el clásico juego del dilema del prisionero, los valores reales de "chivarse" y "no chivarse" no son tan importantes como el hecho de que la estrategia dominante es que ambos jugadores chiven. Esa recompensa puede ser (0,0) o (-10,-10), siempre que esa recompensa haga que chismorrear sea la estrategia dominante, funciona para el juego.

Una de las razones más importantes por las que se dan valores "exactos" en lugar de intervalos de confianza se debe a cómo se calculan las estrategias. La indiferencia es la clave para definir estrategias mixtas, algo mucho más sencillo si se dan valores exactos.

Dicho esto, hay una variedad de juegos de información imperfecta y, tal vez lo más importante para su pregunta, juegos con vigilancia imperfecta que hacen exactamente lo que sugieres: permiten que los pagos dependan de alguna variable aleatoria no observada por uno (o más) de los jugadores.

Disculpe si no he sido muy directo o si no he respondido bien a su pregunta, pero le ruego que me diga si puedo mejorar la respuesta. Los intervalos de confianza pueden ser difíciles de utilizar porque dependen tanto de los resultados estadísticos como del modelo teórico. Sin embargo, los intervalos de valores son un fenómeno relativamente común en ciertos tipos de modelos de teoría de juegos (por ejemplo, véase la teoría de subastas). Por lo general, se supone que los jugadores conocen las probabilidades relativas de los distintos resultados, pero incluso esto puede relajarse en determinadas circunstancias.

0 votos

Gracias por la aclaración. Investigaré más sobre la teoría de las subastas y los juegos de vigilancia imperfecta. ¿No es raro que en el dilema del prisionero haya que elegir los pagos de tal manera que provoquen un resultado determinado, es decir, que chivarse sea la estrategia dominante? A este profano le parece que eso es falsear los números para que la teoría funcione.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X