1 votos

Straffin, P. D. (1993): Teoría de los juegos y estrategia. ¿Cómo se calcula el nivel de seguridad de la página 103?

¿Podría alguien explicar cómo Straffin ha calculado los niveles de seguridad de Rose y Colin en la página 103? Por lo que entendí, el nivel de seguridad de Colin es 6 porque es el mínimo de la estrategia Colin A porque Colin A domina a Colin B. Si se consideraran ambos, Colin A y Colin B, Rose debería seguir una estrategia mixta de 8/9 para Rose A y 1/9 para Rose B, lo que lleva a un nivel de seguridad de 20/9, pero sólo si se considerara a Colin A. No entiendo cómo Straffin llegó al nivel de seguridad de 10/3 para Rose y por qué la estrategia BA debería jugarse al menos 1/3 de las veces.

Aquí están las dos páginas que describen el problema (me disculpo por la mala resolución): enter image description here

0 votos

(1) Esto es imposible de responder para quien no tenga el libro a mano. Por favor, añada más información. (2) Esto suena a teoría de juegos directa, no a estadística.

0 votos

Gracias por su comentario. He suprimido la etiqueta de estadísticas y he subido las dos páginas, en las que la de la izquierda describe el problema y la de la derecha los resultados.

0 votos

Aunque considero que la teoría de juegos es uno de los fundamentos teóricos de la teoría estadística, sospecho que la mayoría de los usuarios de este sitio percibirán este tema como periférico en el mejor de los casos. Es posible que obtengas mejores respuestas en el sitio de economía de SE.

1voto

Simon Puntos 31

Supongamos que Colin juega A con probabilidad c y B con probabilidad 1-c, mientras que Rose juega A con probabilidad r y B con probabilidad 1-r. Entonces el resultado de Rose es

$2rc+4(1-r)c+10r(1-c)+0(1-r)(1-c)$

El nivel de seguridad de Rose se calcula tomando el max-mini payoff: es decir, para cada valor de r, encontrar el mínimo payoff sobre todos los c, y luego encontrar el máximo de dicho valor.

Así que, en primer lugar, podemos simplificar la expresión anterior:

$2rc+4c-4rc+10r-10rc = 4c+10r-12rc$

Como función de c, es una línea con intercepción $10r$ y la pendiente $4-12r$ .

Caso I: $r = \frac13$ Esta línea es una constante $10r$ . Enchufe $r =\frac13$ en y obtienes $\frac{10}3$

Caso II: $r > \frac13$ entonces tiene una pendiente negativa, y el mínimo se produce en $c = 1$ con un pago de $4-2r$ . Desde $r > \frac13$ tenemos que la recompensa es menor que $4-2/3 = \frac{10}3$ .

Caso II: $r < \frac13$ , entonces tiene una pendiente positiva, y el mínimo se produce en $c = 0$ con un pago de $10r$ . Desde $r < \frac13$ la recompensa es menor que $\frac{10}3$ .

En otras palabras, si Rose juega A $\frac13$ del tiempo, entonces obtiene una media de $\frac{10}3$ independientemente de lo que haga Colin. Si juega A menos de $\frac13$ del tiempo, entonces si Colin juega B, entonces ella obtiene 10 menos que $\frac13$ del tiempo y 0 el resto del tiempo, consiguiendo su menos de $\frac{10}3$ . Si juega A más de $\frac13$ del tiempo, entonces si Colin juega A, obtiene 2 más que $\frac13$ del tiempo y 4 el resto del tiempo, consiguiendo su menos $\frac{10}3$ .

Así que Rose puede garantizarse $\frac{10}3$ jugando a A $\frac13$ del tiempo, y cualquier otra estrategia tiene la posibilidad de darle menos que eso. Por lo tanto, $\frac{10}3$ es su nivel de seguridad.

La razón por la que BA debería jugarse al menos $\frac13$ del tiempo es que si BA se juega $\frac13$ del tiempo y AB se juega $\frac23$ del tiempo, entonces la recompensa de Colin es $8*\frac13+ 5*\frac23 = \frac83 + \frac{10}3 = \frac{18}3=6$ que es su nivel de seguridad. Si BA se juega menos de $\frac13$ de las veces, entonces su remuneración es inferior a su nivel de seguridad, por lo que sería mejor que no cooperara.

0 votos

Gracias, @Acccumulation, por tu respuesta. Entendí que el pago de Rose será constantemente $\frac{1}{3}$ si Rose juega A $\frac{1}{3}$ del tiempo, sin importar lo que haga Colin. Utilizando Geogebra, también comprendí que la recompensa de Rose es mínima en el caso II si $c=1$ y en el caso III si $c=0$ . ¿Cómo ha llegado a esta conclusión? ¿Simplemente probando o utilizando el cálculo? ¿Te he entendido bien al decir que determinaste la ganancia mínima de Rose en términos del "peor escenario posible", lo que ocurría bajo la condición de que Colin hiciera lo peor?

0voto

David Puntos 36

Basado en la respuesta de @Acccumulation, trato de poner la razón, por la cual BA debe ser jugado al menos $\frac{1}{3}$ del tiempo, en otras palabras. Si Colin no cooperara, siempre podría jugar con Colin A porque Colin A domina a Colin B. Por lo tanto, se le concedió un pago de $6$ con seguridad. Ahora, consideremos los casos de cooperación AB y BA: Para AB, Colin obtendría un pago de $5$ mientras que él obtendría un pago de $8$ para BA.

La pregunta ahora es: ¿Cuán grande debe ser la proporción de jugar BA como mínimo para garantizar que Colin coopere jugando una mezcla de AB y BA y no juegue sólo Colin A?

Para responder a esto, ponlo en una fórmula determinando $x$ como la mínima ocurrencia de BA con pago $8$ para Colin y $1-x$ como la ocurrencia restante de AB con el pago $5$ . Recuerda que $6$ es el pago mínimo que obtendría Colin si jugara sólo la estrategia dominante Colin A: $$x\cdot 8+(1-x)\cdot5 \geq 6$$ $$3\cdot x+5 \geq 6$$ $$x \geq \frac{1}{3}$$ Por lo tanto, BA debería jugarse al menos $\frac{1}{3}$ del tiempo para motivar a Colin a cooperar.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X