4 votos

¿Cuál es la mejor manera de evitar las trampas utilizando una amenaza creíble en un juego de suma positiva no cooperativo de dos personas?

Estoy jugando con una situación en la que hay dos escenarios posibles.

Escenario 1

Se trata de una transacción entre dos personas, Proveedor y Consumidor, que tienen la opción de comportarse honestamente o de forma corrupta. Hay que tener en cuenta que una transacción corrupta sólo es posible cuando el consumidor es corrupto. Si el consumidor es honesto, la transacción será siempre honesta. La matriz de pagos se muestra a continuación. (Por comodidad, llamo a los agentes Proveedor y Consumidor. No te preocupes por lo que significan).

(En las imágenes que siguen, el equilibrio de Nash está resaltado en el recuadro verde. He resaltado la mejor estrategia del Proveedor y la mejor estrategia del Consumidor en ROJO y AZUL respectivamente).

enter image description here

Ahora viene la parte complicada (complicada para mí, claro). Estoy tratando de modelar una versión alterada del Escenario 1, llamada Escenario 2, que se describe a continuación.

Escenario 2

En este caso, existe una amenaza creíble para el proveedor. La amenaza creíble es que si tanto el Proveedor como el Consumidor actúan de forma corrupta, y el Consumidor es descubierto (en mi modelo, sólo podemos detectar la corrupción del Consumidor), entonces el Proveedor será castigado, junto con el Consumidor. Básicamente, quiero desalentar la corrupción incluso antes de que se produzca. Si sólo castigara al consumidor, los proveedores se sentirían libres de engancharse al siguiente consumidor corrupto que apareciera. Como castigo tanto al proveedor como al consumidor, el proveedor podría pensárselo dos veces antes de confabularse con un consumidor corrupto.

Tengo una matriz de pago tentativa a continuación. Me gustaría saber si mi razonamiento en la matriz es correcto.

Estoy confundido porque hay dos posibles matrices de resultados para el escenario 2. La única que he mostrado es aquella en la que sí son atrapados. ¿Qué pasa con la situación en la que no son atrapados? ¿Tenemos que tenerlo en cuenta? Y lo más importante para mí, ¿es mi razonamiento (en cursiva arriba) sobre el doble castigo (al proveedor y al consumidor) en caso de colusión que es más ventajoso para el sistema que simplemente castigar al consumidor una buena estrategia, suponiendo un sistema con un enorme grupo de consumidores y proveedores?

enter image description here

1voto

Simon Puntos 31

No hay dos matrices de pago. Si hay una elección aleatoria entre las dos matrices de resultados, entonces la matriz global de resultados será simplemente una combinación lineal de las dos matrices que has presentado, según las probabilidades. Por ejemplo, si la probabilidad de ser atrapado es del 10%, entonces cada entrada de la matriz global es 0,9 veces la entrada correspondiente de la primera matriz, más 0,1 veces la entrada de la segunda matriz. Como las dos matrices son idénticas, excepto la inferior derecha, sólo ese cuadrado dependerá de la probabilidad. Si la probabilidad de ser atrapado es $p$ , entonces el pago en esa casilla será $4(1-2p)$ . En general, si tienen probabilidad $p$ de recibir una multa $f$ en lugar del pago regular, entonces el pago global será $4(1-p)-pf=4-4p-pf=4-(f+4)p$ . Como usted dice, una mayor probabilidad de ser atrapado significa que se requiere menos de una multa, y viceversa.

Los pagos para ambos jugadores son iguales, pero suponga que el Proveedor y el Consumidor tienen diferentes pagos esperados para la parte inferior derecha, SEP y CEP respectivamente. Para el Proveedor, cualquier SEP positivo será un incentivo para elegir Corrupto. Pero para el consumidor, necesita un CEP>2 para tener un incentivo para elegir Corrupto. Así que podemos eliminar el Equilibrio de Nash castigando sólo al Conusmer, y la probabilidad/tamaño requerido del castigo para el Consumidor será menor que para el Proveedor.

Dices que aunque desincentives al Consumidor de Corrupto, el Proveedor puede ir a otro Consumidor, pero si el otro Consumidor tiene la misma matriz de pagos, entonces desde el punto de vista de la teoría de juegos, en cuanto consigamos una matriz para la que el Consumidor elija Honesto, el Proveedor no debería poder encontrar ningún Consumidor de Corrupto.

Hay que tener en cuenta que cualquier análisis de la teoría de juegos se basará sólo en lo que hay en la matriz de pagos, así que si hay algún fenómeno que crees que afectará al resultado, para que se incluya en el análisis, la matriz de pagos tiene que reflejarlo de alguna manera. Una forma de analizar la capacidad de una parte para pasar a otra contraparte es el coste de oportunidad. Supongamos que tengo un cuadro, y que un comprador potencial podría pagar 100.000, mientras que otro podría pagar 90.000. Podría pensar que la recompensa por conseguir que el primer comprador lo compre es de 100.000, pero al venderlo al primer comprador, estoy renunciando a la oportunidad de venderlo al segundo. Así que asegurarme de que la primera operación se lleve a cabo podría valer sólo 10.000 para mí. Del mismo modo, aunque un proveedor obtenga 2 unidades de utilidad por la venta de algo, si está renunciando a la oportunidad de venderlo a otra persona, podría ser apropiado considerar que su recompensa es inferior a 2.

Además de restar una NE que no nos gusta, también podemos ver cómo podemos añadir una que sí nos gusta. Actualmente, la elección del Proveedor sólo importa si el Consumidor elige Corrupto; de lo contrario, es indiferente. Por lo tanto, la única manera de inducirlos a elegir Honestidad es cambiando los pagos cuando el consumidor elige Corrupción. Si la recompensa del Proveedor en la esquina inferior izquierda fuera menor que 2, entonces tendría un incentivo para elegir Honesto cuando el Consumidor elige Honesto. Esto haría que (Honesto, Honesto) fuera un equilibrio de Nash. Por lo tanto, si el proveedor tuviera una posibilidad, por pequeña que fuera, de ser castigado cada vez que elige Corrupto, independientemente de que el consumidor elija Corrupto, entonces la parte superior izquierda sería una EN.

Se encontrarían entonces en una situación en la que hay dos NE. Ellos preferirían la de abajo a la derecha, mientras que tú prefieres que estén en la de arriba a la izquierda. Esta situación depende en gran medida de la historia: una vez que están en una NE, entrar en otra requiere coordinación. Así que una estrategia sería poner primero mucho esfuerzo en atrapar y castigar al Consumidor, bajando la recompensa en la parte inferior derecha y eliminándola como NE. Una vez que estén en la NE de arriba a la izquierda, se podría reducir la aplicación de la ley. Esto reintroduciría la parte inferior derecha como NE, pero ahora estarían en la NE superior izquierda y tendrían que coordinarse para llegar a la otra. Entonces se puede poner algo de esfuerzo en castigar al Proveedor siempre que elija Corrupto, pero la cantidad de esfuerzo para mantener esa una NE sería menor que la necesaria para mantener (Honesto, Honesto) una NE sería menor que la necesaria para mantener (Corrupto, Corrupto) no una NE.

Una solución aún mejor sería añadir una opción de "chivato"; si los jugadores honestos tuvieran la opción de chivarse de los corruptos, y fueran recompensados por hacerlo, eso haría que los corruptos fueran mucho menos atractivos.

0voto

¿Quién hace esa amenaza creíble? ¿Cuál es la probabilidad de ser atrapado?

Si la probabilidad es cierta, entonces sólo hay su segundo juego. Sin embargo, observe que en el segundo juego cambia la estructura de mejor respuesta, lo que significa que ahora tiene dos equilibrios, es decir, (H,H) y (H,C).

Si la probabilidad es menor que 1, entonces tienes dos estados del mundo. Uno en el que no estás atrapado (matriz 1) y el segundo estado del mundo en el que estás atrapado. Entonces eso implica un análisis basado en información incompleta.

Así que esto depende de lo que sea una amenaza creíble. Porque si la amenaza es creíble, entonces el jugador debe creer en ella, y entonces un juego como el presentado en el escenario 2 es suficiente.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X