11 votos

¿Por qué es necesaria la especificación previa de la orden de castigo para manipular el cumplimiento?

Según el libro Pensar estratégicamente de Avinash K. Dixit y Barry J. Nalebuff, un gobierno puede coaccionar a todos los ciudadanos para que se inscriban en el ejército amenazando con castigar sólo a la primera persona cuyo nombre esté más alto en el orden alfabético y no se inscriba. De hecho, continúa diciendo: "El alfabeto no tiene nada de especial. El punto clave es que el orden de castigo está preestablecido. Un orden de fechas de nacimiento, o de números de la seguridad social, elegidos al azar y anunciados, sirve igualmente". Parece que la suposición aquí es el conocimiento común de la racionalidad de todo el mundo, y admiten que este ejercicio no lograría incentivar el cumplimiento total en la práctica por esta razón. Sin embargo, que todo el mundo se inscriba en el ejército es el Equilibrio de Nash.

En cierto sentido, entiendo por qué el orden debe ser preestablecido. Con un orden uniformemente aleatorio, la probabilidad de ser castigado sería el inverso multiplicativo del número de ciudadanos que decidieron no registrarse. Sin embargo, el siguiente razonamiento también parece correcto.

Supongamos que remodelamos el juego (sin cambiar el problema físico subyacente) tratando al gobierno como un jugador que elige el orden de los ciudadanos entre los que se castigará al primero que no se haya registrado, pero en lugar de especificar previamente el orden, el gobierno y los ciudadanos eligen sus estrategias al mismo tiempo.

Los ciudadanos podrían mirar de frente a cada posible orden que el gobierno pudiera elegir. En cada caso, la orden se conoce por supuesto, y las mejores respuestas de los ciudadanos reflejan colectivamente el Equilibrio de Nash del juego anterior, en el que la orden se anunciaba con antelación; todo el mundo debería inscribirse en el ejército. Pero dado que estas mejores respuestas son idénticas en cada caso, también deberían constituir la mejor estrategia global en el juego simultáneo.

¿Qué hay de malo en este razonamiento?

16voto

Alexandros B Puntos 131

Denote el coste del castigo por $p$ el coste de la inscripción por $r$ .

Para que el plan funcione, es necesario tener $p > r$ .

Si se conoce el orden, entonces la persona que está en la parte superior elegirá registrarse. Dado que la racionalidad es de conocimiento común, la segunda persona lo sabe, y por lo tanto sabe que si no se registrara sería castigado con probabilidad 1. Y así sucesivamente.

Si el orden es desconocido, o por ejemplo aleatorio, cada persona puede creer que la probabilidad de castigo es minúscula, 1 dividido por el número de personas. Bien puede ser que el esperado El coste del castigo es menor que el del registro.

Esta es la razón por la que los delincuentes de Gotham cometen delitos: quien se encuentre con Batman recibirá una paliza con toda seguridad, pero como hay muchos delitos, sólo unos pocos se encontrarán con Batman y no saben de antemano quién será, por lo que los costes esperados pueden ser menores que la ganancia de sus delitos.

11voto

Christian Lescuyer Puntos 8656

Un juego puede tener múltiples equilibrios de Nash.

Has observado correctamente que, aunque el orden de castigo no esté preestablecido, el hecho de que todos se registren sigue siendo un equilibrio de Nash: cada ciudadano lo sabe, mientras todos los demás se registren Si no lo hacen, serán castigados. Por tanto, desviarse unilateralmente de la estrategia de equilibrio de Nash de empadronarse no es una decisión racional para ningún ciudadano.

Sin embargo, si los ciudadanos no conocen el orden de castigo de antemano, entonces nadie que se registre es también un equilibrio de Nash (al menos para los ciudadanos, asumiendo que el riesgo de ser elegido al azar para ser castigado es menor que el coste de registrarse; no he leído el libro, así que no sé si el gobierno también se considera un jugador en este juego). Esto también es intuitivamente obvio: si nadie se registra, de modo que el riesgo de ser el elegido para ser castigado es insignificante, entonces no hay razón para que ningún ciudadano se plantee siquiera registrarse.

¿Qué es quizás pas tan intuitivamente obvio es que anunciar el orden de castigo antes del juego rompe este segundo equilibrio: ahora el primer ciudadano del orden, que sabe seguro que serán castigados si no se registran, preferirán efectivamente registrarse sin importar lo que hagan los demás.

Además, al anunciar el completo orden de castigo de antemano, el gobierno puede asegurarse de que no exista un equilibrio de Nash (puro o mixto) en el que algunos ciudadanos pas registrarse con un 100% de probabilidad: si existiera tal equilibrio, entonces el primer ciudadano de este tipo en el orden de castigo sabría que sería definitivamente el que sería castigado si no se registrara (ya que todos los demás por delante de él en el orden ya estaban planeando registrarse con un 100% de certeza), y por lo tanto preferiría cambiar de estrategia para registrarse también siempre.


ps. En la versión del juego en la que se desconoce el orden de los castigos, existe también (típicamente) un tercer equilibrio de Nash (mixto, inestable) en el que cada uno de los $N$ los ciudadanos se registran con probabilidad $q = 1 - (P/R-1)/(N-1)$ , donde $R$ es el coste de registro y $P$ es el coste de ser elegido para ser castigado. En este equilibrio, los beneficios esperados de registrarse y no registrarse son iguales para cada ciudadano, por lo que ninguno de ellos puede mejorar sus beneficios esperados desviándose del equilibrio. Sin embargo, desviarse del equilibrio tampoco reducir la retribución esperada de un ciudadano, por lo que el equilibrio es sólo débil (como todos los equilibrios mixtos de Nash). Y en cuanto alguien hace Si se desvía del equilibrio, aunque sea ligeramente, los demás pueden mejorar sus ganancias esperadas haciendo lo mismo, por lo que este equilibrio es inestable.

En efecto, este equilibrio inestable marca la frontera entre los dominios de atracción de los dos equilibrios estables ("todo el mundo se empadrona" y "nadie se empadrona") en el espacio estratégico: si se cree que la fracción media de otros ciudadanos que se empadronarán es mayor que $q$ entonces es mejor que te registres también; si es menos de $q$ es mejor que no te registres.

(Los lectores atentos podrán observar que, para que exista este equilibrio mixto, $q$ debe estar entre cero y uno, lo que implica que $R < P < NR$ . Pero, de todos modos, este era un supuesto implícito del escenario del juego: si $P < R$ entonces el castigo no sería un elemento disuasorio eficaz aunque se administrara a todo el mundo que no se registraron; mientras que si $P > NR$ Entonces el castigo sería tan severo, comparado con el coste de registrarse, que toujours mejor registrarse que tomar incluso un $N$ riesgo de tener que sufrir el castigo).

3voto

Allanrbo Puntos 128

¿Qué hay de malo en este razonamiento?

Supone que el coste del castigo $p$ y el coste del registro $r$ son iguales para todos, por lo que es posible encontrar un castigo que garantice $p>r$ pero este no es el caso.

Para algunas personas, $r$ será cero o incluso una ganancia: quieren registrarse. Para los demás, $r$ será enorme, por ejemplo un objetor de conciencia no querrá ir, casi sin importar el coste. Por lo tanto, debería haber una distribución de probabilidad para $r$ que depende de los acontecimientos actuales (por ejemplo, si no hay guerra, $r$ no es tan alta, pero si hay una guerra y registrarse significa que te enviarán al frente, te pondrán en una trinchera y te someterán a un bombardeo de artillería, entonces la media $r$ sería bastante elevado).

Asimismo, el coste del castigo no es el mismo para todos. Si se trata de una multa, y la cantidad de ingresos que se pierden por empadronarse y no trabajar no compensa la multa, entonces es racional pagar la multa. Si se trata de una pena de cárcel, cada persona tendrá una percepción diferente de la misma. Incluso si el castigo fuera ser fusilado, se encontraría gente que preferiría eso a ir a la guerra.

Mi punto es: a través de la población, para cada individuo hay una probabilidad $Po$ se opondrán, se negarán a ir y serán castigados de buena gana. Por supuesto, esto depende del castigo.

Por lo tanto, si eres el primero de la fila, $Po$ no es de tu incumbencia. Pero si estás muy atrás en el orden de castigo, saber $p$ y $r$ sería racional tratar de estimar la media $Po$ . Si es lo suficientemente alta, se podría concluir que el Estado no puede encarcelar o castigar a tanta gente sin que se produzca una revuelta o un colapso económico, por lo que nunca llegará su turno.

Incluso si $Po$ es imposible de estimar, se puede medir simplemente observando cuántas personas delante de ti en la fila eligen ser castigadas en lugar de alistarse.

Así que creo que lo óptimo para el gobierno sería elegir un orden que ponga en primer lugar a los que tienen menos probabilidades de desertar. Es bueno para las relaciones públicas, ya que pocos serán castigados, y hará que los restantes subestimen a Po.

Sin embargo, esto no es un equilibrio de Nash: en este juego, ser el individuo con la mayor probabilidad de desertar es ventajoso, ya que te llaman el último. Así que una vez que se sepa esto, todos los que no quieran ir señalarán este hecho en voz alta.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X