Según el libro Pensar estratégicamente de Avinash K. Dixit y Barry J. Nalebuff, un gobierno puede coaccionar a todos los ciudadanos para que se inscriban en el ejército amenazando con castigar sólo a la primera persona cuyo nombre esté más alto en el orden alfabético y no se inscriba. De hecho, continúa diciendo: "El alfabeto no tiene nada de especial. El punto clave es que el orden de castigo está preestablecido. Un orden de fechas de nacimiento, o de números de la seguridad social, elegidos al azar y anunciados, sirve igualmente". Parece que la suposición aquí es el conocimiento común de la racionalidad de todo el mundo, y admiten que este ejercicio no lograría incentivar el cumplimiento total en la práctica por esta razón. Sin embargo, que todo el mundo se inscriba en el ejército es el Equilibrio de Nash.
En cierto sentido, entiendo por qué el orden debe ser preestablecido. Con un orden uniformemente aleatorio, la probabilidad de ser castigado sería el inverso multiplicativo del número de ciudadanos que decidieron no registrarse. Sin embargo, el siguiente razonamiento también parece correcto.
Supongamos que remodelamos el juego (sin cambiar el problema físico subyacente) tratando al gobierno como un jugador que elige el orden de los ciudadanos entre los que se castigará al primero que no se haya registrado, pero en lugar de especificar previamente el orden, el gobierno y los ciudadanos eligen sus estrategias al mismo tiempo.
Los ciudadanos podrían mirar de frente a cada posible orden que el gobierno pudiera elegir. En cada caso, la orden se conoce por supuesto, y las mejores respuestas de los ciudadanos reflejan colectivamente el Equilibrio de Nash del juego anterior, en el que la orden se anunciaba con antelación; todo el mundo debería inscribirse en el ejército. Pero dado que estas mejores respuestas son idénticas en cada caso, también deberían constituir la mejor estrategia global en el juego simultáneo.
¿Qué hay de malo en este razonamiento?