Está claro que los jugadores de un juego casi siempre pueden crear variaciones triviales de las estrategias sin romper las conclusiones de la teoría de juegos. Por ejemplo, un jugador que juegue a piedra, papel o tijeras puede...
- Lanzar piedra y parpadear
- Lanza la piedra y no parpadees
- Tirar papel y parpadear
- Tira el papel y no pestañees
- Tira las tijeras y parpadea
- Tira las tijeras y no pestañees
La teoría de juegos sería bastante inútil en el mundo real si las soluciones al "nuevo" juego que esto crea no pudieran analizarse particionando este espacio de estrategias en las superestrategias...
- Estrategias de rock
- Estrategias en papel
- Estrategias de tijera
...y aplicando las herramientas utilizadas para resolver la versión ordinaria de Piedra, Papel o Tijera a estas superestrategias (al menos hasta cierta imperceptible utilidad negativa del parpadeo). ¿Podemos, en contextos generales menos triviales, portar las herramientas de la teoría de juegos que se aplican normalmente a las estrategias (estrategias dominantes y dominadas, eliminación iterativa, mejores respuestas, equilibrios de Nash y otros conceptos de solución, inducción hacia atrás, etc.) a estas particiones de superestrategias de un espacio de estrategias?
Ejemplo nº 1: En un juego de cartas coleccionables, un jugador construye una baraja personalizada con la que se enfrenta a otro jugador. Supongamos que hay $5000$ cartas disponibles, y cada mazo debe contener $50$ tarjetas únicas. Entonces el jugador tiene $5000 \choose 50$ posibles estrategias puras para construir una cubierta o mezclar más. Supongamos además que llegamos a un algoritmo que clasifica cada estrategia como agresiva (lo que significa que la probabilidad de que el mazo resultante [o mazo esperado si se mezcla] gane una batalla es mayor en partidas cortas; es adecuada para el papel de gastar recursos ambiciosamente para buscar una victoria rápida), o pasiva (lo que significa que la probabilidad de que el mazo resultante o mazo esperado gane una batalla es mayor en partidas más largas; es adecuada para el papel de esperar a que el oponente gaste recursos antes de buscar la victoria). En podría aplicar cualquiera de las herramientas habituales de la teoría de juegos a las estrategias, pero el espacio de estrategias es enorme. El planteamiento que se examina en esta pregunta consiste en aplicar las mismas herramientas a las superestrategias...
- Construir una baraja agresiva
- Construir una cubierta pasiva
Por ejemplo, un perfil de superestrategia podría considerarse un equilibrio de Nash si ambos jugadores, que saben si el otro ha elegido un mazo agresivo o pasivo, no se benefician de cambiar su propio mazo de agresivo a pasivo, o viceversa. Se les permite beneficiarse cambiando a una estrategia diferente dentro de la misma superestrategia (es decir, cambiar de una baraja agresiva a otra baraja agresiva diferente). Dependiendo de cómo se definan los detalles, un cambio de estrategia por jugador puede garantizar que nadie sea mejor cambiando una segunda vez, pero si a un jugador se le permite ver que su oponente cambió, por ejemplo, y esa nueva información le incentiva a cambiar de nuevo, entonces no importa cuántas veces los jugadores cambien mientras convergen o ciclan entre estrategias, no deberían estar incentivados a desviarse de su superestrategia.
Ejemplo nº 2: Consideremos una partida de Monopoly para tres jugadores. No estoy seguro de que en el Monopoly real se garantice la parada, así que supongamos algunas modificaciones arbitrarias de las reglas para mantener las cosas finitas, si es que importa. Incluso si es finito, el espacio de estrategias es enorme, pero quizá pensemos que un factor importante para predecir los resultados es saber qué jugadores están incluidos en los intercambios de propiedades. En el Monopoly real, los jugadores a veces se confabulan contra el jugador o jugadores que se consideran más hábiles en el juego negándose a comerciar con ellos. Supongamos que diseñamos nuestro algoritmo para clasificar cada una de las estrategias del jugador A como una de las superestrategias...
- Intento de colusión con el Jugador B contra el Jugador C
- Intento de colusión con el Jugador C contra el Jugador B
- No intente conspirar contra ninguno de los oponentes
El jugador B y el jugador C tendrían cada uno tres superestrategias análogas. Quizá aquí queramos evaluar si el jugador A que conspira contra el jugador C está dominado por el que conspira contra el jugador B. Se me ocurren al menos dos sentidos en los que esto podría definirse...
- Independientemente de las estrategias que elijan el Jugador B y el Jugador C, al Jugador A siempre le conviene más jugar al menos una estrategia dentro de la superestrategia de colusión contra el Jugador B que cualquier estrategia dentro de la superestrategia de colusión contra el Jugador C, aunque conocer las estrategias de los otros jugadores puede influir en que estrategia dentro de la colusión contra el Jugador B superestrategia que prefiere el Jugador A; la invariante es que ninguna estrategia dentro de la colusión contra el Jugador C superestrategia es nunca mejor
O
- Independientemente de las superestrategias que elijan el Jugador B y el Jugador C, el Jugador A siempre estará mejor jugando al menos una estrategia dentro de la superestrategia de colusión contra el Jugador B que cualquier estrategia dentro de la superestrategia de colusión contra el Jugador C, aunque conocer las estrategias exactas de los otros jugadores puede incentivar al Jugador A a cambiar a una superestrategia diferente.
¿Las herramientas de la teoría de juegos se extienden de este modo, posiblemente con ligeras modificaciones si las he descrito mal? Si es así, ¿pueden cambiar las conclusiones cualitativas de la teoría de juegos en función del grado de división del espacio estratégico en superestrategias? Si no es así en general, ¿hasta dónde puede llevarse esta idea más allá de los ejemplos completamente triviales antes de que deje de producir resultados correctos?