Actualmente estoy configurando un modelo con datos del juego "Hearthstone". Los que están familiarizados con el juego saben que (en su mayor parte) puede describirse como un juego de suma cero, en el que los jugadores eligen un mazo antes de ser emparejados al azar con otro jugador. Estos mazos tienen un porcentaje de victorias general contra todos los jugadores, así como un porcentaje de victorias para cada enfrentamiento específico (mazo A contra mazo B).
Supongamos que sólo hay 5 mazos que se pueden jugar (hay muchos más). Podríamos entonces formar una matriz de resultados esperados de 5x5 para cada emparejamiento utilizando los respectivos winrates de todos los mazos.
Mi pregunta es la siguiente: ¿cómo influiría la probabilidad de encontrar un determinado mazo? Técnicamente podríamos calcular una estrategia óptima a partir de la matriz de resultados, pero no parece que eso tenga en cuenta la probabilidad de encontrar un determinado mazo más que otro.
Al principio pensé que podría ser un tipo de juego de señales, donde el proceso de emparejamiento era un "tipo" sorteado al azar, pero ese no es el caso aquí, ya que los jugadores están tomando sus decisiones antes de que esto ocurra.
Editar
Debería haber especificado. Menciono el MSNE porque estoy tratando de ver si puedes mejorar tus posibilidades de ganar estadísticamente jugando un número de mazos en una serie de partidas secuenciales, en lugar de elegir un solo mazo y quedarte con él.