No hay dos matrices de pago. Si hay una elección aleatoria entre las dos matrices de resultados, entonces la matriz global de resultados será simplemente una combinación lineal de las dos matrices que has presentado, según las probabilidades. Por ejemplo, si la probabilidad de ser atrapado es del 10%, entonces cada entrada de la matriz global es 0,9 veces la entrada correspondiente de la primera matriz, más 0,1 veces la entrada de la segunda matriz. Como las dos matrices son idénticas, excepto la inferior derecha, sólo ese cuadrado dependerá de la probabilidad. Si la probabilidad de ser atrapado es $p$ , entonces el pago en esa casilla será $4(1-2p)$ . En general, si tienen probabilidad $p$ de recibir una multa $f$ en lugar del pago regular, entonces el pago global será $4(1-p)-pf=4-4p-pf=4-(f+4)p$ . Como usted dice, una mayor probabilidad de ser atrapado significa que se requiere menos de una multa, y viceversa.
Los pagos para ambos jugadores son iguales, pero suponga que el Proveedor y el Consumidor tienen diferentes pagos esperados para la parte inferior derecha, SEP y CEP respectivamente. Para el Proveedor, cualquier SEP positivo será un incentivo para elegir Corrupto. Pero para el consumidor, necesita un CEP>2 para tener un incentivo para elegir Corrupto. Así que podemos eliminar el Equilibrio de Nash castigando sólo al Conusmer, y la probabilidad/tamaño requerido del castigo para el Consumidor será menor que para el Proveedor.
Dices que aunque desincentives al Consumidor de Corrupto, el Proveedor puede ir a otro Consumidor, pero si el otro Consumidor tiene la misma matriz de pagos, entonces desde el punto de vista de la teoría de juegos, en cuanto consigamos una matriz para la que el Consumidor elija Honesto, el Proveedor no debería poder encontrar ningún Consumidor de Corrupto.
Hay que tener en cuenta que cualquier análisis de la teoría de juegos se basará sólo en lo que hay en la matriz de pagos, así que si hay algún fenómeno que crees que afectará al resultado, para que se incluya en el análisis, la matriz de pagos tiene que reflejarlo de alguna manera. Una forma de analizar la capacidad de una parte para pasar a otra contraparte es el coste de oportunidad. Supongamos que tengo un cuadro, y que un comprador potencial podría pagar 100.000, mientras que otro podría pagar 90.000. Podría pensar que la recompensa por conseguir que el primer comprador lo compre es de 100.000, pero al venderlo al primer comprador, estoy renunciando a la oportunidad de venderlo al segundo. Así que asegurarme de que la primera operación se lleve a cabo podría valer sólo 10.000 para mí. Del mismo modo, aunque un proveedor obtenga 2 unidades de utilidad por la venta de algo, si está renunciando a la oportunidad de venderlo a otra persona, podría ser apropiado considerar que su recompensa es inferior a 2.
Además de restar una NE que no nos gusta, también podemos ver cómo podemos añadir una que sí nos gusta. Actualmente, la elección del Proveedor sólo importa si el Consumidor elige Corrupto; de lo contrario, es indiferente. Por lo tanto, la única manera de inducirlos a elegir Honestidad es cambiando los pagos cuando el consumidor elige Corrupción. Si la recompensa del Proveedor en la esquina inferior izquierda fuera menor que 2, entonces tendría un incentivo para elegir Honesto cuando el Consumidor elige Honesto. Esto haría que (Honesto, Honesto) fuera un equilibrio de Nash. Por lo tanto, si el proveedor tuviera una posibilidad, por pequeña que fuera, de ser castigado cada vez que elige Corrupto, independientemente de que el consumidor elija Corrupto, entonces la parte superior izquierda sería una EN.
Se encontrarían entonces en una situación en la que hay dos NE. Ellos preferirían la de abajo a la derecha, mientras que tú prefieres que estén en la de arriba a la izquierda. Esta situación depende en gran medida de la historia: una vez que están en una NE, entrar en otra requiere coordinación. Así que una estrategia sería poner primero mucho esfuerzo en atrapar y castigar al Consumidor, bajando la recompensa en la parte inferior derecha y eliminándola como NE. Una vez que estén en la NE de arriba a la izquierda, se podría reducir la aplicación de la ley. Esto reintroduciría la parte inferior derecha como NE, pero ahora estarían en la NE superior izquierda y tendrían que coordinarse para llegar a la otra. Entonces se puede poner algo de esfuerzo en castigar al Proveedor siempre que elija Corrupto, pero la cantidad de esfuerzo para mantener esa una NE sería menor que la necesaria para mantener (Honesto, Honesto) una NE sería menor que la necesaria para mantener (Corrupto, Corrupto) no una NE.
Una solución aún mejor sería añadir una opción de "chivato"; si los jugadores honestos tuvieran la opción de chivarse de los corruptos, y fueran recompensados por hacerlo, eso haría que los corruptos fueran mucho menos atractivos.