2 votos

Análisis de la paradoja de la carrera del juego

Supongamos que se da un número de jugadores $100$ puntos cada uno, y participan repetidamente en una apuesta con valor esperado positivo, con los objetivos de ser el primer jugador en alcanzar $100000$ puntos. Resolver el tamaño óptimo de la apuesta por ronda para equilibrar el riesgo de ruina y la velocidad de acumulación de puntos es un problema de teoría de juegos muy difícil, por lo que el enfoque razonable parece ser imponer una restricción heurística sobre el riesgo de ruina, y optimizar la velocidad en relación con esa restricción. Digamos que decido que no quiero más de un $2$ % de probabilidad de quiebra antes de alcanzar el $100000$ objetivo de puntos. Ahora puedo simular el juego un gran número de veces para encontrar el tamaño de la apuesta que alcance el objetivo en el menor número de rondas posible (probablemente el mayor tamaño de apuesta) sin superar el objetivo de riesgo de ruina.

Sin embargo, supongamos que estoy jugando el juego en la práctica, y he acumulado un total de puntos de $1000$ . El resto del juego es funcionalmente equivalente a un nuevo juego idéntico, excepto que en el nuevo juego, comienzo con $1000$ puntos en lugar de $100$ puntos. En otras palabras, el juego que he descrito tiene una subestructura óptima. Me parece que en el nuevo juego, mi restricción de riesgo de ruina deseada debería seguir siendo más o menos la misma, $2$ en el ejemplo; no parece haber ninguna razón fundamental (aparte de la evaluación de mi posición en relación con otros jugadores, que está fuera del alcance de esta pregunta) para suponer que tendría una tolerancia al riesgo diferente en la carrera de $1000$ a $100000$ que en la carrera de $100$ a $100000$ . Permitir que el riesgo de ruina disminuya demasiado a medida que avanza el juego es una concesión de velocidad innecesaria.

El problema es que cambiar mi estrategia a medida que avanza el juego para volver a apuntar un $2$ riesgo de ruina significa que mi estrategia original tenía en realidad más de un $2$ % de riesgo de ruina. Mi regalo, $1000$ El yo puntual no debería preocuparse por esto lo suficiente como para disuadirme de volver a hacer publicidad (el pasado está en el pasado), pero mi pasado $100$ punto de previsión de este fenómeno le importa mucho. Parece que lo que se necesita es una función que mapee cada posible punto total entre $1$ y $99999$ a un tamaño de apuesta, en el que el riesgo de ruina en cada entrada es más o menos constante (tal vez más bajo al final del juego debido a la discreción del problema), pero no está claro que tal función sea posible, porque la obtención de puntos siempre reduciría el riesgo de ruina sin importar la función que se elija. ¿Es posible construir una función de este tipo? Si no es así, ¿cómo puedo jugar racionalmente a este juego cuando sé que mis preferencias subyacentes de riesgo de ruina no van a cambiar mucho a medida que avanza el juego, y no me voy a ceñir a ninguna estrategia posible que cree?

EDITAR respecto a la naturaleza de la apuesta, según la petición en los comentarios: Supongamos que cada ronda consiste en lanzar dados justos, y la ganancia o pérdida que un jugador obtiene en esa ronda se calcula en base a la suma de las tiradas (con un valor esperado positivo). Las ganancias o pérdidas son siempre un múltiplo entero del tamaño de la apuesta. Cada conjunto de tiradas es independiente y está idénticamente distribuido con respecto a sus tiradas anteriores y a las tiradas de otros jugadores.

2voto

Yacoby Puntos 603

Hay varios problemas en tu juego que no estás considerando, el primero de ellos es que el riesgo de ruina es irrelevante. El juego es una carrera. Tu pregunta equivale más o menos a preocuparse de que tu caballo se caiga y muera en la carrera, pero con el objetivo de ganar la carrera. La muerte del caballo no es la única forma de perder. La ruina no es la única forma de perder.

Al controlar el riesgo de ruina, puede garantizar la pérdida de la carrera. También tienes dos problemas adicionales.

Como la ruina es imposible en los números reales, el juego debe tener una unidad como la menor cantidad indivisible. Ahora imaginemos que el pago de alguna combinación es de 1,01:1, y usted apuesta 1 unidad. Sólo se puede pagar 1 unidad.

Su tercer problema es que se trata de una carrera realizada por un generador de números aleatorios. Si se tratara de un juego de habilidad en lugar de azar, las respuestas podrían ser muy diferentes.

El ganador será el actor que más triunfe sólo por el azar. Es posible maximizar el rendimiento a lo largo de una repetición infinita del juego, pero no en un solo caso.

Es cierto que podrías hacer una apuesta Kelly para la primera ronda, pero ¿qué pasa si otro actor dobla su dinero y tú reduces el tuyo a la mitad? Las dos partes deberían igualarse a medida que el tiempo llega al infinito, pero se trata de una carrera hacia una meta finita. Se trata de un problema de tiempo de parada. Si el líder está cuatro veces más cerca que el último clasificado, ¿cambia alguno de los dos su estrategia? Este es un juego de todo o nada. No importa lo cerca que estés si no eres el primero en cruzar la línea.

La ruina, en este marco, es sólo una forma de no cruzar la línea de meta.

Si se considerara sinceramente este juego, se tendría un árbol de decisión terrible porque necesita incluir los resultados potenciales de cada actor. Su utilidad aquí es $c,c>0$ si gana y $0$ si pierdes. No se trata de un juego en el que se pague por ganar, por quedar en el lugar o por mostrar. Tampoco hay trofeo de participación.

No obstante, la evitación de la ruina sólo debería ser una estrategia accidental porque resultaría óptima para no perder.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X