Supongamos que se da un número de jugadores $100$ puntos cada uno, y participan repetidamente en una apuesta con valor esperado positivo, con los objetivos de ser el primer jugador en alcanzar $100000$ puntos. Resolver el tamaño óptimo de la apuesta por ronda para equilibrar el riesgo de ruina y la velocidad de acumulación de puntos es un problema de teoría de juegos muy difícil, por lo que el enfoque razonable parece ser imponer una restricción heurística sobre el riesgo de ruina, y optimizar la velocidad en relación con esa restricción. Digamos que decido que no quiero más de un $2$ % de probabilidad de quiebra antes de alcanzar el $100000$ objetivo de puntos. Ahora puedo simular el juego un gran número de veces para encontrar el tamaño de la apuesta que alcance el objetivo en el menor número de rondas posible (probablemente el mayor tamaño de apuesta) sin superar el objetivo de riesgo de ruina.
Sin embargo, supongamos que estoy jugando el juego en la práctica, y he acumulado un total de puntos de $1000$ . El resto del juego es funcionalmente equivalente a un nuevo juego idéntico, excepto que en el nuevo juego, comienzo con $1000$ puntos en lugar de $100$ puntos. En otras palabras, el juego que he descrito tiene una subestructura óptima. Me parece que en el nuevo juego, mi restricción de riesgo de ruina deseada debería seguir siendo más o menos la misma, $2$ en el ejemplo; no parece haber ninguna razón fundamental (aparte de la evaluación de mi posición en relación con otros jugadores, que está fuera del alcance de esta pregunta) para suponer que tendría una tolerancia al riesgo diferente en la carrera de $1000$ a $100000$ que en la carrera de $100$ a $100000$ . Permitir que el riesgo de ruina disminuya demasiado a medida que avanza el juego es una concesión de velocidad innecesaria.
El problema es que cambiar mi estrategia a medida que avanza el juego para volver a apuntar un $2$ riesgo de ruina significa que mi estrategia original tenía en realidad más de un $2$ % de riesgo de ruina. Mi regalo, $1000$ El yo puntual no debería preocuparse por esto lo suficiente como para disuadirme de volver a hacer publicidad (el pasado está en el pasado), pero mi pasado $100$ punto de previsión de este fenómeno le importa mucho. Parece que lo que se necesita es una función que mapee cada posible punto total entre $1$ y $99999$ a un tamaño de apuesta, en el que el riesgo de ruina en cada entrada es más o menos constante (tal vez más bajo al final del juego debido a la discreción del problema), pero no está claro que tal función sea posible, porque la obtención de puntos siempre reduciría el riesgo de ruina sin importar la función que se elija. ¿Es posible construir una función de este tipo? Si no es así, ¿cómo puedo jugar racionalmente a este juego cuando sé que mis preferencias subyacentes de riesgo de ruina no van a cambiar mucho a medida que avanza el juego, y no me voy a ceñir a ninguna estrategia posible que cree?
EDITAR respecto a la naturaleza de la apuesta, según la petición en los comentarios: Supongamos que cada ronda consiste en lanzar dados justos, y la ganancia o pérdida que un jugador obtiene en esa ronda se calcula en base a la suma de las tiradas (con un valor esperado positivo). Las ganancias o pérdidas son siempre un múltiplo entero del tamaño de la apuesta. Cada conjunto de tiradas es independiente y está idénticamente distribuido con respecto a sus tiradas anteriores y a las tiradas de otros jugadores.