5 votos

¿Existe una explicación intuitiva de por qué las apuestas de Kelly ignoran las probabilidades?

Acabo de enterarme de la existencia de las apuestas de Kelly en el capítulo 6 de la obra de Cover & Thomas Introducción a la teoría de la información. La configuración matemática es que tenemos una carrera de caballos, con caballo $i$ ganar con probabilidad $p_i$ . Si el caballo $i$ gana, usted recibe $o_i$ dólares por cada dólar que apuestes. Imagina que esta carrera de caballos se repite infinitas veces, y optimiza sobre las ``estrategias de apuesta'' $b$ que apostó repetidamente una proporción $b_i$ de su riqueza total en el caballo $i$ .

En este caso, su riqueza crecerá (o decaerá) exponencialmente. Si se quiere maximizar el exponente, Cover y Thomas demuestran la optimalidad de la estrategia de Kelly, que elige $b_i=p_i$ para todos los caballos $i$ . Para una redacción detallada de esto, véase por ejemplo aquí .

Esto me parece extremadamente contrario a la intuición: habría pensado que la estrategia óptima dependería de las probabilidades $o_i$ . Sigo toda la matemática de la derivación, pero ¿hay una explicación conceptual de lo que ocurre aquí?

Permítanme dar un ejemplo que ilustra el fenómeno.

Ejemplo 1: Supongamos que hay una carrera de caballos con dos caballos, el primero de los cuales ganará la carrera con probabilidad $1/3$ y el segundo de ellos gana con probabilidad $2/3$ . Para el caballo $1$ , usted recibe $2$ dólares del hipódromo por cada dólar que apuestes por él si gana (y, por supuesto, $0$ dólares si pierde). Las probabilidades dadas por el hipódromo, es decir $2$ dólares en caso de victoria- son los mismos para los caballos $2$ .

El teorema dice que hay que apostar $1/3$ de su riqueza en el caballo $1$ en cada paso (y el resto en el caballo 2) para maximizar el exponente en la tasa de crecimiento exponencial a largo plazo de su riqueza.

Ejemplo 2: Supongamos que ahora todo sigue igual, excepto que si apuestas un dólar al caballo $2$ ahora recibirá 1.000.000 de dólares si gana.

El teorema afirma que la mejor estrategia es exactamente la misma que en el ejemplo 1, lo que parece muy extraño: intuitivamente, ¿por qué no se apuesta más por el caballo 2 en este caso?

0 votos

En primer lugar, ¡bienvenidos a Quant.SE! ¿Pero las probabilidades están incluidas? es.wikipedia.org/wiki/Criterio_de_Kelly#Declaración

1 votos

Esta es una configuración ligeramente diferente de lo que estoy preguntando. Para la independencia de las probabilidades, además del enlace en mi pregunta, también ver es.wikipedia.org/wiki/Teoría del juego y de la información en "Kelly Betting" y luego "Doubling Rate"

0 votos

Sí, pero en su pregunta usted indica el criterio de optimalidad $b_i=p_i$ que no es más que otra forma de utilizar las probabilidades.

3voto

penti Puntos 93

El juego de Kelly sí no ignorar las probabilidades, el criterio de optimalidad dado como probabilidades no es más que otra forma de enunciar las probabilidades.

Véase, por ejemplo, aquí: https://www.ctspedia.org/do/view/CTSpedia/OddsTerm

3 votos

No creo que esto lo responda. En mi pregunta, la palabra "probabilidades" tiene un significado específico -- se refiere a los números $o_i$ y la palabra "probabilidades" tiene un significado específico: se refiere a los números $p_i$ . No hay ninguna relación entre los números $p_i$ y $o_i$ y me pregunto por qué una determinada estrategia es independiente de $o_i$ . He añadido dos ejemplos que ilustran la cuestión y que pueden ayudar a aclarar las cosas.

0 votos

Inicialmente voté arriba, pero @MichaelS. tiene razón en que su pregunta es diferente.

0 votos

@MatthewGunn: Gracias. Para ser honesto con usted todavía no estoy convencido. Sigo pensando que he dado la respuesta correcta, pero lo pensaré una vez más...

3voto

YviDe Puntos 18

Este resultado poco intuitivo es consecuencia del objetivo logarítmico, de maximizar la tasa de crecimiento esperada de la riqueza en lugar de la propia riqueza.

Un problema diferente para construir alguna intuición [Actualización 2019]

Para construir alguna intuición sobre el trabajo con los cambios en los registros en lugar de los cambios en los niveles, vamos a imaginar un mundo sin incertidumbre.

Imagina que ahorras una fracción $b$ de su patrimonio cada periodo y ganar un tipo de interés $r$ por lo tanto, la riqueza $w_t=[b(1+r)]^t$ . Su tasa de crecimiento es básicamente el cambio en la riqueza logarítmica. Más precisamente, su tasa de crecimiento instantánea $g$ es: $$ \begin{align*} g &= \frac{\partial \log w_t}{\partial t} \\ &= \log b + \log (1+r) \end{align*}$$ .

Obsérvese que trabajando en troncos, el término de ahorro $\log b$ y el plazo del tipo de interés $\log(1+r)$ ¡son linealmente separables!

  • $ \frac{\partial g}{\partial r} = \frac{1}{1+r} > 0$ : Un tipo de interés más alto aumenta efectivamente la tasa de crecimiento de la riqueza.
  • $ \frac{\partial g}{\partial b} = \frac{1}{b} > 0$ : Ahorrar más también aumenta la tasa de crecimiento de la riqueza. El efecto de ahorrar más es $\frac{\partial g}{\partial b}$ .
  • PERO $ \frac{\partial ^2}{ \partial b \partial r} = 0$ ¡! Un tipo de interés más alto no lo hace ¡cambiar el efecto de ahorrar más!

Esto es lo que está detrás del resultado en su problema vinculado. Cuando se trabaja en logaritmos en lugar de niveles, el pago por el caballo es linealmente separable de su apuesta por el caballo. Ambos términos afectan a la tasa de crecimiento, pero no hay interacción entre los dos.

La relación entre (1) su problema vinculado y (2) el problema clásico de Kelly [Respuesta original]

En ambos problemas, el objetivo es el mismo: maximizar la riqueza logarítmica esperada. Lo que difiere es el conjunto de valores que se pueden comprar.

  • El problema que has enlazado es un problema de asignación de cartera entre $m$ arrow securities para $m$ estados del mundo. Por ejemplo, en el caso $m=2$ , tienes dos valores con pagos: $$ \begin{bmatrix} o_1 \\ 0 \end{bmatrix} \quad \quad \quad \begin{bmatrix} 0 \\ o_2 \end{bmatrix} $$
  • En el binario, el clásico problema de las apuestas de Kelly los pagos de seguridad son:

$$ \begin{bmatrix} o_1 \\ 0 \end{bmatrix} \quad \quad \quad \begin{bmatrix} 1 \\ 1 \end{bmatrix} $$ La segunda seguridad es la de tener dinero en efectivo (es decir, no apostar). Las soluciones a estos problemas son totalmente compatibles. En ambos problemas, la cuota de $t=0$ riqueza que gasta para comprar $t=1$ pagos en el estado $i$ es simplemente $p_i$ . En ninguno de los dos problemas depende de las probabilidades $o_i$ . (Parece que depende de $o_i$ en el clásico problema de Kelly debido a la ofuscación por la seguridad sin riesgo).

Su problema: la configuración

  • Hay $m$ diferentes caballos (es decir, resultados).
  • Apuesta por la fracción $b_i$ de la riqueza a caballo $i$ .
  • Caballo $i$ paga $o_i$ si gana y tiene un $p_i$ posibilidad de ganar.
  • Debes apostar toda tu riqueza: $\sum_i b_i = 1$ .

Por lo tanto, si el caballo $i$ gana, tendrá $o_ib_i$ veces su riqueza original. Su riqueza esperada en el registro es $\sum_{i=1}^m p_i (\log o_ib_i)$ .

Maximizar la expectativa de riqueza del tronco:

Esto equivale a maximizar su tasa de crecimiento. El problema es:

$$\begin{equation} \begin{array}{*2{>{\displaystyle}r}} \mbox{maximize (over $b_i$)} & \sum_{i=1}^m p_i (\log o_i + \log b_i) \\ \mbox{subject to} & \sum_{i=1}^m b_i = 1 \end{array} \end{equation} $$ Se trata de un problema de optimización convexo en el que se cumple la condición de Slater, por lo que las condiciones de primer orden son necesarias y suficientes. El lagrangiano es $ \mathcal{L} = \sum_{i=1}^m p_i (\log o_i + \log b_i) - \lambda \left(\sum_i b_i - 1\right)$

Las condiciones de primer orden son: $$ \frac{p_i}{b_i} = \lambda \text{ for all $ i $} \quad \quad \quad \sum_i b_i = 1 $$

Por lo tanto, $\lambda = 1$ et $b_i = p_i$ .

Relación con el problema clásico del criterio de Kelly (caso $m=2$ )

Estás decidiendo cuánta riqueza asignar a una apuesta arriesgada que paga las probabilidades $o_1$ y una apuesta sin riesgo que paga la cuota 1 (es decir, la cuota neta 0). Esto equivale a una asignación de cartera a valores con pagos $\begin{bmatrix} o_1\\0\end{bmatrix}$ et $\begin{bmatrix} 1 \\ 1 \end{bmatrix}$ (ambos con un precio de 1).

La solución clásica del criterio de Kelly es que el agente asigne:

  • $p_1 - \frac{p_2}{o_1 - 1}$ al valor con precio 1 y pago $\begin{bmatrix}o_1 \\ 0 \end{bmatrix}$
  • $1 - p_1 + \frac{p_2}{o_1 - 1}$ al valor con precio 1 y pago $\begin{bmatrix} 1 \\ 1 \end{bmatrix}$

¿Cuál es la ganancia del agente en el estado 1?

\begin{align*} \left( p_1 - \frac{p_2}{o_1 - 1}\right) \cdot o_1 + \left( 1 - p_1 + \frac{p_2}{o_1 - 1} \right) \cdot 1 &= p_1o_1 \end{align*}

¿Cuál es la ganancia del agente en el estado 2?

$$\left( 1 - p_1 + \frac{p_2}{o_1 - 1} \right) \cdot 1 = p_2 \left( \frac{o_1}{o_1 - 1} \right) $$

¿Cuánto? $t=0$ riqueza gasta el agente al precio $\frac{1}{o_1}$ para conseguir el pago del estado 1?

\begin{align*} b_1 = o_1p_1 \frac{1}{o_1} = p_1 \end{align*} A partir de los valores existentes, se puede construir un valor con precio $1$ y el pago $\begin{bmatrix}1\\o_2 \end{bmatrix}$ donde $o_2 = \frac{o_1}{o_1 - 1}$ .

¿Cuánto dinero gasta el agente en el precio $\frac{1}{o_2} = \frac{o_1-1}{o_1}$ para conseguir el pago del estado 2?

\begin{align*} b_2 = \left( p_2 \left( \frac{o_1}{o_1 - 1} \right) \right) \frac{o_1-1}{o_1} = p_2 \end{align*}

Así que las soluciones son totalmente compatibles, usted elige $b_1 = p_1$ et $b_2 = p_2$ en el clásico problema de Kelly también.

2voto

Akash Puntos 8

¡Kelly SÍ refleja las probabilidades!

La forma de apuesta binaria simple de Kelly es:

Fracción de Kelly = (p(win) * (odds + 1) - 1) / odds

Por lo tanto, para una probabilidad del 60% de un riesgo del 50%, es decir, 1:1 es igual a las probabilidades 1, eso es el 20% de su capital en riesgo.

Más formalmente, Kelly busca maximizar la log-wealth (LW)

LW = suma ( Pi * ln(1 + Stake * Payoffi)

Maximizar LW, entonces dLW/dStake = 0

Para cada evento i, esa derivada es Payoff/(1+ stake*payoff)

Si se hace el cálculo, cualquier variación de eso terminará con un múltiplo de los pagos en los denominadores. ¡Que es el tamaño neto que refleja las probabilidades!

La advertencia importante aquí es que el tamaño de la apuesta Kelly sólo es óptimo si está 100% seguro de su ventaja informativa. Si está seguro de que tiene una ventaja informativa, pero no está seguro de su magnitud, entonces la Kelly no será óptima; y lo más probable es que reste beneficios debido a la sobreapuesta. Kelly es un tamaño de apuesta MÁXIMO, que sólo es óptimo si está 100% seguro.

Permitiendo un 50% de posibilidades de que el mercado tenga razón frente a un 50% de que yo tenga razón, las apuestas y los beneficios asociados se reducirán proporcionalmente a las probabilidades. Esa es la parte de Kelly que la gente tiende a ignorar por las prisas, y a arrepentirse en el ocio :-)

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X