Este resultado poco intuitivo es consecuencia del objetivo logarítmico, de maximizar la tasa de crecimiento esperada de la riqueza en lugar de la propia riqueza.
Un problema diferente para construir alguna intuición [Actualización 2019]
Para construir alguna intuición sobre el trabajo con los cambios en los registros en lugar de los cambios en los niveles, vamos a imaginar un mundo sin incertidumbre.
Imagina que ahorras una fracción $b$ de su patrimonio cada periodo y ganar un tipo de interés $r$ por lo tanto, la riqueza $w_t=[b(1+r)]^t$ . Su tasa de crecimiento es básicamente el cambio en la riqueza logarítmica. Más precisamente, su tasa de crecimiento instantánea $g$ es: $$ \begin{align*} g &= \frac{\partial \log w_t}{\partial t} \\ &= \log b + \log (1+r) \end{align*}$$ .
Obsérvese que trabajando en troncos, el término de ahorro $\log b$ y el plazo del tipo de interés $\log(1+r)$ ¡son linealmente separables!
- $ \frac{\partial g}{\partial r} = \frac{1}{1+r} > 0$ : Un tipo de interés más alto aumenta efectivamente la tasa de crecimiento de la riqueza.
- $ \frac{\partial g}{\partial b} = \frac{1}{b} > 0$ : Ahorrar más también aumenta la tasa de crecimiento de la riqueza. El efecto de ahorrar más es $\frac{\partial g}{\partial b}$ .
- PERO $ \frac{\partial ^2}{ \partial b \partial r} = 0$ ¡! Un tipo de interés más alto no lo hace ¡cambiar el efecto de ahorrar más!
Esto es lo que está detrás del resultado en su problema vinculado. Cuando se trabaja en logaritmos en lugar de niveles, el pago por el caballo es linealmente separable de su apuesta por el caballo. Ambos términos afectan a la tasa de crecimiento, pero no hay interacción entre los dos.
La relación entre (1) su problema vinculado y (2) el problema clásico de Kelly [Respuesta original]
En ambos problemas, el objetivo es el mismo: maximizar la riqueza logarítmica esperada. Lo que difiere es el conjunto de valores que se pueden comprar.
- El problema que has enlazado es un problema de asignación de cartera entre $m$ arrow securities para $m$ estados del mundo. Por ejemplo, en el caso $m=2$ , tienes dos valores con pagos: $$ \begin{bmatrix} o_1 \\ 0 \end{bmatrix} \quad \quad \quad \begin{bmatrix} 0 \\ o_2 \end{bmatrix} $$
- En el binario, el clásico problema de las apuestas de Kelly los pagos de seguridad son:
$$ \begin{bmatrix} o_1 \\ 0 \end{bmatrix} \quad \quad \quad \begin{bmatrix} 1 \\ 1 \end{bmatrix} $$ La segunda seguridad es la de tener dinero en efectivo (es decir, no apostar). Las soluciones a estos problemas son totalmente compatibles. En ambos problemas, la cuota de $t=0$ riqueza que gasta para comprar $t=1$ pagos en el estado $i$ es simplemente $p_i$ . En ninguno de los dos problemas depende de las probabilidades $o_i$ . (Parece que depende de $o_i$ en el clásico problema de Kelly debido a la ofuscación por la seguridad sin riesgo).
Su problema: la configuración
- Hay $m$ diferentes caballos (es decir, resultados).
- Apuesta por la fracción $b_i$ de la riqueza a caballo $i$ .
- Caballo $i$ paga $o_i$ si gana y tiene un $p_i$ posibilidad de ganar.
- Debes apostar toda tu riqueza: $\sum_i b_i = 1$ .
Por lo tanto, si el caballo $i$ gana, tendrá $o_ib_i$ veces su riqueza original. Su riqueza esperada en el registro es $\sum_{i=1}^m p_i (\log o_ib_i)$ .
Maximizar la expectativa de riqueza del tronco:
Esto equivale a maximizar su tasa de crecimiento. El problema es:
$$\begin{equation} \begin{array}{*2{>{\displaystyle}r}} \mbox{maximize (over $b_i$)} & \sum_{i=1}^m p_i (\log o_i + \log b_i) \\ \mbox{subject to} & \sum_{i=1}^m b_i = 1 \end{array} \end{equation} $$ Se trata de un problema de optimización convexo en el que se cumple la condición de Slater, por lo que las condiciones de primer orden son necesarias y suficientes. El lagrangiano es $ \mathcal{L} = \sum_{i=1}^m p_i (\log o_i + \log b_i) - \lambda \left(\sum_i b_i - 1\right)$
Las condiciones de primer orden son: $$ \frac{p_i}{b_i} = \lambda \text{ for all $ i $} \quad \quad \quad \sum_i b_i = 1 $$
Por lo tanto, $\lambda = 1$ et $b_i = p_i$ .
Relación con el problema clásico del criterio de Kelly (caso $m=2$ )
Estás decidiendo cuánta riqueza asignar a una apuesta arriesgada que paga las probabilidades $o_1$ y una apuesta sin riesgo que paga la cuota 1 (es decir, la cuota neta 0). Esto equivale a una asignación de cartera a valores con pagos $\begin{bmatrix} o_1\\0\end{bmatrix}$ et $\begin{bmatrix} 1 \\ 1 \end{bmatrix}$ (ambos con un precio de 1).
La solución clásica del criterio de Kelly es que el agente asigne:
- $p_1 - \frac{p_2}{o_1 - 1}$ al valor con precio 1 y pago $\begin{bmatrix}o_1 \\ 0 \end{bmatrix}$
- $1 - p_1 + \frac{p_2}{o_1 - 1}$ al valor con precio 1 y pago $\begin{bmatrix} 1 \\ 1 \end{bmatrix}$
¿Cuál es la ganancia del agente en el estado 1?
\begin{align*} \left( p_1 - \frac{p_2}{o_1 - 1}\right) \cdot o_1 + \left( 1 - p_1 + \frac{p_2}{o_1 - 1} \right) \cdot 1 &= p_1o_1 \end{align*}
¿Cuál es la ganancia del agente en el estado 2?
$$\left( 1 - p_1 + \frac{p_2}{o_1 - 1} \right) \cdot 1 = p_2 \left( \frac{o_1}{o_1 - 1} \right) $$
¿Cuánto? $t=0$ riqueza gasta el agente al precio $\frac{1}{o_1}$ para conseguir el pago del estado 1?
\begin{align*} b_1 = o_1p_1 \frac{1}{o_1} = p_1 \end{align*} A partir de los valores existentes, se puede construir un valor con precio $1$ y el pago $\begin{bmatrix}1\\o_2 \end{bmatrix}$ donde $o_2 = \frac{o_1}{o_1 - 1}$ .
¿Cuánto dinero gasta el agente en el precio $\frac{1}{o_2} = \frac{o_1-1}{o_1}$ para conseguir el pago del estado 2?
\begin{align*} b_2 = \left( p_2 \left( \frac{o_1}{o_1 - 1} \right) \right) \frac{o_1-1}{o_1} = p_2 \end{align*}
Así que las soluciones son totalmente compatibles, usted elige $b_1 = p_1$ et $b_2 = p_2$ en el clásico problema de Kelly también.
0 votos
En primer lugar, ¡bienvenidos a Quant.SE! ¿Pero las probabilidades están incluidas? es.wikipedia.org/wiki/Criterio_de_Kelly#Declaración
1 votos
Esta es una configuración ligeramente diferente de lo que estoy preguntando. Para la independencia de las probabilidades, además del enlace en mi pregunta, también ver es.wikipedia.org/wiki/Teoría del juego y de la información en "Kelly Betting" y luego "Doubling Rate"
0 votos
Sí, pero en su pregunta usted indica el criterio de optimalidad $b_i=p_i$ que no es más que otra forma de utilizar las probabilidades.
0 votos
Para aclarar, las probabilidades son los números $o_i$ -- Me pregunto por qué la apuesta óptima es independiente de $o_i$ .
0 votos
Sí, pero las probabilidades y la probabilidad son sólo dos caras de la misma moneda. Véase, por ejemplo, aquí: ctspedia.org/do/view/CTSpedia/OddsTerm
0 votos
Gracias por su pregunta. Vea mi respuesta más abajo.
0 votos
Si cambias el pago, las probabilidades deben haber cambiado también - y las probabilidades en consecuencia.
0 votos
@vojd -- aquí no se supone que el hipódromo sea "justo" o favorezca al hipódromo ni nada por el estilo. Por ello, no hay relación entre los pagos y las probabilidades de ganar.
0 votos
La razón mecánica básica es que la tasa de crecimiento de la riqueza es linealmente separable en la parte de la riqueza apostada y las probabilidades del caballo. Unas mayores probabilidades del caballo aumentan la tasa de crecimiento, pero no afectan al beneficio marginal de apostar más por el caballo.