Como se describe, por ejemplo aquí la varianza realizada es la suma de los rendimientos al cuadrado - $\sum_{i=0}^{N-1} R_i^2$ en su anotación.
Por lo tanto, es erróneo suponer que la fórmula consiste en:
- "factor de normalización" - $252$
- "varianza de los rendimientos logarítmicos" en términos estadísticos - $\frac{1}{N}\sum_{i=0}^{N-1} R_i^2$ .
En cambio, las dos piezas de la fórmula son:
- varianza realizada - $\sum_{i=0}^{N-1} R_i^2$
- recíproco de la duración del período de tiempo - $\frac{252}{N}$
Y como no estamos hablando de la varianza (en sentido estadístico) de los rendimientos logarítmicos, ¡no tiene sentido preguntarse si los rendimientos logarítmicos tienen una expectativa cero y por qué!
La varianza realizada es útil porque proporciona una medida relativamente precisa de la volatilidad del subyacente - $\sigma$ .
La derivación real de la fórmula se ilustra a continuación.
Dejemos que $\alpha$ y $\sigma$ sean constantes, y definir el movimiento browniano geométrico $$ S(t) = S(0) e^{\sigma W(t)+(\alpha-\frac{1}{2}\sigma^2)t}$$
Dejemos que $0 \leq T_1 < T_2$ sea dado y supongamos que observamos $S(t)$ para $T_1 \leq t \leq T_2$ . Elija alguna partición de este intervalo $T_1 = t_0 < t_1 < \cdots < t_m = T_2$ y observar los rendimientos de los registros $\log\frac{S_{t_{j+1}}}{S_{t_{j}}}$ sobre cada uno de los subintervalos $[t_j, t_{j+1}]$ : $$\log\frac{S_{t_{j+1}}}{S_{t_{j}}} = \sigma (W(t_{j+1}) - W(t_j)) + (\alpha - \frac{1}{2}\sigma^2)(t_{j+1}-t_j)$$
El volatilidad realizada $\sum_{j=0}^m\Big(\log\frac{S_{t_{j+1}}}{S_{t_{j}}}\Big)^2$ es:
$$\sum_{j=0}^m\Big(\log\frac{S_{t_{j+1}}}{S_{t_{j}}}\Big)^2 = \sigma^2 \sum_{j=0}^m \big(W(t_{j+1})-W(t_j)\big)^2 + \big(\alpha - \frac{1}{2}\sigma^2\big)^2 \sum_{j=0}^m (t_{j+1}-t_j)^2 + \\2\sigma(\alpha - \frac{1}{2}\sigma^2)\sum_{j=0}^m (W(t_{j+1})-W(t_j))(t_{j+1}-t_j)$$
Dejemos que $\|\Pi\| = \max_{j=0,1,\cdots m-1}(t_{j+1}-t_j)$ . Entonces: $$ \lim_{\|\Pi\|\to 0} \sum_{j=0}^m (t_{j+1}-t_j)^2 = 0 \\ \lim_{\|\Pi\|\to 0} \sum_{j=0}^m (W(t_{j+1})-W(t_j))(t_{j+1}-t_j) = 0 \\ \lim_{\|\Pi\|\to 0} \sum_{j=0}^m \big(W(t_{j+1})-W(t_j)\big)^2 = T_2-T_1$$ Así:
$$\sigma^2 \approx \frac{1}{T_2-T_1}\sum_{j=0}^m\Big(\log\frac{S_{t_{j+1}}}{S_{t_{j}}}\Big)^2$$
Ahora puedes ver que $\frac{252}{N} = \frac{1}{T_2-T_1} $ y no necesitamos el supuesto de que los rendimientos logarítmicos tienen una expectativa cero. En su lugar, se supone que $S(t)$ sigue un movimiento geométrico browniano con volatilidad constante.
La derivación anterior ha sido robada descaradamente de aquí (3.4.3 Volatilidad del movimiento browniano geométrico)
También puede consultar "La sonrisa de la volatilidad" por E. Derman. En el capítulo 4, "Swaps de varianza", se analiza cómo se pueden reproducir los swaps de varianza