No sé cuál es la fórmula correcta para calcular la varianza mensual realizada a partir de datos diarios. ¿Cuál es la primera sigma de la imagen: suma o media? Es decir, después de restar cada observación de la media mensual y elevar al cuadrado cada diferencia, ¿debo tomar la suma de cada mes o la media?
Respuesta
¿Demasiados anuncios?Deberías aceptar la suma:
La definición no estándar de varianza realizada en el documento de Moreira, A., & Muir, T. (2017) es un intento de evitar una cantidad excesiva de notación matemática "de relleno" que de otro modo se encontraría en la literatura econométrica estándar de alta frecuencia. En esencia, todo el documento carece de notación matemática y sólo trata de definir modelos/métodos estadísticos cuando es absolutamente necesario.
Reformulación:
Sea $X_t$ sea el proceso log-precio, $t \geq 0$ denotan el $t$ en su conjunto de datos y defina $n$ como los "periodos intramensuales" ( los autores suponen $n=22$ días de cada mes ). Podemos entonces definir una secuencia de particiones entre cada mes $t-1=t_0 < t_1 < \cdots < t_n = t$ tal que $\sup_i t_i - t_{i-1} \rightarrow 0$ para $n \rightarrow \infty$ . Esto sólo implica que, como $n$ aumenta la distancia entre cada punto temporal intramensual converge a 0.
Además, en el supuesto de que los periodos intramensuales sean equidistantes en el tiempo, $t_i = \frac{i}{n}$ para $i=1,\ldots,n$ podemos redefinir la varianza realizada entre $t-1$ y $t$ como sigue: $\;^{1}$
\begin{align*} RV_t &= \sum_{i=1}^n \left( \left(X_{\frac{i}{n}} - X_{\frac{(i-1)}{n}}\right)- \frac{1}{n} \sum_{i=1}^n \left(X_{\frac{i}{n}} - X_{\frac{(i-1)}{n}}\right) \right)^2\\ &= \sum_{i=1}^n \left( R_{i,t}- \frac{1}{n} \sum_{i=1}^n R_{i,t} \right)^2\\ &= \sum_{i=1}^n \left( R_{i,t}- \bar{R}_{t} \right)^2\\ &\overset{\star}{=} \sum_{i=1}^n R_{i,t}^2 \end{align*}
donde $\bar{R}_{t} = \frac{1}{n} \sum_{i=1}^n R_{i,t}$ . La segunda igualdad es análoga a la definición de VR en el documento antes mencionado y la última igualdad es estándar para los documentos econométricos de alta frecuencia que tratan de intradía frecuencias de muestreo.
Conclusión: tras restar la media mensual ( $\bar{R}_t$ ) de los periodos intramensuales ( $R_{i,t}$ ) y luego elevar al cuadrado la diferencia, hay que sumar las diferencias al cuadrado.
1 El intervalo de tiempo entre cada periodo intramensual es entonces, $\Delta_i = t_i - t_{i-1} = \frac{i}{n} - \frac{i-1}{n}=\frac{1}{n} = \frac{1}{22}$ que es donde el $\frac{1}{22}$ de la suma procede.
$\star$ Muy a menudo, los documentos econométricos de alta frecuencia tratan de intradía periodos de diferentes tamaños. Entre cada día, el efecto de la media estimada ( $\bar{R}_t$ ) sobre la varianza/volatilidad realizada, es muy pequeño y a menudo insignificante. Por lo tanto, es seguro ignorar ( Voir esta respuesta para más detalles ). Sin embargo, esto no puede decirse de los periodos intramensuales.