La respuesta a su pregunta es la siguiente :
-
¿Cómo se puede utilizar la volatilidad realizada como modelo de volatilidad para hacer una predicción fuera de la muestra? Ha ampliado los modelos conocidos para incorporar información adicional obtenida de los datos de alta frecuencia. Pasar del modelo GARCH vainilla a un modelo GARCH realizado puede hacerse añadiendo un modelo auxiliar como regresor externo que capture la variación intradiaria. El modelo GARCH realizado puede predecir $h$ -periodos por delante, con $h$ siendo días.
-
¿Cómo es la VR un modelo y cómo puedo hacer una predicción fuera de la muestra utilizando la VR? RV es no un modelo, sino una medida no paramétrica de la variación intradía. Las estimaciones obtenidas de las medidas realizadas no tienen basado en el modelo relación entre días (por ejemplo, carecen de un modelo auxiliar, como una representación ARMA, que los vincule entre días), por lo que no puede ser utilizado para $h$ -Previsiones con un periodo de antelación. Por eso se incorpora a un modelo: para crear una relación entre días que intente satisfacer las características empíricas de las rentabilidades y los rendimientos intradía (a grandes rasgos).
Una introducción: De GARCH a GARCH realizado
Muchos de mis argumentos a continuación, se pueden encontrar en el documento de Hansen et al. (2012) junto con Peter Reinhard Hansens diapositivas sobre el mismo tema. Consideremos brevemente el modelo GARCH vainilla. Definimos el desmedida vuelve en el formulario:
\begin{equation} r_t = \sigma_t z_t, \qquad z_t \overset{iid}{\sim}N(0,1) \end{equation}
siendo la ecuación GARCH:
\begin{equation} \sigma^2_t = \omega + \alpha r_{t-1}^2 + \beta \sigma_{t-1}^2. \end{equation} Ahora, podemos hacernos la pregunta:
- ¿Por qué no podemos utilizar un modelo GARCH ordinario con volatilidad intradía? Podemos, ¡y funciona muy bien! El modelo GARCH original utiliza rendimientos cuadrados ruidosos para extraer información sobre el nivel actual de la varianza condicional. Sin embargo, los rendimientos ruidosos al cuadrado no son adecuados en períodos de cambios drásticos y persistentes en la varianza, lo que implica que la actualización del modelo GARCH es simplemente demasiado lenta para "ponerse al día" con el nuevo nivel de volatilidad. Esto condujo a los modelos GARCH-X, que amplían el modelo GARCH original añadiendo una medida realizada como regresor externo :
\begin{equation} \sigma^2_t = \omega + \alpha r_{t-1}^2 + \beta \sigma_{t-1}^2 + \gamma x_{t-1}, \end{equation}
donde $x_t$ es una medida realizada de la volatilidad, por ejemplo, la varianza realizada (RV), el núcleo realizado, etc. En el diapositivas ( p. 37 ) hacen un pequeño experimento y observan cuántos días tarda el modelo GARCH vainilla en actualizarse a un nuevo nivel de volatilidad, a diferencia del modelo GARCH-X:
Según lo observado anteriormente, está claro que el modelo GARCH-X es mucho más rápido a la hora de actualizarse al nuevo cambio de volatilidad.
NOTA: Utilizamos tanto la información de alta como la de baja frecuencia añadiendo un regresor externo en lugar de reemplazar los retornos cuadrados ruidosos, $r_{t-1}^2$ con $RV_{t-1}$ y añadiendo no regresor externo. La información adicional en el primer enfoque da mejores estimaciones (también tenemos un grado más de libertad) .
Aunque la especificación GARCH-X mejoraba el tiempo que tardaba el modelo en actualizarse al nuevo nivel de volatilidad, no permitía realizar previsiones multiperiodísticas al carecer de un modelo auxiliar sobre la medida realizada. En este caso Hansen et al. (2012) entra.
Completando el modelo GARCH-X: El modelo GARCH realizado
En Hansen et al. (2012) amplían el modelo GARCH-X para incorporar la variación de la rentabilidad intradía, añadiendo una ecuación de medición como regresor externo para relacionar la medida realizada estimada (p. ej. $RV$ ) al proceso de volatilidad latente y, además, incluyen una función que capta la reacción asimétrica a las perturbaciones (al igual que la estructura de tipo EGARCH), lo que hace que la representación sea muy flexible y rica. Ofrecen dos especificaciones denominadas modelo GARCH lineal realizado y la versión loglineal (LRG). Me centraré en la especificación lineal. A partir del modelo GARCH-X amplían el $x_t$ mediante la ecuación de medición dada por :
\begin{equation} x_t = \varepsilon + \varphi \sigma_t^2 + \tau(z_t) + u_t, \end{equation}
donde $u_t \overset{iid}{\sim}D(0,\sigma^2_u)$ para $D(\cdot)$ siendo una distribución genérica (normalmente gaussiana) y además $z_t$ y $u_t$ son independientes. En su artículo escriben algunas características importantes de la ecuación de medición,
La inclusión de la medida realizada en el modelo y el hecho de que $x_t$ tiene una representación de media móvil autorregresiva (ARMA) lo que motiva el nombre de GARCH realizado. Una especificación simple pero potente de la función de apalancamiento es $\tau(z) = \tau_1 z + \tau_2 (z^2-1)$ lo que puede generar una respuesta asimétrica de la volatilidad a las perturbaciones de la rentabilidad.
Como usted señaló anteriormente, se puede utilizar una representación ARMA para explicar la varianza realizada, sin embargo, aquí se combina una representación ARMA, con una ecuación GARCH. Además, como se ha visto anteriormente, definen una especificación sencilla y a la vez potente de la función de apalancamiento basada en los polinomios de Hermite (truncados en el segundo nivel). La función es conveniente ya que garantiza $\mathbb{E}\left[\tau(z)\right]=0$ siempre que $z$ se especifica con media cero y varianza unitaria. Basándonos en la pura intuición, vemos que ceteris paribus, cuando $\tau_1 < 0$ , $x_t$ será mayor para un choque negativo (medido por grandes residuos negativos $z_t < 0$ ), ya que $\tau(z)>0$ . Para $\gamma>0$ Esto, a su vez, provocará un efecto pronunciado en $\sigma^2_t$ . Su documento contiene muchas discusiones adicionales sobre el modelo GARCH realizado, sin embargo, he resumido brevemente sus conclusiones a continuación.
Conclusiones de su trabajo:
-
El modelo GARCH realizado es parsimonioso, tiene un análisis manejable (puede estimarse mediante QMLE) y permite realizar previsiones multiperiodo.
-
A partir de su análisis empírico, encuentran pruebas de que el modelo LRG(1,2) proporciona los resultados más consistentes y supera a todos los demás modelos de referencia. Además, se inclinan por el modelo LRG porque proporciona menos heteroscedasticidad en la ecuación de medición, lo que hace que el QMLE sea más eficiente que la especificación lineal (véase la sección 5.5 del documento).
-
Sostienen que el modelo GARCH realizado es flexible ya que puede incorporar diferentes medidas realizadas.
Menciones de honor: Realized EGARCH, HEAVY y HAR
Sin entrar en detalles, hablaré brevemente de otros modelos realizados que puede investigar usted mismo:
-
Los mismos autores construyen un modelo EGARCH realizado y es una especificación ampliada del modelo GARCH realizado anterior. Se puede encontrar en este documento, Hansen et al. (2014) .
-
Sheppard & Shephard (2009) construye los modelos HEAVY que utilizan medidas realizadas como base para la previsión anticipada de la volatilidad en varios periodos, teniendo dos (o más) procesos de volatilidad latente (uno para $\sigma^2_t$ y otro para $x_t$ ) y vinculándolos de forma diferente a la especificación GARCH realizada.
-
Corsi (2009) crea un Modelo autorregresivo heterogéneo (HAR) que construye una relación lineal de forma reducida entre 3 componentes de volatilidad que son diarios, semanales y mensuales. El modelo es extremadamente parsimonioso y tiene una buena capacidad de previsión. Esta es también la razón de su creciente popularidad. Además, se ha ampliado para tener en cuenta diferentes aspectos inherentes a los datos de alta frecuencia. Matemáticamente, el modelo se basa en la premisa de que el proceso de generación de datos subyacente sigue una difusión pura, lo que implica que el modelo estimará la covariación cuadrática en presencia de saltos. Muchos autores han ampliado el modelo univariante siguiendo la misma configuración simplificada, como el modelo HARQ y HARQF de Bollerslev, Patton, & Quaedvlieg, (2016) y el modelo SHAR de Patton & Sheppard, (2015) . He dado una breve explicación del modelo SHAR aquí , que también le ofrece una introducción a la estructura de un modelo de tipo HAR .
FYI: Vinculación de las medidas realizadas con los modelos realizados
A continuación, he proporcionado un significado claro y conciso de los diferentes términos y cómo se relacionan entre sí:
-
Una medida realizada (por ejemplo, la varianza realizada): estimaciones de volatilidad cada día y no tienen basado en el modelo relación entre dos días distintos (por ejemplo, un modelo auxiliar como una representación ARMA). Se puede encontrar un documento muy bueno que ofrece una visión general de las diferentes medidas realizadas aquí .
-
HAR con medidas realizadas: Proporciona un vínculo entre diferentes días y puede hacer previsiones multiperíodo. Aun así, solo utiliza volatilidades realizadas (medidas realizadas).
-
GARCH realizado: utiliza tanto los rendimientos diarios como las volatilidades realizadas (halladas a partir de medidas realizadas) para modelar la volatilidad, $\sigma_t^2$ y proporcionar un vínculo entre los diferentes días.
Muchas de las medidas y modelos realizados se aplican en R
, ya sea a través de la rugarch
o el paquete highfrequency
paquete . Espero que esto le proporcione alguna información. Le deseo buena suerte con su tesis.