Supongamos que tengo dos series temporales de activos, $X_t$ y $Y_t$ y estoy estimando su correlación a partir de datos históricos. Me gustaría aplicar algún criterio sistemático para estimar qué ventana temporal debo utilizar para estimar la correlación de forma fiable, y también para detectar "cambios de régimen" (cuando la correlación salta repentinamente) después de los cuales debería descartar completamente los datos antiguos (en lugar de hacer rodar la ventana de forma continua). ¿Puede recomendar algunos enfoques que tengan una base teórica decente?
Respuestas
¿Demasiados anuncios?Puede utilizar el análisis de puntos de cambio para identificar el cambio de régimen.
También puede observar las diferencias de ángulos grandes en los vectores propios entre su matriz de covarianza más reciente y la matriz de covarianza de la ventana anterior.
Otra forma de identificar el cambio de régimen es utilizando un modelo de factores. Si los rendimientos de un determinado conjunto de factores se alejan X desviaciones estándar de su terreno habitual durante un periodo sostenido, se puede denominar cambio de régimen.
No creo que se encuentre una única ventana de tiempo que sea la mejor. La duración del régimen es variable. La clave aquí es identificar un procedimiento de estimación para una matriz de covarianza que produzca previsiones razonables fuera del tiempo. Tendrá que hacer algunas pruebas empíricas, o desarrollar una regla para reestimar su modelo basado en la forma de identificar los regímenes, o utilizar Garch (u otro modelo dinámico) como sugiere Patrick.
Nota técnica: probablemente no quiera descartar por completo los datos antiguos, sino ponderar los datos más recientes con una ponderación exponencial, o reescalar la matriz de covarianza para reflejar la volatilidad actual. Los vectores propios de la matriz de correlación (después del primer vector propio, que es el factor de mercado) corresponderán a grupos de sectores e industrias. Estas correlaciones persistirán. Cuando el mercado pasa de ser alcista a bajista (llamémosle a esto una aproximación de 1er orden de régimen - a diferencia de los cambios de estilo e industria) lo que ocurre es que la varianza explicada por el mayor eigenvector ha aumentado sustancialmente.
Yo sugeriría un modelo garch multivariante como posibilidad. No es que estemos plagados de programas informáticos maravillosos para ello, pero con sólo datos bivariados, creo que las estimaciones de correlación dentro de la muestra serían razonablemente robustas a lo largo de los modelos y la estimación.
Sería bueno probar dos o tres formas de hacerlo para asegurarme de que estoy en lo cierto.
Es posible que la ruta garch sea lo suficientemente buena como para utilizarla como solución si no tiene una previsión muy lejana.
Un enfoque sería el de las correlaciones condicionales dinámicas de Engle (2002).
Tomando su $Y_t$ y $X_t$ haré la suposición simplificadora de que la ecuación media de estos es:
$$\boxed{Y_t = \mu_y + \varepsilon_{y,t}}$$
$$\boxed{X_t = \mu_x + \varepsilon_{x,t}}$$
con $\varepsilon_{y,t} = z_{y,t} \sigma_{y,t} \sim N(0,\sigma_{y,t})$ , $\varepsilon_{x,t} = z_{x,t} \sigma_{x,t} \sim N(0,\sigma_{x,t})$ .
En la práctica, es posible que desee especificar un GARCH-M, o un GARCH con variables exógenas dentro de la ecuación de la media. Por ejemplo, si $Y_t$ y $X_t$ son acciones individuales en el mismo mercado, podría incluir $R_{M,t}$ para no detectar ninguna correlación debido a este factor compartido. Si se está buscando a través de las fronteras, los términos GARCH-M pueden ser importantes si se quiere controlar el reequilibrio de la cartera debido a los cambios en los riesgos relativos o algo así. Las ecuaciones de la media pueden escribirse en forma vectorial como:
$$\boxed{ Z_t = \mathbf{\mu} + \mathbf{\varepsilon}_t}$$
con $Z_t := [Y_t,X_t]'$ , $\mathbf{\varepsilon} \sim N(0,H_t)$ , $H_t := D_t R_t D_t$ . Aquí, $R_t$ es la matriz de correlación (posiblemente) variable en el tiempo y $D_t$ es simplemente $\text{diag}(\sigma_{y,t},\sigma_{x,t})$ cuando suponemos que no hay noticias ni desbordamientos de la varianza en la ecuación de la varianza.
El estimador DCC en el rmgarch
le proporcionará la dinámica de $R_t$ sin ningún esfuerzo por tu parte. A continuación, puede inspeccionar visualmente para ver si hay una ruptura en la correlación.
Sin embargo, para un enfoque objetivo dentro del marco del DCC, eche un vistazo a este documento para la capacidad de probar la hipótesis de las rupturas estructurales en la correlación.