2 votos

Correlación lineal en movimiento (correlación rodante)

Digamos que tengo dos variables aleatorias $X$ y $Y$ que representan cada uno de los rendimientos diarios de dos acciones determinadas. Puedo calcular fácilmente su correlación (total) hallando su matriz de covarianza $\Sigma[X, Y]$ . Sin embargo, me gustaría graficar su correlación a lo largo del tiempo; no sólo en un único punto. Por lo tanto, me gustaría tener un vector de su correlación así: $C = \{ \textrm{corr}_0, \textrm{corr}_1, \cdots, \textrm{corr}_m \}$ . Aquí está mi intento:

Dejemos que $X = \{x_1, x_2, x_3, x_4, \cdots, x_n\}$ y $Y=\{y_1, y_2, y_3, y_4, \cdots, y_n\}$ sean variables aleatorias. Así, definimos su correlación a lo largo del tiempo (como en los comentarios, su nombre es rolling correlation) como

\begin{equation} \textrm{corr}[X, Y | k] := \frac{ \textrm{cov}[X, Y | k]}{\sigma_X \cdot \sigma_Y} := \frac{\displaystyle\sum_i^{i+k-1} (x_i-\bar{x})(y_i-\bar{y})}{(k) \cdot \sigma_X \cdot \sigma_Y}, i = \{1, 2, 3, \cdots n-k+1\} \end{equation}

Equivalentemente, separaría ambos $X$ y $Y$ en $j$ subconjuntos tales que cada uno satisface $|X_j|=|Y_j|=k$ y luego calcular su correlación $\textrm{corr}[X_j, Y_j]$ y finalmente incluirlo en el vector $C$ .

¿Es ésta la mejor manera de encontrar la correlación a lo largo del tiempo? ¿Es incluso correcta?

Gracias

0 votos

No sé si he entendido bien, pero ¿por qué no calcular la correlación en una ventana móvil?

1 votos

¿No debería el denominador contener sólo $K$ en lugar de $i+k$ ?

1 votos

Creo que el término que busca sería rolling correlación

3voto

John Rennie Puntos 6821

Su pregunta está, efectivamente, en el estacionariedad de las correlaciones entre sus dos instrumentos $X$ y $Y$ .

Para aclararlo desde un punto de vista teórico, consideremos su distribución conjunta en 2D $(X,Y)$ :

  • primero tienes que decidir si quieres considerar que tienen autocorrelaciones o si son iid, en definitiva: es $(X,Y)$ ¿un proceso estocástico o un par de variables aleatorias?
  • entonces, ¿supone que el distribución subyacente de $(X,Y)$ es el mismo en cualquier momento (fuerte estacionariedad ) o simplemente que pocas estadísticas (como la volatilidad, la correlación y la media) son iguales en cualquier momento (débil estacionariedad )?
  • Tenga en cuenta que para Gaussianos La estacionariedad débil implica la estacionariedad de la cadena ya que (vol,cor,media) es una estadística suficiente.
  • Por supuesto, se puede suponer que allí no hay estacionariedad de ningún tipo, pero todo sería más complicado.

Para simplificar, supongamos que $(X,Y)$ es una variable aleatoria débilmente estacionaria, entonces la única diferencia entre la correlación empírica calculada en una ventana temporal $[t_1,t_1+w_1]$ y en otro $[t_2,t_2+w_2]$ es el ruido de muestreo . Esto significa que cuando $w_1$ y $w_2$ conjuntamente van hacia el infinito, Gracias a la Teorema del límite central : se obtendrán las mismas correlaciones y la convergencia se producirá en $1/\sqrt{\min(w_1,w_2)}$ (para datos muestreados uniformemente).

Si ahora no crees en la estacionariedad de las correlaciones (nótese que se puede tener la no estacionariedad de las volatilidades marginales, convencerse de que, sin embargo, se ha capturado, por ejemplo, gracias a 2 GARCHs, de manera que las correlaciones son estacionarias ahora), entonces las correlaciones empíricas calculadas en $[t_1,t_1+w_1]$ y $[t_2,t_2+w_2]$ no será lo mismo por dos razones

  1. el ruido de estimación (como en el caso estacionario)
  2. el desplazamiento de las covarianzas (que podría nombrar un cambio de covariable y leer este bonito libro: Aprendizaje automático en entornos no estacionarios de Sugiyama y Kawanabe)

Y te enfrentas a un dilema: cuanto más grande sea la ventana $w_1$ y $w_2$

  • cuanto menos ruido de estimación
  • pero cuanto más se mezclen las estimaciones de diferentes correlaciones subyacentes.

Esto es sutil y no se puede hacer nada realmente sin una investigación empírica:

  1. ¿Cómo es que las series temporales de las correlaciones empíricas ¿cambia con el tiempo?
  2. qué bootstrap puede decirle sobre el ruido de la estimación (tenga cuidado, si está presenciando un proceso estocástico y no variables aleatorias iid, el bootstrapping es sutil, eche un vistazo a Conferencias sobre algunos aspectos de la bota de Evarist Giné).

0 votos

Gracias señor por su respuesta tan detallada. Me gustaría poder entender y sacar más provecho de ella. Intentaré mejorar mis conocimientos de Estadística/Estocástica para entender completamente lo que has dicho. Gracias de nuevo.

0voto

Akash Puntos 8

La columna A es el precio del activo A

La columna B es el precio del activo B

C es el retorno de A

D es el retorno de B

E es CORREL(OFFSET( $D,-t,0,t+1,1),OFFSET($ E,-t,0,t+1,1))

F es algo genial que quiero correlacionar con mi correlación para contar una buena historia

G es CORREL(OFFSET( $E,-t,0,t+1,1),OFFSET($ F,-t,0,t+1,1)), es decir, la correlación de la correlación con algo real.

Pulsa F9.

Donde "t" es un lookback, optimizado visualmente para obtener el gráfico más atractivo. Las únicas restricciones son 1d, 1w, 1m, 3m, 6m, 200d=9m, etc., porque las desviaciones de las demarcaciones clásicas del mercado en el tiempo serían una "señal" obvia de sobreajuste.

Pido disculpas por la falta de notación estadística adecuada. Y, sí, exagero un poco. Pero el proceso anterior prácticamente permitió que mis dos hijos fueran a la escuela privada.

La verdadera respuesta a tu pregunta es (a) que esto es realmente sencillo de hacer, de forma continua en Excel; no se requiere ninguna notación. Y (b) no hay una forma teórica o empírica correcta de definir la muestra que se utiliza para el cálculo evolutivo de su balanceo en el tiempo. A no ser que tengas la suerte de tener alguna teoría económica intuitiva de por qué la rentabilidad debería depender del precio. Pero, en general, esto mismo se considera una herejía contra la eficiencia en el mundo publicado que utiliza la notación en lugar de las fórmulas de Excel más F9 ;-)

Sin embargo, si quieres ponerte muy guapo, puedes hacerlo... Calcule sus correlaciones rodantes. Y luego calcular su autocorrelación de correlación. De la cual puedes derivar una vida media de persistencia de la correlación... Excepto que creo que ambos sabemos que esto es el equivalente estadístico de "golpear F9" ;-)

La respuesta honesta es que 65d (es decir, 65 días de negociación en un trimestre natural), 200d (es decir, 9m, muchas cosas pueden ser de 6 a 12m, por lo que la gente utiliza 9) o 3y tienden a servir como puntos de referencia del mercado para el "corto plazo", "táctico" y "medio plazo" para este tipo de análisis. Son el diablo que los analistas y los clientes conocen aquí.

Espero que esto ayude, DEM

ps la interpretación intuitiva de la evolución de las correlaciones a lo largo del tiempo es un tema totalmente diferente, que me temo que será tratado otro día. Suponiendo que sean, por supuesto, no estacionarias (como la mayoría de los casos en los datos del mercado).

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X