4 votos

¿Cómo ver si un conjunto de rendimientos de activos corresponde a una matriz de correlación conocida?

Digamos que tengo un conjunto arbitrario de $n$ retornos del período para $k$ activos, y un determinado $k \times k$ matriz de correlación (de los rendimientos de los activos), que se conoce a priori.

¿Tiene sentido, o es incluso posible, pensar en construir algún tipo de medida de si el conjunto de $n$ es coherente con la matriz de correlación conocida (o si sugieren algún tipo de conjunto de valores atípicos)?

¿Podemos clasificar un conjunto de $n \times k$ que se ajusta mejor a la matriz de correlación dada que otro conjunto?

¿Tiene más sentido preguntarse esto si se supone que cada activo tiene la misma desviación estándar de los rendimientos?

2voto

Brian McCarthy Puntos 354

Véase "Some hypothesis tests for the covariance matrix when the dimension is large compared to the sample size" de Ledoit y Wolf.

http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.aos/1031689018

0voto

Nir Puntos 18250

En primer lugar, la creación de una matriz de covar a partir de un conjunto de series de longitudes desiguales no es trivial y varios enfoques (por ejemplo: modelos de un factor o de dos factores) darán lugar a diferentes matrices de covar. Veo que has dicho que todas las clases de activos tienen la misma longitud (n períodos), lo que significa que lo anterior no se aplicará, pero pensé que todavía diría esto porque a menos que elijas n Al trabajar con muchos activos, lo más probable es que se encuentre con activos con series temporales desiguales (por ejemplo, alguna empresa creada recientemente). La cuestión es que debe ser coherente con su técnica de cálculo de covar, especialmente si el covar procede de diferentes fuentes.

Otra advertencia sobre el ajuste de los rendimientos a las matrices de covar; yo no lo aconsejaría, ya que se pueden obtener resultados incoherentes si se utilizan los rendimientos observados con una matriz de covar "dada" para la construcción de la cartera. Los rendimientos son "hechos" observados y la matriz de covar incorpora las relaciones, así que para evitar resultados inconsistentes de la cartera es mejor calcular el covar a partir de la información de los resultados brutos (y hacerlo siempre con la misma técnica)

Una vez aclarado esto, vamos a explorar las medidas de "grado de coincidencia". Definamos:

  • C = matriz covar calculada (a partir de su serie de retorno) y
  • C' = matriz covar dada que obtuviste de 'algún lugar' y que estás tratando de ver si "encaja".

Diferentes medidas:

  1. Análisis de componentes principales. Básicamente, determine los vectores propios y los valores propios de la matriz COVAR (habrá N de cada uno para una matriz covar NxN). Los valores propios más grandes le indican los vectores propios (o componentes principales) que capturan las "características" más fuertes de la matriz COVAR. Introducción a los vectores/valores propios . A continuación, los comparas en C vs C' para ver si las características han cambiado. Si han cambiado, es probable que los rendimientos NO se correspondan con su matriz 'COVAR dada'. Detalles de la comparación para C y C':

    • Encontrar el mayor valor propio de C => elegir el correspondiente vector propio
    • Encontrar el mayor valor propio de C' => elegir el correspondiente vector propio
    • $\theta$ es el ángulo entre esos dos vectores.
    • Valor absoluto de $\theta$ menos de 2-4 grados => C y C' son similares ("2-4" depende de la volatilidad de los activos y del periodo de tiempo).
    • Si "no hay cambios", los rendimientos representan probablemente el CoVAR "dado" (y viceversa)
    • Puede reforzar las comprobaciones haciendo lo anterior no sólo para los componentes más grandes, sino también para los más pequeños (componentes de orden superior), comprobando después el segundo más grande, el tercero y así sucesivamente. Si se itera sobre todos los N vectores propios, entonces se han comprobado todas las N dimensiones, yendo progresivamente de la dimensión más fuerte (en la iteración #1) a la dimensión más débil (en la iteración N).
  2. |C - C'| es una opción decente. Aunque es simple, no tiene un significado físico directo porque anota demasiadas covares individuales; esencialmente estás colapsando N dimensiones en una sola cantidad escalar sin priorizar las "características fuertes" (como arriba)

  3. Otra heurística decente serían los signos y las magnitudes de los elementos dentro de la matriz C-C', es decir

    • mejor = tener C-C' como cero, es decir, covares idénticos (¡duh! :) )
    • ok-a-bueno = todo Los elementos de C-C' son ligeramente positivos (incl. 0) o todos ligeramente negativos (incl. 0). El signo real (+/-) no es importante en comparación con el consistencia de los signos.
    • malo-peor = grandes valores absolutos con 1/2 positivos y 1/2 negativos

Obsérvese que C-C' es un relativa por lo que tendrá que definir sus propios límites mínimo-máximo y luego sus propios intervalos para "casi sin cambios". Lo más fácil es mirar los mínimos y máximos históricos y ajustarlos para la proyección a futuro (y como toda proyección a futuro en las finanzas cuantitativas, es arte+ciencia). Para la ausencia de cambios, mira los momentos recientes en los que recuerdas que las cosas estaban bien en tu cartera y utiliza esos valores.

0voto

Vipul Naik Puntos 3037

Una posibilidad sería utilizar una comparación entre conjuntos basada en la similitud. Hay medidas geométricas simples basadas en la distancia que funcionan bien (la distancia euclidiana es común).

He visto artículos en los que los autores simplemente realizan un histograma de todas las correlaciones y lo comparan con histogramas fuera de la muestra para determinar si la media de las correlaciones es estadísticamente diferente o no (pueden utilizar la prueba t o el ANOVA, por ejemplo).

He estado intentando trabajar en la generación de datos sintéticos fiables de múltiples activos (no es tan fácil), para poder realizar muchos de estos experimentos de comparación con algún tipo de intervalos de confianza.

Creo que lo que importa en última instancia son las medidas de comparación entre diferentes muestras y la estabilidad temporal local.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X