7 votos

Cómo hacer que la Interpretación final de la PCA?

Tengo duda respecto a final de carga de datos de variables originales.

Así, por ejemplo:

Tengo 10 variable de a,b,c....j utilizar retornos para los últimos 300 días me dieron el retorno de la matriz de 300 X 10. Me han normalizado las devoluciones y calcula la covarianza de la matriz de 10 X 10. Ahora he calculado eigen valores y eigen vectores, por Lo que he vector de 10 X 1 y 10 X 10 correspondiente eigen valores. Screeplot dice que el 5 de componentes explican el 80% de variación con lo que ahora hay 5 vectores propios y los correspondientes autovalores.

Ahora más cómo cargar de regreso a la variable original y cómo puedo concluir que la variable de a,b,c.....j explicar la variación máxima en el momento "t"

6voto

m0j0 Puntos 21

Para hacer las cosas muy claras, tiene una matriz original $X$ de tamaño $300 \times 10$ con todas sus declaraciones.

Ahora lo que tienes que hacer es que elija la primera $k=5$ vectores propios (es decir, suficiente para conseguir que el 80% de la variación dado a sus datos) y se forma un vector $U$ de tamaño $10 \times 5$. Cada una de las columnas de $U$ representa una cartera de activos del conjunto de datos original, y todos ellos son ortogonales.

La PCA es una dimensionalidad método de reducción: se podría utilizar para almacenar sus datos en una matriz $Z$ de tamaño $300 \times 5$ por hacer:

$A$Z = X U$$

Entonces puede recuperar una aproximación de $X$, que podemos llamar $\hat{X}$ como sigue:

$$ \hat{X} = Z U^\intercal $$

Tenga en cuenta que como tu 5 autovectores sólo representan el 80% de la variación de X, usted no tendrá $X=\hat{X}$.

En la práctica para las finanzas de la aplicación, no veo por qué se quiere realizar estas operaciones de reducción.

En términos de análisis de factores, podría sumar el valor absoluto para cada fila de $U$; el vector con la puntuación más alta sería un buen candidato, creo.

2voto

akmad Puntos 7059

Si se preguntan cual de las 10 variables que más está contribuyendo a la componente del principio, y luego mirar a su primer vector propio; cada valor refleja una sola variable, por lo que el valor más grande (por su magnitud) en que autovector debe dar a la variable con el mayor contribución. Tenga en cuenta que un gran número negativo significa que anticorrelation.

La matriz que tiene es de hecho la asignación de la 10d espacio de las variables en el espacio propio de la matriz; el primer autovector representa uno de los vectores de la base de este nuevo espacio propio, en el espacio de su 10d vectores.

La analogía es que si tuviera 2 variables, x y y, entonces usted podría construir una similar de matriz 2d, y calcular sus vectores propios. Los vectores propios muestre los ejes del nuevo espacio, y el primer autovector es su principal componente (eje).

Advertencia: yo sé mucho más acerca de los vectores propios de lo que yo sé acerca de la PCA, por lo que hay una sutileza que me falta.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X