Digamos que tengo un último componente y su puntuación de derivados de n número de la rentabilidad de las acciones (datos de series de tiempo). Quiero construir un índice del mercado de valores el uso de este componente (tener valores positivos y negativos). No es un buen enfoque para esto? También, yo quiero que este índice tiene un valor inicial de 1.000. Gracias.
Respuesta
¿Demasiados anuncios?Yo era capaz de volver a crear un ejemplo sencillo de creación de un índice de hecho la rentabilidad de las acciones usando el R tidyverse
. Comprobar y ver lo que usted piensa.
options(tidyverse.quiet = TRUE)
library(tidyverse)
library(broom)
set.seed(42)
stocks <- tibble(
time = as.Date('2009-01-01') + 0:99,
X = rnorm(100, 0, 1),
Y = rnorm(100, 0, 2),
Z = rnorm(100, 0, 4))
Esto fue lo que el falso devuelve parece.
stocks %>%
gather(stock, return, -time) %>%
ggplot(aes(time, return)) +
geom_line(aes(group = stock, color = stock))
stocks %>%
gather(stock, return, -time) %>%
group_by(time) %>%
summarise(avg_ret = mean(return)) -> avg_return
avg_return %>%
ggplot(aes(time, avg_ret)) +
geom_line()
Y este es el promedio del retorno parece.
Ahora, esta es la forma en que uno puede crear un índice de la PCA, el tratamiento de cada una de las acciones como una variable diferente.
stocks %>%
select(-time) %>%
as.matrix() %>%
prcomp(.) -> pca
pca_index <-
augment(pca, data = stocks) %>%
mutate(
time,
base_1000_index = (.fittedPC1*1000)/first(.fittedPC1))
pca_index %>%
as.tibble() %>%
ggplot(data = ., aes(x = time, y = base_1000_index )) +
geom_line()
Y esta sería la base de 1000 índice. Puedes ver cómo la construyó a partir de la segunda línea de la mutar bloque.
Ahora, para interpretar este tipo de índice es un poco difícil. La idea clásica de un componente principal para cambiar los datos, tales como reducir la variabilidad de la misma, por sólo tener las direcciones de mayor varianza.
El uso de la primera componente de la proyección de cada punto de datos, significa que usted es la captura de la mayoría de la variabilidad de las poblaciones. Realmente no puedo envolver mi cabeza alrededor de lo que podría significar en la forma de un índice.