2 votos

Uso de PCA para predecir los Precios de las Acciones

Me gustaría modelo por ejemplo, un índice FTSE 100. Tengo una lista de todas las empresas que componen el índice y sus valores de stock (todos los días de alta, baja, volumen, cerca de los valores). En total, esta vez de la serie de datos tiene más de 400 características.

Me gustaría construir una red neuronal similar a esta, pero primero me encontré con una correlación de Pearson y se encontró que existe una alta correlación entre las poblaciones.

Quiero predecir el valor del índice FTSE 100.

Primero de todo, yo escala de los datos y, a continuación, aplicar PCA para eliminar las correlaciones y se encontró que el 0 de los componentes de la cuenta para el 99% de la variabilidad. Ahora mis columnas en el siguiente aspecto:

Date         FTSEOpen FTSEClose Stock1Open Stock1Close Stock2Open Stock2Close
01/01/2006   2880     2890      144        130         300        333
...
08/01/2018   3862     3851      204        311         134        154

Hice PCA en todas las columnas, y obtuvo el siguiente resultado (que no tiene sentido!)

enter image description here

Actualmente estoy pensando en añadir características adicionales, tales como la estancia 5day gradientes, etc. la mezcla de cosas.

También, no estoy seguro de lo Y_TEST es. Entiendo que esto es en los días siguientes datos, pero todavía estoy tratando de entender lo que la red de entrada. Si yo uso todos los datos anteriores, la entrada de dimensiones va en aumento cada día.

Digamos que yo calculada de la PCA, ahora tengo solo 1 vector...(1 columna de fecha y el 1 de PCA vector), esto ahora se ve como muy pocos datos para predecir los precios de las acciones.

2voto

Timothy Carter Puntos 7079

Sin saber todo acerca de su procedimiento, su gráfica es más probable % acumulado de varianza explicada en contra de cada uno de los componentes principales, ordenados a partir de la más grande. Ver este post SE por similar argumento.

Es convencional para referirse a su objetivo de vectores como $\bf{y}$, por lo que uno sólo puede adivinar que Y_TEST se refiere a cualquiera de las etiquetas en el conjunto de pruebas (de la muestra) o sus predicciones sobre el conjunto de prueba.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X