Me gustaría modelo por ejemplo, un índice FTSE 100. Tengo una lista de todas las empresas que componen el índice y sus valores de stock (todos los días de alta, baja, volumen, cerca de los valores). En total, esta vez de la serie de datos tiene más de 400 características.
Me gustaría construir una red neuronal similar a esta, pero primero me encontré con una correlación de Pearson y se encontró que existe una alta correlación entre las poblaciones.
Quiero predecir el valor del índice FTSE 100.
Primero de todo, yo escala de los datos y, a continuación, aplicar PCA para eliminar las correlaciones y se encontró que el 0 de los componentes de la cuenta para el 99% de la variabilidad. Ahora mis columnas en el siguiente aspecto:
Date FTSEOpen FTSEClose Stock1Open Stock1Close Stock2Open Stock2Close
01/01/2006 2880 2890 144 130 300 333
...
08/01/2018 3862 3851 204 311 134 154
Hice PCA en todas las columnas, y obtuvo el siguiente resultado (que no tiene sentido!)
Actualmente estoy pensando en añadir características adicionales, tales como la estancia 5day gradientes, etc. la mezcla de cosas.
También, no estoy seguro de lo Y_TEST es. Entiendo que esto es en los días siguientes datos, pero todavía estoy tratando de entender lo que la red de entrada. Si yo uso todos los datos anteriores, la entrada de dimensiones va en aumento cada día.
Digamos que yo calculada de la PCA, ahora tengo solo 1 vector...(1 columna de fecha y el 1 de PCA vector), esto ahora se ve como muy pocos datos para predecir los precios de las acciones.