1 votos

Predicción de series temporales basada en otra

Esta es una pregunta más bien genérica, pero seguro que tiene una respuesta/metodología óptima que es a la que quiero llegar. Estoy tratando de averiguar una línea de pensamiento sólida al mirar una serie de tiempo X y ver si puede predecir algunos precios de las acciones. He ido a través de algunos hilos en este sitio.

El planteamiento del problema puede considerarse como sigue: dados los precios de cierre diarios de una acción, digamos AAPL, y una serie temporal de predicción arbitraria $X$ que también se da diariamente al cierre. Es $X$ un buen predictor del movimiento de AAPL y con cuánta antelación predice el precio ?

Esto es lo que he decidido hacer:

  1. Dividir los datos en entrenamiento/prueba.

  2. Para hacer estacionaria la serie temporal, primero se hace diferenciación en ambas series temporales. (es decir, calcular el porcentaje de cambio para cada período)

  3. Computar la correlación de Pearson a través de diferentes rezagos de $X$ , encontrar el valor más alto.

  4. Averigüe si está sobreajustando o no probando ese retardo con el conjunto de datos de prueba.

  5. ???? ¿Cómo puedo utilizar esta información? Digamos que la correlación de Pearson es 0.45 con un valor p de 2e-9 en el conjunto de datos de prueba. ¿Es esto bueno? ¿No es lo suficientemente bueno? ¿Cómo puedo entonces operar con esta información?

He leído en Internet sobre el Prueba de granger-causalidad que parece que podría ayudar en este caso. Pero tampoco estoy seguro de muchas de las suposiciones que estoy haciendo aquí. ¿Es el cambio porcentual la forma de hacerlo? ¿Cuáles son los límites de las correlaciones buenas y malas? Además, hay muy pocos mensajes que pude encontrar en línea que van más allá de este punto. No estoy seguro de cuál es la intuición aquí. Si están correlacionados, y $X$ se encuentra el mayor desfase alrededor de 3 días antes. Entonces, ¿qué hago?

TL;DR -

  • ¿cuál es la mejor manera de comprobar la causalidad/eficacia de una serie determinada de predictores (transformación de datos+pruebas estadísticas)?

  • ¿cómo puedo encontrar el mejor desfase para la prueba?

  • ¿cómo puedo utilizar estos conocimientos?

1voto

conmulligan Puntos 3207

Probablemente, el punto de partida más sencillo sea elegir algunas características y objetivos binarizados y quedarse muy de baja dimensión. Se puede observar la información mutua u otras estimaciones de la distribución para comprobar los vínculos causales.

Creo que la mayoría de los descubrimientos de redes causales son un barrido completo o alguna heurística basada en Lasso en dimensiones superiores.

Prado tiene un montón de heurísticas para la estacionariedad, pero siempre me ha parecido un poco insatisfactorio desde el punto de vista del aprendizaje básico. Me parece que la necesidad de estacionariedad debería surgen de nuestro modelo de incertidumbre y localidad.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X