1 votos

Trabajar con series temporales con diferentes resoluciones

Estoy buscando hacer predicciones de los precios de cierre (acciones/mercancías), y tengo acceso a varias fuentes de datos para ayudar a predecir.

Sin embargo, la mayoría de estas fuentes están en un marco temporal diferente, normalmente semanal o mensual, en contraposición a los precios de cierre diario.

Como ejemplo: digamos que quiere predecir el precio de cierre del petróleo basándose en el recuento semanal de plataformas petrolíferas.

Le agradecería que me diera su opinión sobre cómo enfocar esta cuestión: 1. A nivel teórico: ¿qué hacer y por qué? ¿Tiene sentido hacer una predicción diaria basada en una entrada semanal, o debería ser una predicción semanal (es decir, el viernes de cierre)? 2. 2. A nivel práctico: ¿cómo se puede implementar más fácilmente en Python?

Gracias de antemano.

1voto

denbjornen505 Puntos 53

1) A nivel teórico deberías empezar a formarte alguna hipótesis sobre cómo esperas que se muevan los precios en función de los datos que tienes. A continuación, busque formas de comprobar su hipótesis. Yo lo hago observando las distribuciones del movimiento de los precios, la estacionalidad y los distintos indicadores. Busque algún dato que apoye su filosofía de predicción e intente ampliarla. ¿Tiene sentido predecir a diario basándose en datos semanales? Creo que depende. Probablemente volvería a mi primera afirmación en el sentido de que deberías jugar con tus datos y buscar indicadores/teorizar sobre el mercado. Luego decidir si tiene sentido o no.

2) En Python (mi lenguaje preferido), probablemente puedas empezar con el Pandas biblioteca. Pandas facilita enormemente el tratamiento de los datos de las series temporales, la indexación por fecha, la columna y la lectura/escritura en archivos de disco. Es posible que desee implementar algunas funciones de procesamiento de señales de SciPy ¡! Me gusta usar argrelextrema entre otros, para determinar los puntos de cambio de impulso. Si te gusta el aprendizaje automático, utiliza Scikit-learn . Está considerada como una de las bibliotecas de aprendizaje automático más potentes que existen.

1voto

Corey Goldberg Puntos 15625

Es importante entender la secuencia de eventos, es decir, cómo se revela la información.

Por ejemplo, el recuento de equipos de perforación de Baker Hughes se publica a las 13:00 horas del este, normalmente un viernes. (Pero algunos no son un viernes, le recomiendo que utilice las fechas reales).

Los datos de Bloomberg para el cierre de los futuros del crudo NYMEX son el precio del crudo a las 1430 hora del Este.

La previsión más sencilla, o de "información cero", para el precio de cierre del viernes del crudo es simplemente el precio de cierre del jueves. El error de esta previsión es igual a $\sigma(P_{Fri}-P_{Th})$ que puede estimarse empíricamente.

El siguiente paso es construir un modelo de previsión algo más sofisticado que tenga en cuenta la liberación del recuento de equipos de perforación. Este modelo podría ser del tipo $P_{Fri}=P_{Th}+\alpha+\beta *RIG\_INFO_{Fri}$ donde alfa y beta se estiman por regresión lineal. En teoría, RIG_INFO debería ser la diferencia entre los datos del recuento de plataformas y la expectativa del mercado sobre el recuento de plataformas justo antes del anuncio. Si no se dispone del valor esperado, se podría utilizar la diferencia entre el recuento de plataformas anunciado y el recuento de plataformas de la semana anterior como aproximación a la "sorpresa".

En cualquier caso, una vez que se haya estimado este modelo, se podrá comprobar si es mucho mejor que el modelo ingenuo. (En mi experiencia, una sola variable explicativa, como el recuento de equipos, sólo reducirá el error en una cantidad relativamente pequeña. Esta reducción, en teoría, mide la contribución del anuncio al precio del crudo).

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X