4 votos

¿Cómo seleccionar eficazmente los parámetros de las órdenes en la modelización de series temporales?

Una forma habitual de seleccionar los parámetros de las órdenes (por ejemplo, para elegir el número de términos AR que se incluirán en el modelo) en la modelización de series temporales es basarse en algún criterio de información (AIC, BIC, Hannan Quinn ) para medir la calidad relativa del modelo: llamémoslo regla A.

A continuación, en un segundo momento, se realizan pruebas de robustez ( prueba de la caja de Ljung , prueba de Engle ..).

Sin embargo, la metodología no me queda clara cuando tengo que elegir un modelo para una serie que tiene autocorrelaciones tanto en la media como en la varianza:

He observado que el modelo seleccionado (mediante la regla A) no es siempre el mismo si :

  1. Utilizo un "método de dos pasos": En primer lugar, selecciono los parámetros de las órdenes del proceso medio utilizando la regla A. En segundo lugar, manteniendo los parámetros obtenidos en el primer paso, utilizo de nuevo la regla A para seleccionar los parámetros del proceso de varianza.

Ejemplo : Ajusto todos los ARMA(p,q) a la serie con (p,q)=0:2 y selecciono el más parsimonioso. Digamos que el mejor modelo es p= 1 y q= 2 . Segundo paso : si se ajustan todos los ARMA( 1,2 )-GARCH(s,t) a la serie con (s,t)=0:2 y selecciono los "mejores" parámetros s,t utilizando de nuevo la regla A. Si dejamos que p:q estén en el intervalo 0:4 y s,t en el intervalo 0:2 son $5^2 + 3^2$ modelos que deben estimarse .

  1. O un modelado de "vía directa": Ajusto directamente el ARMA(p,q)-GARCH (s,t) completo a la serie temporal y selecciono el mejor modelo (p,q,s,t) utilizando de nuevo la regla A. Sin embargo, en este caso el número de combinaciones (número de modelos que hay que ajustar) puede ser muy elevado: si dejamos que p:q esté en el intervalo 0:4 y s,t en el intervalo 0:2 son $5^2 \times 3^2$ modelos candidat (lleva tiempo y CPU..) .

Obviamente, el segundo método evaluará el modelo seleccionado por el método de los dos pasos y mayo ofrece los resultados más significativos. He dicho "puede" porque es posible que el modelo seleccionado por el método directo no supere la parte de error de especificación

Mi pregunta es: ¿Cómo puedo resolver este problema de coste/eficacia? ¿Cómo debo proceder?

3voto

user6189 Puntos 26

Intentaré dar una técnica sencilla para Identificar $ARIMA(p,d,q)$ para una serie temporal. Es una técnica empírica, pero los resultados se acercan mucho a las técnicas basadas en $AIC$ o $BIC$ criterios.

-Identificación de la orden de integración $d$ :

Es el primer parámetro a determinar, de hecho los modelos ARMA se basan en el supuesto de que tu serie temporal $\{x_t\}$ es estacionaria. Por lo tanto, debe comenzar por probar la estacionariedad de $x_t$ utilizando la prueba de Dickey-Fuller, por ejemplo (hay muchas otras pruebas). Si es estacionario, entonces $d=0$ de lo contrario, intente una primera integración $y_t = \Delta x_t = (x_{t+1}-x_t)$ y comprobar la estacionariedad (en general basta con una primera integración), por lo que $d=1$ De lo contrario, intente una primera integración en $y_t$ Así pues $d=2$ etc.

Supongamos que $d=0$ (para que tu x_t ya sea estacionario)

-Identificación del orden Autorregresivo (AR) $p$ :

Para determinar este orden, trace el Función de autocorrelación parcial (PACF) de $x_t$ entonces $p$ será el desfase máximo en el que el PACF es significativo.

-Identificación de la orden de media móvil (MA) $q$ :

Trazar el Función de autocorrelación (ACF) de $x_t$ y fijar $q$ es el desfase máximo en el que el ACF es significativo.

Así se obtiene el modelo empírico $ARIMA(p,d,q)$ .

Si utiliza R puede intentar ajustar un modelo a su serie utilizando auto.arima función de forecast y observará que el paquete $AIC$ y $BIC$ Los criterios de este modelo se acercan mucho a los del modelo de ajuste automático.

Las técnicas que he explicado anteriormente están inspiradas en el libro Análisis de series temporales financieras ( $3^{rd}$ Edición, por RUEY S. TSAY)

En mi opinión, es más interesante hacerlo así, porque entiendes las relaciones entre tus parámetros( $\theta_i, \phi_j$ del ARMA) y los valores ACF, PACF, sino también las justificaciones económicas(cuántos días laged...).

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X