Una forma habitual de seleccionar los parámetros de las órdenes (por ejemplo, para elegir el número de términos AR que se incluirán en el modelo) en la modelización de series temporales es basarse en algún criterio de información (AIC, BIC, Hannan Quinn ) para medir la calidad relativa del modelo: llamémoslo regla A.
A continuación, en un segundo momento, se realizan pruebas de robustez ( prueba de la caja de Ljung , prueba de Engle ..).
Sin embargo, la metodología no me queda clara cuando tengo que elegir un modelo para una serie que tiene autocorrelaciones tanto en la media como en la varianza:
He observado que el modelo seleccionado (mediante la regla A) no es siempre el mismo si :
- Utilizo un "método de dos pasos": En primer lugar, selecciono los parámetros de las órdenes del proceso medio utilizando la regla A. En segundo lugar, manteniendo los parámetros obtenidos en el primer paso, utilizo de nuevo la regla A para seleccionar los parámetros del proceso de varianza.
Ejemplo : Ajusto todos los ARMA(p,q) a la serie con (p,q)=0:2 y selecciono el más parsimonioso. Digamos que el mejor modelo es p= 1 y q= 2 . Segundo paso : si se ajustan todos los ARMA( 1,2 )-GARCH(s,t) a la serie con (s,t)=0:2 y selecciono los "mejores" parámetros s,t utilizando de nuevo la regla A. Si dejamos que p:q estén en el intervalo 0:4 y s,t en el intervalo 0:2 son $5^2 + 3^2$ modelos que deben estimarse .
- O un modelado de "vía directa": Ajusto directamente el ARMA(p,q)-GARCH (s,t) completo a la serie temporal y selecciono el mejor modelo (p,q,s,t) utilizando de nuevo la regla A. Sin embargo, en este caso el número de combinaciones (número de modelos que hay que ajustar) puede ser muy elevado: si dejamos que p:q esté en el intervalo 0:4 y s,t en el intervalo 0:2 son $5^2 \times 3^2$ modelos candidat (lleva tiempo y CPU..) .
Obviamente, el segundo método evaluará el modelo seleccionado por el método de los dos pasos y mayo ofrece los resultados más significativos. He dicho "puede" porque es posible que el modelo seleccionado por el método directo no supere la parte de error de especificación
Mi pregunta es: ¿Cómo puedo resolver este problema de coste/eficacia? ¿Cómo debo proceder?