No tengo consejos específicos para la configuración del modelo de corrección de errores (ECM), pero en la clase de econometría aplicada de pregrado nos dieron el consejo genérico de seguir extendiendo los rezagos en el modelo hasta que los residuos del modelo ajustado no estuvieran correlacionados en serie. Por ejemplo, en los datos de expectativa de vida de EE. UU., los residuos de la expectativa de vida masculina no están correlacionados en serie en el modelo AR(5) pero sí en el modelo AR(4). Puedes verlo por ti mismo con el siguiente código de Stata:
use http://www.stata-press.com/data/r8/uslifeexp.dta
tsset year, yearly
reg le_male L(1/4).le_male
estat durbinalt, small
reg le_male L(1/5).le_male
estat durbinalt, small
La documentación de Stata para los modelos de corrección de errores vectoriales también parece seguir aproximadamente este enfoque, pero parece estar automatizada bajo la función varsoc y adicionalmente el AIC, HQIC y SBIC se generan programáticamente.
Para probar la cointegración o ajustar VECMs cointegrantes, debemos especificar cuántos rezagos incluir. Basándose en el trabajo de Tsay (1984) y Paulsen (1984), Nielsen (2001) ha demostrado que los métodos implementados en varsoc pueden utilizarse para determinar el orden del rezago para un modelo VAR con variables I(1). Como se puede ver en (9), el orden del VECM correspondiente es siempre uno menos que el VAR. vec hace este ajuste automáticamente, por lo que siempre nos referiremos al orden del VAR subyacente. La salida a continuación usa varsoc para determinar el orden del rezago VAR de los precios promedio de la vivienda en Dallas y Houston....
Usaremos dos rezagos para este modelo bivariado porque el método del criterio de información de Hannan-Quinn (HQIC), el método del criterio de información bayesiano de Schwarz (SBIC) y la prueba secuencial de razón de verosimilitud (LR) eligieron dos rezagos, como se indica por el "*" en la salida.
. clear all
. use http://www.stata-press.com/data/r13/txhprice
. varsoc dallas houston
Criterios de selección de orden
Muestra: 1990m5 - 2003m12 Número de obs = 164
+---------------------------------------------------------------------------+
|lag | LL LR df p FPE AIC HQIC SBIC |
|----+----------------------------------------------------------------------|
| 0 | 299.525 .000091 -3.62835 -3.61301 -3.59055 |
| 1 | 577.483 555.92 4 0.000 3.2e-06 -6.9693 -6.92326 -6.85589 |
| 2 | 590.978 26.991* 4 0.000 2.9e-06* -7.0851* -7.00837* -6.89608* |
| 3 | 593.437 4.918 4 0.296 2.9e-06 -7.06631 -6.95888 -6.80168 |
| 4 | 596.364 5.8532 4 0.210 3.0e-06 -7.05322 -6.9151 -6.71299 |
+---------------------------------------------------------------------------+
Endógeno: dallas houston
Exógeno: _cons
Si, como sugiere @GraemeWalsh, te gustaría utilizar una metodología de rezagos distribuidos auto-regresivos (ARDL) puedes hacerlo sin tener que programarlo tú mismo.
use http://www.stata-press.com/data/r13/txhprice
sort t
net install ardl.pkg
ardl dallas houston, maxlag(4)
Regresión ARDL
Modelo: nivel
Muestra: 1990m5 - 2003m12
Número de obs = 164
Log-verosimilitud = 313.86816
R-cuadrado = .96315461
R-cuadrado ajustado = .96246376
Raíz MSE = .03613756
------------------------------------------------------------------------------
dallas | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
dallas |
L1. | .427744 .0789194 5.42 0.000 .271886 .583602
L2. | .1747019 .0720507 2.42 0.016 .0324089 .3169948
|
houston | .3404766 .0567884 6.00 0.000 .2283252 .452628
_cons | .7276476 .2061803 3.53 0.001 .3204618 1.134833
------------------------------------------------------------------------------