Soy un investigador aplicado y de vez en cuando me encuentro con trabajos que tienen datos de panel y que utilizan modelos dinámicos con un término de efectos fijos y DV retardado (o múltiples términos autorregresivos):
$y_{it} = \beta_0 + B_1X_{it}+\alpha y_{i(t-1)}+\delta D_{it} + \lambda_i + \gamma_t + \epsilon_{it}$
donde $i$ denota la unidad del panel y $t$ denota la dimensión temporal. El parámetro de interés es $\delta$ y $D_{it}$ denota un tratamiento binario. Cuando el número de periodos de tiempo es pequeño, este modelo no puede estimarse mediante MCO debido al sesgo de Nickell.
Un enfoque que he visto utilizar a la gente es emplear rezagos más altos como instrumentos. El supuesto de identificación suele ser la ausencia de correlación serial entre los términos de error de orden superior.
¿Es correcto tomar este supuesto de ausencia de correlación serial como la restricción de exclusión, es decir, que el IV afecta al resultado final sólo a través de la variable instrumentada? En caso afirmativo, ¿cómo cuadra esto con el punto general de que la causalidad/exclusión no puede establecerse generalmente con pruebas estadísticas como la prueba de Arellano Bond, que comprueba estadísticamente la hipótesis nula de "no autocorrelación", y procede si no se rechaza la nula para órdenes superiores?
En Mostly Harmless Econometrics (libro), Angrist & Pischke escriben (p. 245):
El problema aquí es que el residuo diferenciado, $\Delta \epsilon_{it}$ está necesariamente correlacionada con la variable dependiente retardada, $\Delta Y_{i(t-1)}$ porque ambos están en función de $\epsilon_{i(t-1)}$ . En consecuencia, las estimaciones OLS de (5.3.6) no son consistentes para los parámetros de (5.3.5), un problema que fue señalado por primera vez por Nickell (1981). Este problema puede resolverse, aunque la solución requiere fuertes suposiciones. La solución más sencilla es utilizar $Y_{i(t-2)}$ como instrumento para $\Delta Y_{i(t-1)}$ en (5.3.6).10 Pero esto requiere que $Y_{i(t-2)}$ no estén correlacionados con los residuos diferenciados, $\Delta \epsilon_{it}$ . Esto parece poco probable, ya que los residuos son la parte de los ingresos que queda después de tener en cuenta las covariables. Los ingresos de la mayoría de las personas están muy correlacionados de un año a otro, por lo que es probable que los ingresos pasados también estén correlacionados con $\Delta \epsilon_{it}$ . Si $\epsilon_{it}$ está correlacionada serialmente, puede que no haya un estimador consistente para (5.3.6).
Angrist & Pischke no hacen ninguna referencia a la prueba del vínculo de Arellano para establecer la validez/exclusión del IV. En su lugar, presentan argumentos cualitativos como los que generalmente veo con los modelos IV utilizados para otros tipos de procesos de generación de datos.
¿La prueba de Arellano Bond (AB) establece realmente la exclusión/validez? O bien es un mero diagnóstico que puede utilizarse como argumento secundario junto con argumentos principalmente cualitativos para la exclusión. Si la prueba AB es meramente diagnóstica, ¿cómo se deben evaluar los estudios de investigación que afirman la identificación sobre la base de la prueba AB? (es decir, la prueba AB no rechaza la nulidad de "no autocorrelación", pero cualitativamente se pueden tener razones para creer que debería haber una correlación, pero la muestra actual no la muestra).
NOTA: Versión ligeramente editada publicada en https://stats.stackexchange.com/questions/490747/skepticism-about-the-claims-of-instrument-variable-validity-exclusion-through-a