Lo que usted describe es el llamado " regresión prohibida ", que (en general) no da estimaciones consistentes. Este es un resumen de la notas de Ben Williams
Consideremos una regresión (no lineal) de primera etapa de $X$ en los instrumentos $Z$ dando valores ajustados (por ejemplo, utilizando una especificación log-log): $$ \hat X = \hat \mu(Z) $$ Consideremos la ecuación estructural (causal): $$ Y = X'\beta + u $$ Lo que usted propone es utilizar $\hat X : \hat \mu(Z)$ en lugar de $X$ en la segunda etapa. Esto da: $$ \begin{align*} \hat \beta &= (\hat X' \hat X)^{-1} \hat X Y,\\ &= (\hat X' \hat X)^{-1} \hat X (X' \beta + u),\\ &= (\hat X' \hat X)^{-1} \hat X (\hat X' \beta) + (\hat X' \hat X)' \hat X'(X - \hat X)'\beta + (\hat X' \hat X)^{-1}\hat X u,\\ &= \beta + \underbrace{(\hat X' \hat X)' \hat X'(X - \hat X)'\beta}_A + \underbrace{(\hat X' \hat X)^{-1}\hat X u}_B, \end{align*} $$ Si $Z$ es un instrumento válido, se puede esperar que el $B$ se desvanece como $\hat X = \hat \mu(Z)$ y por suposición $\mathbb{E}(u|Z) = 0$ .
Ahora el $A$ términos es el verdadero problema. Fíjate que siempre podemos escribir: $$ X = \mathbb{E}(X|Z) + \eta,\\ \text{ with } \mathbb{E}(\eta|Z) = 0 $$ (aquí $\eta$ es simplemente $X - \mathbb{E}(X|Z)$ ).
A continuación, tomando la parte central del $A$ término da: $$ \hat X'(X - \hat X) = \hat X'(\mathbb{E}(X|Z) - \hat X) + \hat X'\eta,\\ $$ El último término debería desaparecer como $\mathbb{E}(\eta|Z) = 0$ . Sin embargo, el primer término sólo desaparece (en general) si $\hat X = \hat \mu(Z)$ es consistente para $\mathbb{E}(X|Z)$ que será el caso si $\mu(Z)$ es una especificación correcta de $\mathbb{E}(X|Z)$ .
Sin embargo, el 2SLS habitual es consistente como en este caso: $$ \hat X = Z(Z'Z)^{-1}Z'X. $$ Entonces: $$ \begin{align*} \hat X'(X - \hat X) &= X'Z(Z'Z)^{-1}Z'(X - Z(Z'Z)^{-1}Z'X),\\ &= X'Z(Z'Z)^{-1}Z'X - X'Z(Z'Z)^{-1}Z'Z(Z'Z)^{-1}Z'X,\\ &= X'Z(Z'Z)^{-1}Z'X - X'Z(Z'Z)^{-1}Z'X = 0 \end{align*} $$ Así que, o bien se hace un 2SLS normal, que será consistente si $Z$ no está relacionado con $u$ o puede utilizar lo que se llama mínimos cuadrados indirectos.
-
Regreso $X$ en $Z$ utilizando una regresión no lineal (por ejemplo, una regresión loglineal).
-
Utilizar los valores ajustados $\hat X = \hat \mu(Z)$ como instrumentos propios en un 2SLS de $Y$ en $X$ . Así que ejecute 2SLS con instrumentos $\hat X = \hat \mu(Z)$ en lugar de $Z$ . Como $\mu(Z)$ es una función de $Z$ también tenemos que $\mathbb{E}(u|\mu(Z)) = 0$ por lo que deberían ser instrumentos válidos.