3 votos

¿El sesgo de la variable omitida "contamina" los coeficientes de los regresores no correlacionados con la variable omitida?

Supongamos que tenemos un modelo que es:

$$ y = X_1\beta_1 + X_2\beta_2 + X_3\beta_3 + \varepsilon $$

donde $X_1$ es independiente de $X_2$ y $X_3$ pero $X_2$ y $X_3$ están correlacionados entre sí.

Supongamos que no tenemos datos sobre $X_3$ así que lo omitimos y ejecutamos la regresión:

$$ y = X_1\gamma_1 + X_2\gamma_2 + \nu $$

La teoría econométrica sobre el OVB establece que $\gamma_2$ será parcial.

Mis preguntas:

  1. Will $\gamma_1$ ¿también está sesgada en este caso? He realizado una simulación con unos datos que he creado y sí que obtengo un resultado sesgado.

  2. Si es imparcial, ¿cómo lo pruebo? Utilizo el teorema FWL para encontrar $\gamma_1$ y demostrar que su expectativa es igual a $\beta_1$ pero se queda atascado aquí:

$$ \hat{\gamma_1} = \beta_1 + (X_1'M_{X_2}X_1)^{-1}(X_1'M_{X_2}X_3\beta_3) + (X_1'M_{X_2}X_1)^{-1}(X_1'M_{X_2}\varepsilon) $$

El tercer término se convertirá en 0 cuando tomemos la expectativa, pero no estoy seguro de cómo hacer que el segundo término sea 0.

1voto

Mark Allison Puntos 619

Sospecho que si $X_1$ es independiente de $X_3$ , entonces debe implicar $E[X_1*X_3]$ es igual a $E[X1] * E[X_3]$ Dado esto se puede concluir que la Covarianza es 0. $Cov(X_1,X_3) = E[X_1*X_3] - E[X_1]* E[X_3]$ . Si la covarianza es 0 entre estas dos variables entonces también lo es la correlación. Por lo tanto, creo que la eliminación de $X_3$ de la regresión y que su efecto entre en el término de error no resultaría en tener $_1$ estar sesgado como el $X_3$ en el término residual no tiene correlación con $_1$ .

¿Busca una prueba matemática rigurosa?

0voto

Bernard Puntos 10700

Su enfoque conduce a un estimador sesgado. Sin embargo, existe una forma de obtener un estimador insesgado para $\beta_1$ . Asumimos todas las condiciones de regularidad y exogeneidad de los regresores con respecto al error $\varepsilon$ .

1) Centra las variables en sus medias muestrales, $ y_c = y- \bar y, X_{c1} = X_1 - \bar X_1$ etc.

2) Especifique la regresión

$$y_c = X_{c1}\delta + u$$

Entonces

$$\hat \delta_{OLS} = \left(X'_{c1} X_{c1}\right)^{-1}X'_{c1}y_c $$

$$=\left(X'_{c1} X_{c1}\right)^{-1}X'_{c1}X_{c1}\beta_1 + \left(X'_{c1} X_{c1}\right)^{-1}X'_{c1}X_{c2}\beta_2 \\+ \left(X'_{c1} X_{c1}\right)^{-1}X'_{c1} X_{c3}\beta_3 + \left(X'_{c1} X_{c1}\right)^{-1}X'_{c1}\varepsilon_c$$

Simplificación y toma de expectativas condicionada por $X_{c1}$ obtenemos

$$\mathbb E(\hat \delta_{OLS} \mid X_{c1})= \beta_1 + \left(X'_{c1} X_{c1}\right)^{-1}X'_{c1}\mathbb E(X_{c2} \mid X_{c1})\beta_2 \\+\left(X'_{c1} X_{c1}\right)^{-1}X'_{c1} \mathbb E(X_{c3}\mid X_{c1})\beta_3 + \left(X'_{c1} X_{c1}\right)^{-1}X'_{c1}\mathbb E(\varepsilon_c\mid X_{c1})$$

Por los supuestos de independencia y exogeneidad de los regresores, así como por el centrado tenemos

$$\mathbb E(X_{c2} \mid X_{c1}) = \mathbb E(X_{c2} ) = 0$$ $$\mathbb E(X_{c3} \mid X_{c1}) = \mathbb E(X_{c3} ) = 0$$ $$\mathbb E(\varepsilon_c \mid X_{c1}) = 0$$

Así que nos quedamos con

$$\mathbb E(\hat \delta_{OLS} \mid X_{c1})= \beta_1 \implies \mathbb E(\hat \delta_{OLS}) = \beta_1$$

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X