1 votos

Regresión múltiple y "mantener las variables fijas"

Supongamos que hacemos una regresión de una variable $Y$ en dos variables independientes $X_1$ y $X_2$ . Como hemos incluido $X_2$ en la regresión, los resultados obtenidos $\hat{\beta_1}$ Se suele decir que el coeficiente es el efecto de $X_1$ en $Y$ 'holding' $X_2$ fijo" o "controlando por $X_2$ '. Se dice entonces que esto elimina cualquier sesgo de variable omitida que se deba a $X_2$ .

Para investigar esto más de cerca, observe que podemos mantener $X_2$ fijada en una variedad de valores diferentes. Restringir la atención a los valores que reaparecen al menos una vez en el conjunto de datos (por ejemplo, porque hay dos puntos de datos para los que $X_{2i} = 5$ ). En estos casos, podemos realizar una simple regresión de $Y$ en $X_1$ utilizando únicamente los puntos de datos para los que (digamos) $X_{2i} = 5$ . Podemos entonces repetir esta regresión para todos los posibles $X_2$ valores (se supone que reaparecen al menos una vez). Es natural conjeturar que nuestro $\beta_2$ debe ser similar (¿idéntica?) a la media de los $\beta_2$ coeficientes obtenidos de nuestras regresiones simples. ¿Es este el caso?

4voto

user36287 Puntos 6

El lenguaje "manteniendo fijos otros regresores" es heurístico (pero no problemático). Considere $$y_i =\beta_0 +\beta_1 x_{1i} +\beta_2 x_{2i}+ u_i$$

La estimación OLS de $\beta_1$ es la misma que la de la regresión,

$$y_i =\beta_0 +\beta_1 \widetilde{x_{1i}}+ u_i$$

donde $\widetilde{x_{1i}}$ son residuos de $x_{1i} =\delta_0 +\delta_1 x_{2i}+\widetilde{x_{1i}}$ . Esta es una aplicación del teorema de Frisch-Waugh-Lovell.

Dado que los residuos OLS no están correlacionados con los regresores, sabemos que $Cov(\widetilde{x_{1i}}, x_{2i})=0$ . Por lo tanto, lo que realmente hace OLS es crear una versión de un regresor que no está correlacionado con los controles ( $\widetilde{x_{1i}}$ arriba), y utilizando la variación en esa versión. Cuando esa versión de la variable cambia, los otros controles no cambian en promedio (debido a la falta de correlación) y se "mantienen fijos".

Existen algunas derivaciones formales que se ajustan más al estilo de lo que preguntas. En el capítulo 3 de Mostly Harmless Econometrics, Angrist y Pischke consideran el escenario en el que $x_{1i}$ es binario. Definir $\delta_v$ como el efecto medio de $x_1$ en $y$ cuando $x_{2i}=v$

$$\hat{\beta_1} = \frac{\sum_{v}\delta_v[P(x_{1i}=1|x_{2i}=v)(1-P(x_{1i}=1|x_{2i}=v))]P(x_{2i}=v)}{\sum_{v}[P(x_{1i}=1|x_{2i}=v)(1-P(x_{1i}=1|x_{2i}=v))]P(x_{2i}=v)}$$

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X